Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) ![Vorschau](https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png) In diesem Artikel stellen wir die aktuellsten und vielverspreche

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

Vorschau

In diesem Artikel stellen wir die aktuellsten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub verfügbar sind. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: `flexible-graphrag` ist ein umfassendes System, das verschiedene Datenquellen (einschließlich Property Graphs, RDF, Vector Databases und Alfresco) integriert und mit LLMs verbindet. Es unterstützt automatisches Syncing, Wissensgraphen, Ontologien und verschiedene Suchmethoden.
Warum relevant: Dieses Projekt ist besonders relevant, da es eine breite Palette von Datenquellen und Suchmethoden unterstützt und lokal betrieben werden kann, was die Kontrolle über Ihre Daten maximiert.

self-hosted-ai-stack (8/10)

Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: `self-hosted-ai-stack` ermöglicht es, eine vollständige, lokal betriebene AI-Stack mit Docker Compose zu bereitstellen. Es umfasst Ollama, LiteLLM, Whisper, Embeddings, Docling und MCP Gateway, unterstützt NVIDIA CUDA-Acceleration und ist für mehrere Architekturen (amd64, arm64) verfügbar.
Warum relevant: Dieses Projekt ist ideal für Entwickler, die eine vollständige, lokal betriebene AI-Infrastruktur benötigen, die leicht zu bereitstellen und zu skalieren ist.

GustoBot (8/10)

Repository: skygazer42/GustoBot
Bewertung: RAG-Kern 3/3 | Dokumente 1/2 | Selfhosting 1/2 | Innovation 2/2 | Reife 1/1 = 8/10
Was es macht: `GustoBot` ist ein umfassendes Multi-Agent-System für Kundendienst, das auf Langraph basiert. Es unterstützt txt2sql, txt2cypher, lightrag und mehrere Modalitäten.
Warum relevant: Dieses Projekt ist besonders innovativ, da es eine breite Palette von Funktionen für den Kundendienst bietet und lokal betrieben werden kann, was die Privatsphäre und die Kontrolle über die Daten gewährleistet.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: `quarkus-docling` vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich PDFs. Es bietet nahtlose Integrationen mit dem gen AI-Ökosystem.
Warum relevant: Dieses Projekt ist nützlich für Entwickler, die eine robuste Dokumentenverarbeitung in ihre Anwendungen integrieren möchten, die lokal betrieben werden kann.

transmutation (6/10)

Repository: hivellm/transmutation
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: `transmutation` ist ein Rust-basiertes Modul zur Konvertierung verschiedener Dateiformate in optimierte Text- und Bildausgaben, die für LLM-Verarbeitung und Vektorembeddings geeignet sind.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler, die eine effiziente und leistungsstarke Dokumentenkonvertierung benötigen, die lokal betrieben werden kann.


Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser