Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, wobei sie oft auf Selfhosting und die Verwendung von lokalen LLMs wie Ollama setzen.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 8/10
Was es macht: `flexible-graphrag` ist ein umfassendes System, das verschiedene Datenquellen (darunter PDFs, Markdown, Office-Dateien und HTML) verarbeitet, in Graphen und Vektoren umwandelt und mit LLMs wie LlamaIndex und LangChain integriert. Es unterstützt automatische Synchronisierung, Wissensgraphen, Ontologien und hybride Suche.
Warum relevant: Das Projekt ist hochgradig innovativ und bietet eine breite Palette von Funktionen, die es zu einer vielseitigen Lösung für RAG-Anwendungen machen. Es ist self-hostbar und kann lokal betrieben werden, was die Datensouveränität erhöht.

self-hosted-ai-stack (7/10)

Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: `self-hosted-ai-stack` ermöglicht es Benutzern, eine vollständige AI-Stack mit Docker Compose zu bereitstellen. Es umfasst LLMs wie Ollama, Whisper und LiteLLM, sowie Dokumentenverarbeitung mit Docling und MCP Gateway. Das System ist lokal betreibbar, privat und unterstützt NVIDIA CUDA-Beschleunigung.
Warum relevant: Dieses Projekt ist besonders relevant für Benutzer, die eine umfassende, self-hostbare AI-Infrastruktur benötigen. Es bietet eine breite Palette von Tools und ist leicht zu bereitstellen, was es zu einer praktischen Lösung für verschiedene Anwendungsfälle macht.

transmutation (6/10)

Repository: hivellm/transmutation
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: `transmutation` ist ein Rust-basiertes Modul zur Dokumentenkonvertierung, das verschiedene Dateiformate in optimierte Text- und Bildausgaben umwandelt, die für LLM-Verarbeitung und Vektorembeddings geeignet sind. Es nutzt Docling für erweiterte Dokumentenverarbeitung.
Warum relevant: Dieses Projekt ist besonders relevant für Benutzer, die eine robuste und effiziente Dokumentenverarbeitung benötigen. Die Unterstützung vieler Dateiformate und die Integration mit Docling machen es zu einer nützlichen Komponente in RAG-Pipelines.

quarkus-docling (5/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 5/10
Was es macht: `quarkus-docling` ist eine Quarkus-Erweiterung, die die Verarbeitung und Parsen verschiedener Dokumentformate vereinfacht. Es unterstützt PDFs, Markdown und andere Formate und bietet nahtlose Integrationen in den gen-AI-Ökosystem.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler, die mit Quarkus arbeiten und eine robuste Dokumentenverarbeitung in ihre Anwendungen integrieren möchten. Die Unterstützung vieler Dateiformate und die Integration mit RAG-Systemen machen es zu einer nützlichen Erweiterung.

Quelle: GitHub Search API

👁 2 Aufrufe 👤 2 Leser