Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)
In diesem Artikel stellen wir die aktuellsten und innovativsten Projekte im Bereich Retrieval-Augmented Generation (RAG) sowie Dokumentenverarbeitung vor. Diese Projekte bieten einzigartige Lösungen für das Selfhosting von KI-Anwendungen, die eigene Daten verarbeiten können.
NexusRAG (9/10)
Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrider RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und cross-encoder-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling sowie visuelle Intelligenz für Bilder und Tabellenkennungen.
Warum relevant: Dank seiner Vielseitigkeit und der Möglichkeit, lokale Ollama Modelle zu verwenden, eignet sich NexusRAG hervorragend für Anwendungen, die eigene Daten verarbeiten und visualisieren.
RustyRAG (8/10)
Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein robustes RAG-API, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW dichten Vektoren und BM25 sparsamen Matching sowie cross-encoder-Reranking.
Warum relevant: Dank seiner hohen Genauigkeit (94,5% auf Open RAG Bench) und der Unterstützung von Cerebras, Groq, Milvus und Jina AI eignet sich RustyRAG für Anwendungen, die hohe Leistung erfordern.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert, bevor die beste Chunking-Strategie für den RAG-Pipeline gewählt wird.
Warum relevant: Es bietet eine einfache Möglichkeit, Dokumente in kleinere Teile zu unterteilen, um sie effektiver für RAG-Anwendungen zu verwenden.
quarkus-docling (5/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 0/2 | Innovation 1/2 | Reife 0/1 = 5/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung von Dokumenten in Quarkus-Projekten, indem es verschiedene Formate unterstützt und eine einfache Integration mit dem gen AI Ökosystem bietet.
Warum relevant: Es eignet sich für Projekte, die auf Quarkus basieren und eine umfassende Unterstützung für Dokumente benötigen.
Quelle: GitHub Search API