Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und eine hohe Reife aufweisen.
flexible-graphrag (9/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das verschiedene Graph- und Vektordatenbanken unterstützt, automatische Synchronisierung von Datenquellen, automatisches Erstellen von Wissensgraphen, Ontologien und mehr. Es nutzt LLMs und verschiedene Dokumentverarbeitungstechniken.
Warum relevant: Das Projekt ist hochgradig flexibel und erweiterbar, unterstützt lokale Betriebsumgebungen und bietet eine breite Palette von Funktionen, die es zu einer vielseitigen Lösung machen.
RustyRAG (8/10)
Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Ein hochperformantes RAG-API-System in Rust, das hybride Suchmethoden (HNSW-Vektoren und BM25-sparse-Matching) und Cross-Encoder-Reranking unterstützt. Es verarbeitet Dokumente mit Docling und erreicht hohe Genauigkeit.
Warum relevant: Die Verwendung von Rust sorgt für eine hohe Leistung, und die Unterstützung von verschiedenen Dokumentformaten macht es zu einer robusten Lösung für RAG-Anwendungen.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Ein Open-Source-Toolkit für RAG-Chunking, das Markdown-Dokumente verarbeitet, validiert und optimiert. Es bietet Visualisierungsfunktionen und verbessert die Ergebnisse für LLM-Anwendungen.
Warum relevant: Die Fokussierung auf Chunking und die Optimierung von Dokumenten macht es zu einer nützlichen Ergänzung für bestehende RAG-Systeme.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Ein Quarkus-Extension, das die Verarbeitung und Parsen verschiedener Dokumentformate vereinfacht, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Die Integration in Quarkus macht es zu einer praktischen Lösung für Java-Entwickler, die RAG-Funktionen in ihre Anwendungen integrieren möchten.
Quelle: GitHub Search API