Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)
In diesem Artikel stellen wir die aktuellsten und innovativsten Projekte im Bereich Retrieval-Augmented Generation (RAG) und Dokumentenverarbeitung vor. Diese Projekte bieten einzigartige Lösungen für das Verarbeiten, Indexieren und Generieren von Inhalten basierend auf eigenen Daten.
NexusRAG (9/10)
Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein Hybrid-RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt die Dokumentenverarbeitung mit Docling sowie visuelle Intelligenz für Bilder und Tabellenbeschriftungen. Das System kann agendisch streamende Chat-Funktionen bereitstellen und inline-Zitate erzeugen.
Warum relevant: Dank seiner Vielseitigkeit und der Unterstützung von Gemini oder lokalen Ollama-Modellen ist NexusRAG eine umfassende Lösung für die Verarbeitung und Nutzung eigener Daten.
RustyRAG (8/10)
Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein Produktionsfähiges RAG-API, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW-dichten Vektoren und BM25-schlanken Matches sowie Layout-bereites Dokumentenextraktion via Docling.
Warum relevant: Die hohe Genauigkeit von 94,5% auf dem Open RAG Bench macht RustyRAG zu einer robusten Option für Unternehmen, die ihre eigenen Daten nutzen möchten.
flexible-graphrag (8/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: Flexible GraphRAG bietet eine flexible Umgebung für die Verarbeitung und Nutzung von Daten in einem Wissensgraph. Es unterstützt Python, LlamaIndex, Docker Compose sowie verschiedene Databasesysteme.
Warum relevant: Durch seine Vielseitigkeit und Unterstützung von 13 Dateneingabequellen (9 automatisch synchronisiert) ist es eine leistungsstarke Lösung für die Verarbeitung eigener Daten.
pdfstract (7/10)
Repository: AKSarav/pdfstract
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: PDFStract ist ein Extraktions-, Chunking- und Embedding-Layer für RAG-Pipelines. Es bietet Unterstützung als CLI, WEBUI oder API.
Warum relevant: Dank seiner vielseitigen Anwendungsmöglichkeiten und der Unterstützung von PDFs bietet PDFStract eine leistungsfähige Lösung zur Verarbeitung eigener Daten.
Quelle: GitHub Search API