Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)
In diesem Artikel stellen wir die aktuellsten Retrieval-Augmented-Generation (RAG)-Systeme und Dokumentenverarbeitungs-Pipelines vor, die auf GitHub hervorragend bewertet wurden. Diese Projekte bieten innovative Lösungen für das Handling von Dokumenten und den Einsatz künstlicher Intelligenz in lokalen Umgebungen.
NexusRAG (9/10)
Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein Hybrid-RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt die Dokumentenverarbeitung mit Docling sowie visuelle Intelligenz wie Bild- und Tabellenkennungen.
Warum relevant: Das Projekt ermöglicht es Benutzern, ihre eigenen Daten zu verwenden und lokale Ollama-Modelle oder Google Gemini zu nutzen.
RustyRAG (8/10)
Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein Produktionsfähiges RAG-API, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW dichten Vektoren und BM25 sparsamen Matching sowie Cross-Erkenner-Reranking.
Warum relevant: Das Projekt unterstützt Layout-aware Dokumentenextraktion via Docling und hat eine Genauigkeit von 94,5% auf dem Open RAG Bench.
flexible-graphrag (7/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: Flexible GraphRAG ist ein Python-basiertes Framework, das verschiedene Vektordatenbanken und Wissensgraph-Datenbanken unterstützt. Es bietet automatisierte Synchronisierung von Datenquellen sowie LLMs für Dokumentenverarbeitung.
Warum relevant: Das Projekt ermöglicht es Benutzern, ihre eigenen Daten zu verwenden und lokale Ollama-Modelle oder Google Gemini zu nutzen.
chunky (6/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert. Es bietet verschiedene Chunking-Strategien für RAG-Pipelines.
Warum relevant: Das Projekt ermöglicht es Benutzern, ihre eigenen Daten zu verwenden und lokale Ollama-Modelle oder Google Gemini zu nutzen.
Quelle: GitHub Search API