Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In den letzten Monaten haben sich einige bemerkenswerte Projekte im Bereich Retrieval-Augmented Generation (RAG) etabliert. Diese Projekte bieten innovative Lösungen für die Verarbeitung verschiedener Dokumente, selbstständiges Hosting und eine starke Integration von KI-Modellen.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: Hybrid RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt Docling-Dokumentverarbeitung, visuelle Intelligenz (Bild-/Tabellenkennzeichnung), agente Streamchat und Inline-Zitate.
Warum relevant: Selbstständig betriebbar, eigene Daten verarbeiten und lokale Ollama-Modelle nutzen.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: Produktionsfähiges RAG-System in Rust, das hybride Suche (HNSW + BM25), Cross-Erkenner-Reranking und Docling-Dokumentextraktion unterstützt.
Warum relevant: Selbstständig betriebbar, Cerebras-, Groq-, Milvus- und Jina-AI-gestützt.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: Flexibles GraphRAG-System, das Python und LlamaIndex verwendet. Es unterstützt mehrere Graph-DBs, Vector-DBs, OpenSearch, Elasticsearch sowie Alfresco.
Warum relevant: Selbstständig betriebbar, Docker Compose-basiert.

ClawRag (7/10)

Repository: 2dogsandanerd/ClawRag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 7/10
Was es macht: RAG-System, das Docling-Dokumentverarbeitung und ChromaDB-Vektor-Speicher kombiniert.
Warum relevant: Selbstständig betriebbar.

pdfstract (6/10)

Repository: AKSarav/pdfstract
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 6/10
Was es macht: PDFStract extrahiert, chunkt und embeds PDF-Dokumente für RAG-Pipelines. Es ist als CLI, WEBUI und API verfügbar.
Warum relevant: Selbstständig betriebbar.

Quelle: GitHub Search API

👁 7 Aufrufe 👤 7 Leser