Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die aktuellsten und innovativsten Projekte im Bereich Retrieval-Augmented Generation (RAG) sowie Dokumentenverarbeitung vor. Diese Projekte bieten eine Vielzahl von Funktionen, darunter das Verarbeiten verschiedener Dokumente, lokale Betriebsfähigkeit und innovative Ansätze zur Verbesserung der Leistung.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 9/10
Was es macht: Hybrid RAG-System, das Kombinationen von Vektorsuche, Wissensgraph (LightRAG) und cross-encoder-Reranking bietet. Es unterstützt Docling-Dokumentverarbeitung, visuelle Intelligenz (Bild-/Tabellenkennzeichnung), agente Streamingschat sowie Inline-Zitierungen.
Warum relevant: Lokale Betriebsfähigkeit mit Ollama-Modellen und Unterstützung für eigene Daten.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 1/1 = 8/10
Was es macht: Produktionsfähiges RAG-API in Rust, das Hybrid-Suche mit HNSW-dichten Vektoren und BM25-schlanken Matchings bietet. Es unterstützt Layout-bereitete Dokumentenextraktion via Docling.
Warum relevant: Lokale Betriebsfähigkeit und Unterstützung für eigene Daten.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 1/1 = 8/10
Was es macht: Flexibles GraphRAG-System, das Python, LlamaIndex und Docker Compose verwendet. Es unterstützt 8 Graph-Datenbanken, 10 Vektordatenbanken sowie OpenSearch, Elasticsearch, Alfresco.
Warum relevant: Lokale Betriebsfähigkeit und Unterstützung für eigene Daten.

pdfstract (7/10)

Repository: AKSarav/pdfstract
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 7/10
Was es macht: PDFStract bietet eine Extraktions-, Chunking- und Embedding-Schicht für RAG-Pipelines. Es ist als CLI, WEBUI und API verfügbar.
Warum relevant: Lokale Betriebsfähigkeit und Unterstützung für eigene Daten.

chunky (6/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 6/10
Was es macht: Chunky ermöglicht die Validierung von Markdown und das Auswahl des besten Chunking-Strategies vor dem Indexieren.
Warum relevant: Lokale Betriebsfähigkeit und Unterstützung für eigene Daten.

RAG_enterprise_core (5/10)

Repository: 2dogsandanerd/RAG_enterprise_core
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 0/2 | Innovation 0/2 | Reife 1/1 = 5/10
Was es macht: Unternehmensfähiges Retrieval-Augmented Generation-System mit Mikroservices-Architektur.
Warum relevant: Keine lokale Betriebsfähigkeit.

quarkus-docling (4/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 0/2 | Innovation 0/2 | Reife 1/1 = 4/10
Was es macht: Docling vereinfacht die Verarbeitung von Dokumenten und bietet eine einfache Integration mit dem gen AI Ökosystem.
Warum relevant: Keine lokale Betriebsfähigkeit.

Quelle: GitHub Search API

👁 2 Aufrufe 👤 2 Leser