Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir aktuelle Projekte vor, die sich mit Retrieval-Augmented Generation (RAG) und Dokumentenverarbeitungssystemen befassen. Diese Projekte bieten innovative Ansätze zur Verarbeitung verschiedener Dokumententypen und ermöglichen es Benutzern, eigene Daten lokal zu hosten und zu nutzen.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein Hybrid-RAG-System, das Vektorsuche, einen Wissensgraph (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt auch Docling-Dokumentverarbeitung, visuelle Intelligenz (Bild-/Tabellenkennungen), agente Streamchat und Inline-Zitate.
Warum relevant: Das Projekt ermöglicht es Benutzern, eigene Daten lokal zu verarbeiten und zu nutzen, ohne auf Cloud-Dienste angewiesen zu sein. Es unterstützt lokale Ollama-Modelle.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 1/1 = 8/10
Was es macht: RustyRAG ist ein Produktionsfähiges RAG-System in Rust, das hybride Suche (HNSW + BM25), Cross-Erkenner-Reranking und Docling-Dokumentextraktion unterstützt.
Warum relevant: Es bietet eine robuste Lösung für die lokale Verarbeitung von Dokumenten und kann mit verschiedenen Hardware-Architekturen wie Cerebras, Groq und Milvus arbeiten.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 1/1 = 8/10
Was es macht: Flexible GraphRAG ist ein flexibles Python-System, das verschiedene Wissensgraph-Datenbanken und Vektordatenbanken unterstützt. Es bietet automatische Synchronisierung von Datenquellen, KGAutobau, Schemas und LLMs.
Warum relevant: Das Projekt ermöglicht es Benutzern, ihre eigenen Dokumente zu verarbeiten und in einem Wissensgraph zu integrieren, was für komplexe Anwendungen ideal ist.

ClawRag (7/10)

Repository: 2dogsandanerd/ClawRag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 7/10
Was es macht: ClawRag kombiniert Docling-Dokumentverarbeitung mit ChromaDB-Vektorspeicher, um openclaw zu unterstützen.
Warum relevant: Es ermöglicht die lokale Verarbeitung von Dokumenten und den Einsatz lokaler Modelle.

pdfstract (7/10)

Repository: AKSarav/pdfstract
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 1/1 = 7/10
Was es macht: PDFStract bietet eine Schicht zur Extraktion, Chunking und Embedding in RAG-Pipelines. Es ist als CLI, WEBUI und API verfügbar.
Warum relevant: Das Projekt ermöglicht die lokale Verarbeitung von PDF-Dokumenten und kann in verschiedene Anwendungen integriert werden.

Quelle: GitHub Search API

👁 9 Aufrufe 👤 8 Leser