Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und eine hohe Reife aufweisen.
RustyRAG (9/10)
Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: RustyRAG ist eine hochperformante RAG-API, die in Rust entwickelt wurde. Es unterstützt hybride Suche mit HNSW-dichten Vektoren und BM25-sparse Matching, Cross-Encoder-Reranking sowie layout-aware Document Extraction via Docling. Das Projekt erreicht eine Genauigkeit von 94.5% auf dem Open RAG Bench.
Warum relevant: RustyRAG ist eine innovative und reifere Lösung, die lokal betrieben werden kann und eine Vielzahl von Datenquellen unterstützt. Es ist besonders geeignet für Unternehmen, die hohe Leistung und Skalierbarkeit benötigen.
flexible-graphrag (8/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible-GraphRAG ist ein umfassendes RAG-System, das Python, LlamaIndex, LangChain und Docker Compose verwendet. Es unterstützt 13 Datenquellen (9 automatisch synchronisiert), automatische Erstellung von Wissensgraphen, Ontologien, LLMs, Docling oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG-only und Hybrid-Suche. Es verfügt über TypeScript, React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und den MCP-Server.
Warum relevant: Dieses Projekt ist eine umfassende und flexible Lösung, die lokal betrieben werden kann und eine Vielzahl von Anwendungsfällen abdeckt. Es ist besonders nützlich für Unternehmen, die eine hohe Anpassungsfähigkeit und Erweiterbarkeit benötigen.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Chunky ist ein Open-Source-Toolkit für RAG-Chunking, das Markdown-Dokumente konvertiert, validiert, visualisiert und optimiert. Es unterstützt auch die Erweiterung von Ergebnissen für LLM-Anwendungen.
Warum relevant: Chunky ist eine nützliche Lösung für die Verarbeitung und Optimierung von Dokumenten, die lokal betrieben werden kann. Es ist besonders geeignet für Entwickler, die spezifische Anforderungen an die Chunking-Strategie haben.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Quarkus-Docling vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen mit dem gen-AI-Ökosystem.
Warum relevant: Quarkus-Docling ist eine praktische Lösung für die Verarbeitung von Dokumenten in Java-Anwendungen. Es ist besonders nützlich für Entwickler, die mit Quarkus arbeiten und eine einfache Integration von AI-Funktionen benötigen.
Quelle: GitHub Search API