Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.
flexible-graphrag (9/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das 15 Property Graphs, 4 RDF-Graphs und 10 Vektordatenbanken unterstützt. Es verarbeitet 13 Datensourcen (9 automatisch synchronisiert), baut automatisch Wissensgraphen, verwendet Ontologien und LLMs, und bietet GraphRAG, RAG-only und Hybrid Search. Es verfügt über TypeScript React, Vue und Angular Frontends sowie einen FastAPI REST-Backend und einen MCP-Server.
Warum relevant: Dieses Projekt ist hochgradig innovativ und bietet eine breite Palette von Funktionen, die es zu einer umfassenden Lösung für RAG-Systeme machen. Es ist lokal betreibbar und unterstützt eine Vielzahl von Datenquellen und Datenbanken.
RustyRAG (8/10)
Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: Ein production-grade RAG-API, gebaut in Rust, die hybride Suche mit HNSW dichten Vektoren und BM25 spärlichen Matches, Cross-Encoder-Reranking und layoutbewusste Dokumentextraktion via Docling unterstützt. Es erreicht 94.5% Genauigkeit auf dem Open RAG Bench und wird von Cerebras, Groq, Milvus und Jina AI unterstützt.
Warum relevant: RustyRAG ist eine leistungsstarke und effiziente Lösung für RAG-Systeme, die lokal betrieben werden kann. Es kombiniert verschiedene Suchmethoden und ist für die Produktion optimiert.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: Ein Open-Source-Toolkit für RAG-Chunking, das Markdown-Dokumente konvertiert, Dokumente validiert, Chunking-Strategien visualisiert und optimiert und die Ergebnisse für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein nützliches Werkzeug für die Verarbeitung und Optimierung von Dokumenten in RAG-Systemen. Es ist lokal betreibbar und unterstützt eine Vielzahl von Dokumentformaten.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Docling vereinfacht die Dokumentverarbeitung, indem es verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung, unterstützt und nahtlose Integrationen mit dem gen AI-Ökosystem bietet.
Warum relevant: Quarkus-Docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentverarbeitung in RAG-Systemen erleichtert. Es ist lokal betreibbar und unterstützt eine Vielzahl von Dokumentformaten.
Quelle: GitHub Search API