Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten und die Integration von KI-Technologien.

RustyRAG (9/10)

Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: RustyRAG ist eine production-grade RAG-API, die in Rust entwickelt wurde. Es unterstützt hybride Suche mit HNSW dichten Vektoren und BM25 spärlicher Abfrage, Cross-Encoder-Reranking und layout-aware Document Extraction via Docling. Das Projekt erreicht eine Genauigkeit von 94.5% auf dem Open RAG Bench.
Warum relevant: RustyRAG ist eine leistungsstarke und innovative Lösung, die sowohl für lokale als auch für cloudbasierte Anwendungen geeignet ist. Es bietet eine hohe Genauigkeit und ist gut dokumentiert.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible-GraphRAG ist ein umfassendes RAG-System, das Python, LlamaIndex, LangChain und Docker Compose verwendet. Es unterstützt 13 Datenquellen (9 automatisch synchronisiert), automatische Erstellung von Wissensgraphen, Ontologien, LLMs und verschiedene Dokumentverarbeitungsmethoden wie Docling oder LlamaParse. Es bietet auch GraphRAG, RAG-only und Hybrid-Suche.
Warum relevant: Dieses Projekt ist besonders relevant, da es eine breite Palette von Funktionen und Datenquellen unterstützt und lokal betrieben werden kann. Es ist gut dokumentiert und bietet eine flexible Architektur für verschiedene Anwendungsfälle.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Chunky ist ein Open-Source-Toolkit für RAG-Chunking, das die Verarbeitung von Markdown-Dokumenten, die Validierung von Dokumenten, die Visualisierung und Optimierung von Chunking-Strategien und die Bereicherung von Ergebnissen für LLM-Anwendungen unterstützt.
Warum relevant: Chunky ist ein nützliches Werkzeug für die Optimierung von RAG-Pipelines, insbesondere bei der Verarbeitung von Markdown-Dokumenten. Es ist lokal betreibbar und bietet eine gute Dokumentation.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Quarkus-Docling vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung. Es bietet nahtlose Integrationen mit dem gen AI-Ökosystem.
Warum relevant: Quarkus-Docling ist besonders für Java-Entwickler interessant, da es als Quarkus-Erweiterung verfügbar ist. Es unterstützt die Verarbeitung vieler Dokumentformate und ist lokal betreibbar.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser