Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Funktionalität von Retrieval-Augmented-Generation (RAG) nutzen.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das 13 verschiedene Datenquellen unterstützt, darunter 15 Property Graph-DBs, 4 RDF-DBs und 10 Vektordatenbanken. Es bietet automatische Synchronisierung, Wissensgraphen, Ontologien, LLM-Integration und verschiedene Frontends (TypeScript React, Vue, Angular) sowie einen FastAPI-REST-Backend.
Warum relevant: Dieses Projekt ist besonders relevant für Unternehmen, die eine flexible und leistungsfähige RAG-Infrastruktur benötigen, die lokal betrieben werden kann. Die Unterstützung vieler Datenquellen und die Integration von LLMs machen es zu einer vielseitigen Lösung.

RustyRAG (8/10)

Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 8/10
Was es macht: Ein hochgradig optimiertes RAG-API-System, das in Rust entwickelt wurde. Es unterstützt hybride Suche mit HNSW-Vektoren und BM25-sparse-Matching, Cross-Encoder-Reranking und layout-aware Document Extraction via Docling. Es erreicht 94.5% Genauigkeit auf dem Open RAG Bench.
Warum relevant: RustyRAG ist eine leistungsstarke und effiziente Lösung für RAG-Anwendungen, die auf hohe Genauigkeit und Performance abzielen. Die Verwendung von Rust sorgt für eine hohe Skalierbarkeit und Sicherheit, was es zu einer attraktiven Wahl für produktionsreife Systeme macht.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Ein Open-Source-Toolkit für RAG-Chunking, das die Verarbeitung von Markdown-Dokumenten unterstützt, Dokumente validiert, Chunking-Strategien visualisiert und optimiert und die Ergebnisse für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist besonders nützlich für Entwickler, die eine detaillierte Kontrolle über das Chunking von Dokumenten benötigen. Die Unterstützung von Markdown und die Visualisierungsfunktionen machen es zu einer wertvollen Ergänzung für RAG-Pipelines.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Ein Quarkus-Extension, das die Verarbeitung und Parsen von Dokumenten vereinfacht, insbesondere für PDFs. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Quarkus-Docling ist eine praktische Lösung für Java-Entwickler, die eine robuste Dokumentenverarbeitung in ihre Anwendungen integrieren möchten. Die Unterstützung von PDFs und die Integration in das gen-AI-Ökosystem machen es zu einer wertvollen Ergänzung für bestehende Java-Projekte.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser