Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die aktuellsten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein flexibles RAG-System, das 15 Property Graph-DBs, 4 RDF-DBs und 10 Vector-DBs unterstützt. Es verarbeitet 13 Datenquellen (9 automatisch synchronisierend), baut automatisch Wissensgraphen, verwendet Ontologien, LLMs und Dokumentverarbeitung mit Docling oder LlamaParse. Es bietet auch GraphRAG, RAG-only und Hybrid Search-Funktionen. Die Anwendung verfügt über TypeScript React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und den MCP-Server.
Warum relevant: Dieses Projekt ist hochgradig innovativ und bietet eine breite Palette von Funktionen, die es zu einer umfassenden Lösung für RAG-Systeme machen. Es ist lokal betreibbar und unterstützt eine Vielzahl von Datenquellen und Datenbanken, was es zu einer vielseitigen und leistungsfähigen Wahl macht.

RustyRAG (8/10)

Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Ein production-grade RAG-API, gebaut in Rust, die hybride Suche mit HNSW-dichten Vektoren und BM25-sparse Matching, Cross-Encoder-Reranking und layout-aware Document Extraction via Docling unterstützt. Es erreicht 94.5% Genauigkeit auf dem Open RAG Bench und wird von Cerebras, Groq, Milvus und Jina AI unterstützt.
Warum relevant: RustyRAG ist eine leistungsfähige und effiziente RAG-Lösung, die in Rust entwickelt wurde. Es ist lokal betreibbar und bietet hohe Genauigkeit, was es zu einer hervorragenden Wahl für produktionstaugliche Anwendungen macht.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Ein Open-Source-Toolkit für RAG-Chunking, das Markdown-Dokumente konvertiert, Dokumente validiert, Chunking-Strategien visualisiert und optimiert und die Ergebnisse für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein nützliches Werkzeug für die Verarbeitung und Optimierung von Dokumenten für RAG-Systeme. Es ist lokal betreibbar und unterstützt verschiedene Dokumentformate, was es zu einer wertvollen Ergänzung für bestehende RAG-Pipelines macht.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Docling vereinfacht die Dokumentverarbeitung, indem es verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung, unterstützt und nahtlose Integrationen mit dem gen AI-Ökosystem bietet.
Warum relevant: Quarkus-Docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentverarbeitung in Java-Anwendungen erleichtert. Es ist lokal betreibbar und unterstützt eine Vielzahl von Dokumentformaten, was es zu einer praktischen Wahl für Java-Entwickler macht.

Quelle: GitHub Search API

👁 2 Aufrufe 👤 2 Leser