Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten und sind in verschiedenen Programmiersprachen implementiert.

RustyRAG (9/10)

Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: RustyRAG ist eine hochgradig optimierte RAG-API, die in Rust entwickelt wurde. Sie unterstützt hybride Suche mit dichten Vektoren (HNSW) und dünnen Vektoren (BM25), Cross-Encoder-Reranking und layoutbewusste Dokumentenextraktion. Das Projekt erreicht eine Genauigkeit von 94,5% auf dem Open RAG Bench.
Warum relevant: RustyRAG ist eine leistungsstarke und innovative Lösung, die sowohl für die lokale Ausführung als auch für die Integration in bestehende Systeme geeignet ist. Es bietet eine hohe Reife und ist gut dokumentiert.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible-GraphRAG ist ein umfassendes System, das 15 Property Graphs, 4 RDF-Graphen und 10 Vektordatenbanken unterstützt. Es verarbeitet 13 Datenquellen (9 automatisch synchronisiert), baut automatisch Wissensgraphen auf, integriert Ontologien und unterstützt LLMs. Das Projekt bietet auch Frontends in TypeScript, React, Vue und Angular sowie einen FastAPI-REST-Backend.
Warum relevant: Flexible-GraphRAG ist eine vielseitige und robuste Lösung, die sowohl für die lokale Ausführung als auch für die Integration in bestehende Systeme geeignet ist. Es bietet eine breite Palette von Funktionen und ist gut dokumentiert.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Chunky ist ein Open-Source-Toolkit für RAG-Chunking, das Markdown-Dokumente konvertiert, Dokumente validiert, Chunking-Strategien visualisiert und optimiert sowie Ergebnisse für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist eine nützliche und flexible Lösung für die Verarbeitung und Optimierung von Dokumenten. Es ist lokal betreibbar und bietet eine gute Dokumentation.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Quarkus-Docling vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Quarkus-Docling ist eine praktische Lösung für die Verarbeitung von Dokumenten in Java-Anwendungen. Es ist lokal betreibbar und bietet eine gute Dokumentation.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser