Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und eine hohe Reife aufweisen.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das 15 Property Graph-, 4 RDF- und 10 Vektordatenbanken unterstützt. Es bietet 13 Datenquellen (9 automatisch synchronisiert), automatische Erstellung von Wissensgraphen, Ontologien, LLM-Integration, Docling oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG-only und Hybrid-Suche. Es verfügt über TypeScript React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Dieses Projekt ist ein umfassendes und innovatives RAG-System, das lokal betrieben werden kann und eine Vielzahl von Datenquellen und Datenbanken unterstützt. Es ist besonders relevant für Unternehmen, die umfangreiche Wissensgraphen und hybride Suchfunktionen benötigen.

RustyRAG (8/10)

Repository: RustyRAG/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 8/10
Was es macht: Ein production-grade RAG-API, gebaut in Rust, die hybride Suche mit HNSW-dichten Vektoren und BM25-sparse Matching, Cross-Encoder-Reranking und layout-aware Dokumentextraktion via Docling unterstützt. Es erreicht 94.5% Genauigkeit auf dem Open RAG Bench und wird von Cerebras, Groq, Milvus und Jina AI unterstützt.
Warum relevant: RustyRAG ist ein leistungsstarkes und effizientes RAG-System, das lokal betrieben werden kann und eine hohe Genauigkeit aufweist. Es ist besonders relevant für Unternehmen, die eine hohe Performance und Skalierbarkeit benötigen.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: Ein Open-Source-Toolkit für RAG-Chunking, das Markdown, PDFs und andere Dokumentformate verarbeitet, Dokumente validiert, Chunking-Strategien visualisiert und optimiert sowie die Ergebnisse für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein nützliches Werkzeug für die Dokumentverarbeitung und -optimierung, das lokal betrieben werden kann. Es ist besonders relevant für Entwickler, die RAG-Pipelines optimieren und verbessern möchten.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 1/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Docling vereinfacht die Dokumentverarbeitung und unterstützt das Parsen verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung, und bietet nahtlose Integrationen mit dem gen AI-Ökosystem.
Warum relevant: Quarkus-Docling ist ein nützliches Tool für die Dokumentverarbeitung, das in Java-Anwendungen integriert werden kann. Es ist besonders relevant für Entwickler, die eine einfache und effiziente Dokumentverarbeitung in ihre Anwendungen integrieren möchten.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser