Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) ![Vorschau](https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png) In diesem Artikel stellen wir die neuesten Entwicklungen im Bere

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

Vorschau

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und eine hohe Reife aufweisen.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das 13 Datenquellen (9 automatisch synchronisiert), 15 Property Graph-DBs, 4 RDF-DBs, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco unterstützt. Es bietet automatische KG-Bildung, Ontologien, LLM-Integration, Docling- oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG-only und Hybrid-Suche. Es verfügt über TypeScript React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Dieses Projekt ist extrem vielseitig und innovativ, bietet eine breite Palette von Datenquellen und Datenbanken und ist lokal betreibbar, was es ideal für Selfhosting und die Verarbeitung eigener Daten macht.

chunky (8/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Ein Open-Source-Toolkit für zuverlässige RAG-Pipelines, das PDFs in Markdown konvertiert, Dokumente bereinigt, Chunks inspiziert, Chunking-Strategien vergleicht und Metadaten für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein robustes und gut dokumentiertes Tool, das die Verarbeitung und Analyse von Dokumenten vereinfacht und lokal betrieben werden kann.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Docling vereinfacht die Dokumentverarbeitung und das Parsen verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung, und bietet nahtlose Integrationen mit dem gen AI-Ökosystem.
Warum relevant: Quarkus-Docling ist ein nützliches Tool für die Verarbeitung von Dokumenten in Java-Anwendungen und bietet eine gute Integration in bestehende Systeme.


Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert