Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) ![Vorschau](https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png) In den folgenden Projekten finden Sie innovative Ansätze zur Ver

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

Vorschau

In den folgenden Projekten finden Sie innovative Ansätze zur Verarbeitung und Analyse von Dokumenten mit Retrieval-Augmented-Generation (RAG). Diese Projekte bieten verschiedene Funktionen, von der Verarbeitung verschiedener Dokumentformate bis hin zu komplexen RAG-Pipelines, die lokal betrieben werden können.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling, visuelle Intelligenz (Bild- und Tabellenbeschriftung), agente Chat-Streaming und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG bietet eine umfassende RAG-Pipeline, die lokal betrieben werden kann, was die Datensouveränität erhöht. Es ist besonders innovativ durch die Kombination verschiedener Techniken und die Unterstützung von visueller Intelligenz.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein RAG-API, das in Rust entwickelt wurde. Es kombiniert HNSW-dichte Vektoren und BM25-sparse Matching mit Cross-Encoder-Reranking und layoutbewusster Dokumentextraktion via Docling. Es erreicht 94.5% Genauigkeit auf der Open RAG Bench und wird von Cerebras, Groq, Milvus und Jina AI unterstützt.
Warum relevant: RustyRAG ist eine leistungsstarke und robuste RAG-Lösung, die lokal betrieben werden kann. Es ist besonders relevant für Unternehmen, die eine hohe Genauigkeit und Performance benötigen.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein datenschutzfreundliches Dokumentenintelligenz-Engine, das PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines konvertiert. Es enthält eine HITL-Überprüfung, eine dreischichtige Chat-Memory und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine umfassende Lösung für die Verarbeitung verschiedener Dokumentformate und bietet eine robuste RAG-Pipeline, die lokal betrieben werden kann. Es ist besonders relevant für Unternehmen, die einen starken Fokus auf Datenschutz haben.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 1/2 | Innovation 2/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown und zur Auswahl der besten Chunking-Strategie für RAG-Pipelines. Es unterstützt die Verarbeitung von Markdown, PDF und anderen Textformaten.
Warum relevant: chunky ist besonders innovativ durch seine Chunking-Validierung und die Möglichkeit, die beste Chunking-Strategie für RAG-Pipelines zu wählen. Es ist eine nützliche Ergänzung für bestehende RAG-Systeme.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 1/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Dokumentenverarbeitung und unterstützt die Verarbeitung verschiedener Formate, einschließlich erweiterter PDF-Verarbeitung. Es bietet nahtlose Integrationen in den gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist eine nützliche Bibliothek für die Dokumentenverarbeitung, die in Java-Anwendungen integriert werden kann. Es ist besonders relevant für Entwickler, die auf der Quarkus-Plattform arbeiten.


Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert