Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die von lokalen Modellen oder Cloud-Service-Anbietern unterstützt werden.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verfügt über Docling-Dokumentverarbeitung, visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentenbasierten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochinnovatives System, das eine breite Palette von Funktionen in einer selbstgehosteten Umgebung bietet. Es ist besonders geeignet für fortgeschrittene Anwendungen, die eine hohe Genauigkeit und Flexibilität erfordern.

LightningRAG (8/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 3/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: LightningRAG ist ein vollständiger Stack mit Vue + Gin, der eine dekupplte Frontend- und Backend-Architektur bietet. Es verfügt über integrierte, erweiterbare RAG-Funktionen, Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektorspeicheranbietern.
Warum relevant: LightningRAG ist ein umfassendes und reifes System, das sowohl für die Entwicklung als auch für die Produktion geeignet ist. Es bietet eine robuste Grundlage für die Erstellung von RAG-basierten Anwendungen.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein RAG-API-System in Rust, das hybride Suche mit HNSW-dichten Vektoren und BM25-sparse Matching, Cross-Encoder-Reranking und layoutbewusste Dokumentextraktion via Docling unterstützt. Es erreicht 94.5% Genauigkeit auf der Open RAG Bench und wird von Cerebras, Groq, Milvus und Jina AI unterstützt.
Warum relevant: RustyRAG ist ein leistungsstarkes und innovatives System, das auf der robusten Rust-Programmiersprache basiert. Es ist besonders geeignet für Anwendungen, die hohe Leistung und Skalierbarkeit erfordern.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first-Dokumentenintelligenz-Engine, die PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines konvertiert. Es verfügt über eine HITL-Überprüfung, dreischichtigen Chat-Speicher und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist ein umfassendes System, das die Verarbeitung vielfältiger Dokumentformate unterstützt und eine hohe Datenschutzstandards bietet. Es ist besonders geeignet für Unternehmen, die ihre Daten lokal verwalten möchten.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown und zur Auswahl der besten Chunking-Strategie für RAG-Pipelines. Es unterstützt verschiedene Chunking-Algorithmen und bietet eine benutzerfreundliche Schnittstelle.
Warum relevant: chunky ist ein innovatives Tool, das die Vorbereitung von Dokumenten für RAG-Pipelines vereinfacht. Es ist besonders nützlich für Entwickler, die eine optimierte Chunking-Strategie benötigen.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling ist eine Quarkus-Erweiterung, die die Verarbeitung und Parsen von Dokumenten vereinfacht. Es unterstützt verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung, und bietet nahtlose Integrationen in den gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist eine nützliche Erweiterung für Quarkus-Projekte, die die Dokumentenverarbeitung vereinfachen. Es ist besonders geeignet für Java-Entwickler, die eine robuste und leistungsstarke Lösung benötigen.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser