Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In dieser Übersicht stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentebasierten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochinnovatives System, das eine Vielzahl von Funktionen in einer lokal betriebbaren Lösung vereint. Es ist besonders für fortgeschrittene Anwendungen und die Verarbeitung komplexer Dokumente geeignet.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein umfassendes RAG-System, das Python, LlamaIndex und LangChain verwendet. Es unterstützt 13 Datenquellen, automatische Synchronisierung, Wissensgraphen, Ontologien und verschiedene Suchmethoden. Es bietet Docker-Compose-Unterstützung und eine REST-API für die Integration in bestehende Systeme.
Warum relevant: Dieses Projekt ist besonders relevant für Organisationen, die eine flexible und skalierbare RAG-Lösung benötigen. Die Unterstützung vieler Datenquellen und die automatische Synchronisierung machen es zu einer robusten Wahl.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV-Dateien in AI-fähige Chunks für RAG-Pipelines konvertiert. Es bietet eine HITL-Überprüfung, einen 3-schichtigen Memory-Chat und einen produktionsbereiten FastAPI-Server.
Warum relevant: LongParser ist eine ausgezeichnete Wahl für Unternehmen, die die Privatsphäre ihrer Daten schützen möchten. Die umfassende Dokumentenverarbeitung und die integrierte Überprüfungsfunktion machen es zu einer zuverlässigen Lösung.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown-Dokumenten. Es unterstützt verschiedene Chunking-Strategien für RAG-Pipelines und bietet eine benutzerfreundliche Oberfläche zur Auswahl der besten Methode.
Warum relevant: chunky ist besonders nützlich für Entwickler und Datenwissenschaftler, die ihre Markdown-Dokumente für RAG-Anwendungen optimieren möchten. Die Validierungsfunktionen und die Auswahl von Chunking-Strategien sind ein wertvoller Zusatz.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der eine dekuplierte Frontend- und Backend-Architektur bietet. Es integriert RAG-Funktionen wie Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbank-Anbietern.
Warum relevant: LightningRAG ist eine gute Wahl für Entwickler, die eine moderne, vollständig integrierte RAG-Lösung suchen. Die dekuplierte Architektur und die breite Palette von Integrationsmöglichkeiten machen es zu einer flexiblen Option.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Dokumentenverarbeitung und unterstützt verschiedene Formate, einschließlich erweiterter PDF-Verarbeitung. Es bietet nahtlose Integrationen in das genAI-Ökosystem.
Warum relevant: quarkus-docling ist besonders für Java-Entwickler interessant, die eine robuste Dokumentenverarbeitung in ihre Anwendungen integrieren möchten. Die Unterstützung vieler Formate und die Integration in das genAI-Ökosystem sind wichtige Vorteile.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser