Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die Privatsphäre der Nutzer gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentenbasierte Streaming-Chats und inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochinnovatives System, das eine breite Palette von Funktionen in einer selbstgehosteten Umgebung bietet. Es ist ideal für Nutzer, die ihre Daten lokal verwalten und eine umfassende RAG-Pipeline benötigen.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein umfassendes RAG-System, das Python, LlamaIndex und LangChain verwendet. Es unterstützt 13 Datenquellen, automatische Synchronisierung, Wissensgraphen, Ontologien und verschiedene Suchmethoden. Es bietet auch eine REST-API und mehrere Frontend-Optionen.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler, die eine flexible und erweiterbare RAG-Pipeline benötigen. Die Unterstützung vieler Datenquellen und die automatische Synchronisierung machen es zu einer leistungsstarken Lösung.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV-Dateien in AI-fähige Chunks für RAG-Pipelines konvertiert. Es bietet eine HITL-Überprüfung, dreischichtigen Chat-Speicher und einen FastAPI-Server für die Produktion.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die die Privatsphäre der Nutzer gewährleistet. Die integrierte HITL-Überprüfung und der dreischichtige Chat-Speicher sind besonders nützlich für komplexe Anwendungen.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown-Dokumenten, das verschiedene Chunking-Strategien für RAG-Pipelines unterstützt. Es bietet auch eine Evaluierung der Chunking-Methoden.
Warum relevant: chunky ist besonders nützlich für Entwickler, die eine präzise und valide Chunking-Strategie für ihre RAG-Pipelines benötigen. Die Evaluierungsfunktionen helfen dabei, die beste Methode für spezifische Anwendungen zu finden.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der eine dekuplierte Frontend- und Backend-Architektur bietet. Es integriert RAG-Funktionen wie Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektorspeicheranbietern.
Warum relevant: LightningRAG ist eine umfassende Lösung für die Entwicklung von RAG-Anwendungen mit einem modernen, dekuplierten Stack. Es ist besonders geeignet für Entwickler, die eine schnelle und flexible Implementierung von RAG-Funktionen benötigen.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung und Analyse von Dokumenten, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen in das genAI-Ökosystem.
Warum relevant: quarkus-docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentenverarbeitung in genAI-Anwendungen erleichtert. Es ist besonders relevant für Java-Entwickler, die eine robuste und flexible Lösung für die Dokumentenverarbeitung benötigen.

Quelle: GitHub Search API

👁 1 Aufrufe 👤 1 Leser