Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agenzielle Streaming-Chats und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochgradig innovatives Projekt, das eine Vielzahl von Funktionen in einer lokal betriebbaren Umgebung vereint. Es ist besonders geeignet für fortgeschrittene Anwendungen, die eine hohe Genauigkeit und Flexibilität erfordern.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein umfassendes RAG-System, das Python, LlamaIndex und LangChain verwendet. Es unterstützt 13 Datenquellen, automatische Synchronisierung, Wissensgraphen, Ontologien und verschiedene Suchmethoden. Es bietet auch eine REST-API und mehrere Frontend-Optionen.
Warum relevant: Dieses Projekt ist besonders relevant für Unternehmen, die eine flexible und erweiterbare Lösung für die Verarbeitung und Analyse von Dokumenten suchen. Die Unterstützung vieler Datenquellen und Suchmethoden macht es zu einer vielseitigen Wahl.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV-Dateien in AI-fähige Chunks aufteilt. Es bietet eine HITL-Überprüfung, 3-Layer-Memory-Chats und einen produktionsfähigen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die den Schutz der Privatsphäre im Vordergrund stellt. Es ist besonders geeignet für Unternehmen, die sensible Daten verarbeiten müssen.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown-Dokumenten. Es bietet verschiedene Chunking-Strategien für RAG-Pipelines, einschließlich semantischer Chunking.
Warum relevant: chunky ist besonders nützlich für Entwickler, die ihre Markdown-Dokumente für RAG-Pipelines optimieren möchten. Die Validierungsfunktionen und die Auswahl von Chunking-Strategien machen es zu einem wertvollen Werkzeug.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der eine dekuplierte Frontend- und Backend-Architektur bietet. Es unterstützt RAG-Funktionen wie Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbank-Anbietern.
Warum relevant: LightningRAG ist eine gute Wahl für Entwickler, die eine moderne, erweiterbare Architektur für RAG-Anwendungen suchen. Die Unterstützung verschiedener Anbieter macht es zu einer flexiblen Lösung.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist besonders nützlich für Java-Entwickler, die eine robuste und flexible Lösung für die Dokumentenverarbeitung suchen. Die Integration in das Quarkus-Framework macht es zu einer praktischen Wahl.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser