Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.
NexusRAG (9/10)
Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verfügt über Docling-Dokumentenverarbeitung, visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentebasierten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG bietet eine umfassende und innovative Lösung für die Dokumentenverarbeitung und -analyse, die lokal betrieben werden kann. Es ist besonders geeignet für fortgeschrittene Anwendungen, die eine hohe Genauigkeit und Flexibilität erfordern.
flexible-graphrag (8/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible-GraphRAG ist ein umfassendes System, das Python, LlamaIndex, LangChain und Docker Compose verwendet. Es unterstützt 8 PG-Graphen, 3 RDF-Graphen, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco-DBs. Es verfügt über 13 Datenquellen (9 automatisch synchronisiert), automatische KG-Erstellung, Ontologien, LLMs, Docling- oder LlamaParse-Dokumentenverarbeitung, GraphRAG, RAG-only, Hybrid-Suche und AI-Chat. Es bietet TypeScript-React-, Vue- und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Flexible-GraphRAG ist eine hochgradig flexible und leistungsstarke Lösung, die eine Vielzahl von Datenquellen und Verarbeitungsstrategien unterstützt. Es ist besonders geeignet für Unternehmen, die eine umfassende und skalierbare RAG-Infrastruktur benötigen.
LongParser (7/10)
Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Dokumentenintelligenz-Engine, die PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines konvertiert. Es verfügt über eine HITL-Überprüfung, 3-Layer-Memory-Chat und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die den Schutz der Privatsphäre im Vordergrund stellt. Es ist besonders geeignet für Unternehmen, die sensible Daten verarbeiten und eine hohe Kontrolle über den Prozess benötigen.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: Chunky ist ein Tool, das Markdown konvertiert und validiert, um die beste Chunking-Strategie für Ihre RAG-Pipeline zu wählen. Es unterstützt verschiedene Dokumentformate und bietet eine flexible Chunking-Logik.
Warum relevant: Chunky ist eine nützliche Ergänzung für bestehende RAG-Pipelines, die eine optimierte Chunking-Strategie erfordern. Es ist besonders geeignet für Entwickler, die eine hohe Genauigkeit und Effizienz in der Dokumentenverarbeitung erreichen möchten.
LightningRAG (7/10)
Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der eine dekuplierte Frontend- und Backend-Architektur bietet. Es verfügt über integrierte, erweiterbare RAG-Funktionen, Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbank-Anbietern.
Warum relevant: LightningRAG ist eine umfassende und erweiterbare Lösung, die eine schnelle und flexible Entwicklung von RAG-Anwendungen ermöglicht. Es ist besonders geeignet für Entwickler, die eine robuste und skalierbare RAG-Infrastruktur aufbauen möchten.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Quarkus-Docling vereinfacht die Dokumentenverarbeitung und unterstützt verschiedene Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Quarkus-Docling ist eine praktische Lösung für die Dokumentenverarbeitung, die in Java-Anwendungen integriert werden kann. Es ist besonders geeignet für Unternehmen, die Java-basierte Infrastrukturen verwenden und eine robuste Dokumentenverarbeitung benötigen.
Quelle: GitHub Search API