Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die Sicherheit und Kontrolle über eigene Daten gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Knowledge Graph (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agenziellen Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochgradig innovatives System, das lokale Betriebbarkeit und die Verarbeitung vielfältiger Dokumentformate unterstützt. Es ist besonders geeignet für fortgeschrittene Anwendungen, die eine hohe Genauigkeit und Performanz erfordern.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein flexibles RAG-System, das Python, LlamaIndex und LangChain verwendet. Es unterstützt 8 PG-Graphen, 3 RDF-Graphen, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco-DBs. Es bietet automatische Synchronisierung von 13 Datenquellen, automatische Erstellung von Knowledge Graphs, Ontologien, LLMs und verschiedene Dokumentverarbeitungsmethoden.
Warum relevant: Dieses Projekt ist besonders relevant für Unternehmen, die eine flexible und skalierbare Lösung für die Verarbeitung und Analyse von Dokumenten benötigen. Es unterstützt lokale Betriebbarkeit und bietet eine breite Palette von Funktionen.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV-Dateien in AI-fähige Chunks für RAG-Pipelines konvertiert. Es bietet eine HITL-Review-Funktion, 3-Layer-Memory-Chat und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die den Schutz der Privatsphäre im Vordergrund stellt. Es ist lokal betriebsfähig und eignet sich gut für Unternehmen, die ihre Daten lokal verwalten möchten.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert, um die beste Chunking-Strategie für RAG-Pipelines zu wählen. Es unterstützt verschiedene Chunking-Algorithmen und bietet eine benutzerfreundliche Schnittstelle.
Warum relevant: chunky ist besonders nützlich für Entwickler und Datenwissenschaftler, die eine präzise und effiziente Chunking-Strategie für ihre RAG-Pipelines benötigen. Es ist lokal betriebsfähig und bietet eine hohe Flexibilität.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der ein dekoupliertes Frontend und Backend bietet. Es unterstützt erweiterbare RAG-Funktionen, Knowledge Bases, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbankanbietern.
Warum relevant: LightningRAG ist eine moderne, vollständige Lösung für die Entwicklung von RAG-Anwendungen. Es ist lokal betriebsfähig und bietet eine breite Palette von Funktionen, die für Entwickler attraktiv sind.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Dokumentverarbeitung und unterstützt das Parsen verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentverarbeitung und -analyse vereinfacht. Es ist lokal betriebsfähig und eignet sich gut für Java-Entwickler, die eine robuste Lösung für die Dokumentverarbeitung benötigen.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser