Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die aktuellsten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub zu finden sind. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei auf moderne Technologien wie Vector Search, Knowledge Graphs und LLMs setzen.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Knowledge Graph (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agenzielle Streaming-Chats und inline Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochinnovatives Projekt, das eine breite Palette von Funktionen in einer lokal betreibbaren Lösung vereint. Es ist besonders geeignet für Unternehmen, die umfangreiche Dokumentenverarbeitung und fortgeschrittene RAG-Funktionen benötigen.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein umfassendes RAG-System, das Python, LlamaIndex und LangChain verwendet. Es unterstützt 8 PG-Graphen, 3 RDF-Graphen, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco. Es bietet 13 Datenquellen (9 automatische Synchronisierung), automatische Erstellung von Knowledge Graphs, Ontologien, LLMs, Docling oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG-only und Hybrid-Suche sowie AI-Chats. Es verfügt über TypeScript React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Dieses Projekt ist eine umfassende Lösung für RAG, die eine Vielzahl von Datenquellen und Technologien unterstützt. Es ist besonders geeignet für Unternehmen, die eine flexible und skalierbare RAG-Infrastruktur benötigen.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines aufteilt. Es bietet eine Human-in-the-Loop-Überprüfung, 3-Layer-Memory-Chats und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die den Schutz der Privatsphäre im Vordergrund stellt. Es ist besonders geeignet für Unternehmen, die sensible Daten verarbeiten und eine hohe Kontrolle über den Prozess benötigen.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert, um die beste Chunking-Strategie für RAG-Pipelines zu wählen. Es unterstützt verschiedene Chunking-Algorithmen und bietet eine flexible Integration in RAG-Pipelines.
Warum relevant: chunky ist ein nützliches Werkzeug für die Vorbereitung von Dokumenten für RAG-Pipelines. Es ist besonders geeignet für Entwickler, die eine präzise und kontrollierte Chunking-Strategie benötigen.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter, der eine dekuplierte Frontend- und Backend-Architektur bietet. Es verfügt über integrierte, erweiterbare RAG-Funktionen, wie Knowledge Bases, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbankanbietern.
Warum relevant: LightningRAG ist eine moderne und erweiterbare RAG-Lösung, die sich gut für die Entwicklung von benutzerdefinierten Anwendungen eignet. Es ist besonders geeignet für Entwickler, die eine robuste und flexible RAG-Infrastruktur benötigen.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Dokumentenverarbeitung und das Parsen verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentenverarbeitung in gen-AI-Anwendungen erleichtert. Es ist besonders geeignet für Entwickler, die mit Quarkus arbeiten und eine robuste Dokumentenverarbeitung benötigen.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser