Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die Datenintegrität und -sicherheit gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agenteingestützten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochgradig innovatives System, das eine breite Palette von Funktionen in einer lokal betriebbaren Umgebung vereint. Es ist besonders für Unternehmen geeignet, die ihre Daten lokal verwalten möchten und gleichzeitig die neuesten KI-Technologien nutzen wollen.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible GraphRAG ist ein umfassendes RAG-System, das Python, LlamaIndex und Docker Compose verwendet. Es unterstützt 8 Graph-Datenbanken, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco. Es bietet 13 Datenquellen (9 automatische Synchronisierung), automatische Wissensgraphen-Erstellung, Schemas, LLMs, Docling oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG nur, Hybrid-Suche und AI-Chat. Es verfügt über React-, Vue- und Angular-Frontends sowie einen FastAPI-Backend und eine REST-API.
Warum relevant: Flexible GraphRAG ist ein hochgradig modulares und erweiterbares System, das eine breite Palette von Anwendungsfällen abdeckt. Es ist besonders für Unternehmen geeignet, die eine flexible und skalierbare Lösung für ihre RAG-Anwendungen benötigen.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines verarbeitet. Es bietet eine HITL-Überprüfung, 3-Layer-Memory-Chat und einen produktionsfähigen FastAPI-Server.
Warum relevant: LongParser ist ein robustes System zur Verarbeitung und Analyse von Dokumenten, das die Datenschutzbedenken der Nutzer berücksichtigt. Es ist besonders für Unternehmen geeignet, die eine lokale und datenschutzfreundliche Lösung benötigen.

ragflow-enterprise (6/10)

Repository: wangchuanbo123/ragflow-enterprise
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: ragflow-enterprise ist ein enterprise-level RAG-System, das mit LangGraph gebaut wurde. Es bietet hybride Retrieval, Reranking, Query Rewriting und inkrementelles Indexing.
Warum relevant: ragflow-enterprise ist ein leistungsstarkes System für Unternehmen, die eine robuste und erweiterbare RAG-Lösung benötigen. Es ist besonders für komplexe Anwendungsfälle geeignet, die eine hohe Genauigkeit und Effizienz erfordern.

chunky (6/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: chunky ist ein Tool zur Konvertierung und Validierung von Markdown-Dokumenten. Es ermöglicht die Auswahl der besten Chunking-Strategie für RAG-Pipelines.
Warum relevant: chunky ist ein nützliches Werkzeug für die Vorbereitung von Dokumenten für RAG-Pipelines. Es ist besonders für Entwickler und Datenwissenschaftler geeignet, die eine präzise und effiziente Chunking-Strategie benötigen.

quarkus-docling (5/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 5/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung und Analyse von Dokumenten. Es unterstützt verschiedene Formate, einschließlich erweiterte PDF-Verarbeitung, und bietet nahtlose Integrationen in den gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist ein nützliches Tool für die Verarbeitung von Dokumenten in Quarkus-Anwendungen. Es ist besonders für Entwickler geeignet, die eine robuste und flexible Dokumentverarbeitung in ihre Anwendungen integrieren möchten.

LightningRAG (5/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 0/2 | Reife 0/1 = 5/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin Starter mit einem dekouplierten Frontend und Backend. Es bietet integrierte, erweiterbare RAG-Funktionen, Wissensbasen, Vektorsuche und Integrationen mit vielen LLM- und Vektordatenbankanbietern.
Warum relevant: LightningRAG ist ein umfassendes RAG-System, das eine schnelle und einfache Integration in bestehende Anwendungen ermöglicht. Es ist besonders für Entwickler geeignet, die eine robuste und erweiterbare RAG-Lösung benötigen.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser