Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, wobei sie oft auf lokalen Systemen betrieben werden können.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling, visuelle Intelligenz (Bild- und Tabellenbeschriftung), agenzielle Streaming-Chats und inline Zitate. Es wird von Gemini oder lokalen Ollama-Modellen angetrieben.
Warum relevant: NexusRAG ist ein umfassendes und innovatives System, das sowohl lokale als auch cloudbasierte Modelle unterstützt. Es ist besonders geeignet für Selfhosting und die Verarbeitung eigener Daten.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible GraphRAG ist ein flexibles RAG-System, das Python, LlamaIndex und Docker Compose verwendet. Es unterstützt 8 Graph-Datenbanken, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco. Es bietet 13 Datenquellen (9 automatische Synchronisation), automatische Wissensgraphen-Erstellung, Schemas, LLMs, Docling oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG nur, Hybrid-Suche und AI-Chats. Es verfügt über React, Vue und Angular-Frontends sowie einen FastAPI-Backend und eine REST-API.
Warum relevant: Flexible GraphRAG ist ein umfassendes System, das eine Vielzahl von Datenquellen und Datenbanken unterstützt. Es ist ideal für Selfhosting und die Verarbeitung eigener Daten.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Dokumentenintelligenz-Engine, die PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines konvertiert. Es enthält eine HITL-Review-Funktion, eine 3-Layer-Memory-Chat und einen produktionsfähigen FastAPI-Server.
Warum relevant: LongParser ist ein robustes System, das die Verarbeitung verschiedener Dokumentformate unterstützt und auf lokalen Systemen betrieben werden kann. Es ist besonders geeignet für Unternehmen, die Datenschutz und Kontrolle über ihre Daten priorisieren.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin-Stack mit einem dekouplierten Frontend und Backend. Es verfügt über integrierte, erweiterbare RAG-Funktionen, einschließlich Wissensbasen, Vektorsuche und Integrationen mit vielen LLM- und Vektordatenbank-Anbietern.
Warum relevant: LightningRAG ist ein flexibles und erweiterbares System, das sowohl lokale als auch cloudbasierte Modelle unterstützt. Es ist besonders geeignet für Entwickler, die eine schnelle und effiziente RAG-Implementierung benötigen.

chunky (6/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Chunky ist ein Tool, das Markdown konvertiert und validiert, um die beste Chunking-Strategie für RAG-Pipelines zu wählen. Es unterstützt die Verarbeitung von Markdown, PDFs und anderen Textformaten.
Warum relevant: Chunky ist ein nützliches Tool für die Vorbereitung von Dokumenten für RAG-Pipelines. Es ist besonders geeignet für Entwickler, die eine präzise Chunking-Strategie benötigen.

quarkus-docling (5/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 5/10
Was es macht: Quarkus Docling vereinfacht die Dokumentenverarbeitung und das Parsen verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen mit dem gen AI-Ökosystem.
Warum relevant: Quarkus Docling ist ein nützliches Tool für die Verarbeitung von Dokumenten in Java-Anwendungen. Es ist besonders geeignet für Entwickler, die eine robuste und flexible Dokumentenverarbeitung benötigen.

Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser