Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) ![Vorschau](https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png) In diesem Artikel stellen wir die neuesten und vielversprechends

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

Vorschau

In diesem Artikel stellen wir die neuesten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verarbeitet Dokumente mit Docling, bietet visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentenbasierten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG ist ein hochinnovatives Projekt, das eine breite Palette von Funktionen in einer lokal betriebbaren Lösung vereint. Es ist besonders geeignet für fortgeschrittene Anwendungen, die eine hohe Genauigkeit und Flexibilität erfordern.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Flexible-GraphRAG ist ein umfassendes System, das Python, LlamaIndex, LangChain und Docker Compose verwendet. Es unterstützt 8 PG-Graphen, 3 RDF-Graphen, 10 Vektordatenbanken, OpenSearch, Elasticsearch und Alfresco-Datenbanken. Es bietet 13 Datenquellen (9 automatische Synchronisierung), automatisches Wissensgraphen-Building, Ontologien, LLMs, Docling- oder LlamaParse-Dokumentverarbeitung, GraphRAG, RAG-only und Hybrid-Suche. Es verfügt über TypeScript-React-, Vue- und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Flexible-GraphRAG ist eine leistungsstarke und flexible Lösung, die eine breite Palette von Datenquellen und Verarbeitungsworkflows unterstützt. Es ist besonders geeignet für Unternehmen, die eine umfassende und skalierbare RAG-Infrastruktur benötigen.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Document Intelligence Engine, das PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines verarbeitet. Es bietet eine HITL-Überprüfung, 3-Layer-Memory-Chat und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die den Schutz der Privatsphäre im Vordergrund stellt. Es ist besonders geeignet für Unternehmen, die sensible Daten verarbeiten und eine hohe Kontrolle über den Prozess benötigen.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: Chunky ist ein Tool, das Ihre Markdown-Dokumente konvertiert und validiert und die beste Chunking-Strategie für Ihre RAG-Pipeline auswählt. Es unterstützt die Verarbeitung von Markdown, PDFs und anderen Textformaten.
Warum relevant: Chunky ist eine nützliche Ergänzung für bestehende RAG-Systeme, die eine optimierte Chunking-Strategie erfordern. Es ist besonders geeignet für Entwickler, die ihre RAG-Pipelines feinjustieren möchten.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin-Stack mit einem dekouplten Frontend und Backend. Es bietet integrierte, erweiterbare RAG-Funktionen, einschließlich Wissensbasen, Vektorsuche und Integrationen mit vielen LLM- und Vektordatenbankanbietern.
Warum relevant: LightningRAG ist eine moderne und erweiterbare Lösung, die eine schnelle Entwicklung und Bereitstellung von RAG-Anwendungen ermöglicht. Es ist besonders geeignet für Entwickler, die eine robuste und flexible RAG-Infrastruktur benötigen.


Quelle: GitHub Search API

👁 1 Aufrufe 👤 1 Leser

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert