Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die Sicherheit und Kontrolle über Ihre Daten gewährleisten.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, Wissensgraphen (LightRAG) und Cross-Encoder-Reranking kombiniert. Es verfügt über Docling-Dokumentverarbeitung, visuelle Intelligenz (Bild- und Tabellenbeschriftung), agentebasierten Streaming-Chat und Inline-Zitate. Es wird von Gemini oder lokalen Ollama-Modellen unterstützt.
Warum relevant: NexusRAG bietet eine umfassende und innovative Lösung für RAG-Pipelines, die lokal betrieben werden kann und dabei die volle Kontrolle über Ihre Daten gewährleistet.

flexible-graphrag (8/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: flexible-graphrag ist ein flexibles RAG-System, das verschiedene Wissensgraphen und Vektordatenbanken unterstützt. Es verfügt über automatische Synchronisierung von Datenquellen, Wissensgraphen-Auto-Building, Ontologien, LLMs und Docling- oder LlamaParse-Dokumentverarbeitung. Es bietet TypeScript-React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler, die eine flexible und erweiterbare RAG-Pipeline benötigen, die lokal betrieben werden kann und dabei die volle Kontrolle über Ihre Daten gewährleistet.

LongParser (7/10)

Repository: ENDEVSOLS/LongParser
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: LongParser ist ein privacy-first Dokumentenintelligenz-Engine, die PDFs, DOCX, PPTX, XLSX und CSV in AI-fähige Chunks für RAG-Pipelines umwandelt. Es verfügt über eine HITL-Review-Funktion, 3-Layer-Memory-Chat und einen produktionstauglichen FastAPI-Server.
Warum relevant: LongParser ist eine robuste Lösung für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden kann und dabei die Sicherheit und Kontrolle über Ihre Daten gewährleistet.

chunky (7/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool, das Markdown konvertiert und validiert und die beste Chunking-Strategie für Ihre RAG-Pipeline auswählt. Es unterstützt die Verarbeitung von Markdown, PDFs und anderen Dokumenten.
Warum relevant: chunky ist besonders nützlich für Entwickler, die eine flexible und benutzerdefinierte Chunking-Strategie für ihre RAG-Pipelines benötigen, die lokal betrieben werden kann.

LightningRAG (7/10)

Repository: LightningRAG/LightningRAG
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: LightningRAG ist ein vollständiger Vue + Gin-Stack mit einem dekouplten Frontend und Backend. Es verfügt über integrierte, erweiterbare RAG-Funktionen, einschließlich Wissensbasen, Vektorsuche und Integrationen mit verschiedenen LLM- und Vektordatenbank-Anbietern.
Warum relevant: LightningRAG bietet eine moderne und erweiterbare RAG-Lösung, die lokal betrieben werden kann und dabei die volle Kontrolle über Ihre Daten gewährleistet.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: quarkus-docling vereinfacht die Dokumentenverarbeitung und unterstützt die Verarbeitung verschiedener Formate, einschließlich fortgeschrittener PDF-Verarbeitung. Es bietet nahtlose Integrationen mit dem gen-AI-Ökosystem.
Warum relevant: quarkus-docling ist besonders relevant für Entwickler, die eine robuste und flexible Dokumentenverarbeitungslösung benötigen, die lokal betrieben werden kann und dabei die volle Kontrolle über Ihre Daten gewährleistet.

Quelle: GitHub Search API

👁 1 Aufrufe 👤 1 Leser