Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei auf moderne Technologien wie LLMs und Graph-Datenbanken setzen.
flexible-graphrag (9/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: Dieses Projekt kombiniert verschiedene Datenquellen, darunter Property Graphs, RDF, und Vector Databases, um ein umfassendes RAG-System zu schaffen. Es unterstützt automatische Synchronisierung, Wissensgraphen, Ontologien, und verschiedene Frontend-Technologien.
Warum relevant: Die Vielfalt der unterstützten Datenquellen und die Möglichkeit, das System lokal zu betreiben, machen es zu einer vielseitigen und leistungsfähigen Lösung für RAG-Anwendungen.
self-hosted-ai-stack (8/10)
Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Dieses Projekt bietet eine vollständige, lokal betriebene AI-Stack mit Docker Compose, einschließlich Ollama, LiteLLM, Whisper, und mehr. Es unterstützt Embeddings, Docling und MCP Gateway, und ist auf Leichtigkeit und Datenschutz ausgelegt.
Warum relevant: Die Fähigkeit, einen kompletten AI-Stack lokal zu betreiben, bietet eine hohe Kontrolle über die Daten und eine bessere Datenschutzkonformität.
GustoBot (8/10)
Repository: skygazer42/GustoBot
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 2/2 | Reife 1/1 = 8/10
Was es macht: GustoBot ist ein umfassendes Multi-Agent-System für Kundendienst, das auf Langraph basiert. Es unterstützt txt2sql, txt2cypher, und LightRAG, und ist für die Verarbeitung von multimodalen Daten ausgelegt.
Warum relevant: Die Kombination von Multi-Agent-Systemen und RAG-Technologien macht GustoBot zu einer innovativen Lösung für komplexe Kundendienst-Szenarien.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Docling vereinfacht die Verarbeitung von Dokumenten in verschiedenen Formaten, einschließlich PDFs, und bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Die Unterstützung vielfältiger Dokumentformate und die Integration in bestehende AI-Workflows machen Docling zu einer nützlichen Komponente für RAG-Anwendungen.
transmutation (6/10)
Repository: hivellm/transmutation
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Transmutation ist ein Rust-basiertes Modul zur Umwandlung verschiedener Dateiformate in optimierte Text- und Bildausgaben, die für LLM-Verarbeitung und Vektorembeddings geeignet sind.
Warum relevant: Die Leistungsfähigkeit und Effizienz von Rust machen Transmutation zu einer robusten Wahl für die Dokumentverarbeitung in RAG-Systemen.
Quelle: GitHub Search API