Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In der Welt des Selfhosting und der KI gibt es immer wieder spannende neue Projekte, die sich mit der Verarbeitung von Dokumenten und der Erstellung von Retrieval-Augmented-Generation-Flows beschäftigen. Hier sind einige der aktuellsten und vielversprechendsten Repositories, die wir gefunden haben.
flexible-graphrag (8/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: `flexible-graphrag` ist ein umfassendes System, das verschiedene Datenquellen (einschließlich Alfresco, Neo4j und anderen Graph-Datenbanken) integriert, um ein Wissensgraphen und RAG-Flows zu erstellen. Es unterstützt automatische Synchronisierung, Ontologien, und verschiedene Frontends (TypeScript React, Vue, Angular) sowie einen FastAPI-Backend.
Warum relevant: Das Projekt ist vollständig selfhostbar und bietet eine breite Palette von Funktionen, die es ideal für Unternehmen und Entwickler machen, die ihre eigenen AI-Systeme aufbauen möchten.
self-hosted-ai-stack (7/10)
Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 7/10
Was es macht: `self-hosted-ai-stack` bietet eine vollständig selfhostbare AI-Stack mit Docker Compose, die Ollama, LiteLLM, Whisper und andere Tools integriert. Es unterstützt lokale Verarbeitung, NVIDIA CUDA-Beschleunigung und ist für mehrere Architekturen (amd64, arm64) verfügbar.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler und Unternehmen, die eine private und leistungsstarke AI-Infrastruktur aufbauen möchten, ohne auf SaaS-Lösungen angewiesen zu sein.
transmutation (6/10)
Repository: hivellm/transmutation
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: `transmutation` ist ein Rust-basiertes Modul zur Dokumentenkonvertierung, das verschiedene Formate (PDF, Markdown, DOCX, etc.) in optimierte Text- und Bildausgaben für LLM-Verarbeitung und Vektorembeddings transformiert. Es nutzt Docling für erweiterte Dokumentenverarbeitung.
Warum relevant: Dieses Projekt ist besonders nützlich für Entwickler, die eine robuste und effiziente Dokumentenverarbeitung in ihre AI-Pipelines integrieren möchten, insbesondere in Umgebungen, die hohe Leistung und Skalierbarkeit erfordern.
quarkus-docling (5/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 5/10
Was es macht: `quarkus-docling` ist eine Quarkus-Erweiterung, die die Verarbeitung und Parsen verschiedener Dokumentformate vereinfacht. Es unterstützt erweiterte PDF-Verarbeitung und bietet nahtlose Integrationen in das gen-AI-Ökosystem.
Warum relevant: Dieses Projekt ist besonders relevant für Entwickler, die mit Quarkus arbeiten und eine robuste Dokumentenverarbeitung in ihre Anwendungen integrieren möchten.
Quelle: GitHub Search API