Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die aktuellsten und vielversprechendsten RAG-Systeme und Parser-Pipelines vor, die auf GitHub veröffentlicht wurden. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten und die Integration in lokale AI-Stacks.
flexible-graphrag (9/10)
Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: Ein umfassendes System, das verschiedene Graph-Datenbanken (Property Graph, RDF, Vector) und 13 Datenquellen unterstützt. Es bietet automatisches Synchronisieren, automatisches Erstellen von Wissensgraphen, Ontologien, LLM-Integration, und verschiedene Frontends (TypeScript React, Vue, Angular) sowie einen FastAPI-REST-Backend.
Warum relevant: Dieses Projekt ist besonders relevant, da es eine breite Palette von Datenquellen und Datenbanken unterstützt und vollständig self-hostbar ist. Es bietet eine flexible und leistungsstarke Lösung für komplexe RAG-Anwendungen.
chunky (8/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: Ein Open-Source-Toolkit für zuverlässige RAG-Pipelines, das PDFs in Markdown konvertiert, Dokumente bereinigt, Chunks inspiziert, Chunking-Strategien vergleicht und Metadaten für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein wertvolles Werkzeug für die Vorbereitung und Verarbeitung von Dokumenten in RAG-Pipelines. Es ist self-hostbar und bietet eine Vielzahl von Funktionen zur Optimierung der Dokumentverarbeitung.
self-hosted-ai-stack (7/10)
Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 7/10
Was es macht: Ein vollständiger self-hostbarer AI-Stack mit Docker Compose, der Ollama, LiteLLM, AnythingLLM, Whisper, WhisperLive, Kokoro, Embeddings, Docling und MCP Gateway umfasst. Es bietet lokale und private AI-Lösungen mit optionaler NVIDIA CUDA-Beschleunigung.
Warum relevant: Dieses Projekt ist ideal für Entwickler und Organisationen, die eine umfassende, lokale AI-Infrastruktur aufbauen möchten. Es ist leichtgewichtig, flexibel und bietet eine breite Palette von AI-Tools.
quarkus-docling (6/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: Docling vereinfacht die Dokumentverarbeitung und unterstützt verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung. Es bietet nahtlose Integrationen in den gen-AI-Ökosystem.
Warum relevant: Quarkus-Docling ist eine nützliche Erweiterung für Quarkus, die die Dokumentverarbeitung in AI-Anwendungen erleichtert. Es ist besonders für Java-Entwickler interessant, die eine robuste und flexible Lösung suchen.
Quelle: GitHub Search API