Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die volle Kontrolle über Ihre Daten gewährleisten.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: Ein umfassendes RAG-System, das 15 Property Graph-Datenbanken, 4 RDF-Datenbanken und 10 Vektordatenbanken unterstützt. Es verarbeitet 13 Datenquellen (9 automatisch synchronisiert), baut automatisch Wissensgraphen, verwendet Ontologien und LLMs, und bietet GraphRAG, RAG-only und Hybrid-Suche. Es verfügt über TypeScript, React, Vue und Angular-Frontends sowie einen FastAPI-REST-Backend und einen MCP-Server.
Warum relevant: Dieses Projekt ist hochgradig innovativ und bietet eine breite Palette von Funktionen, die es zu einer umfassenden Lösung für RAG-Systeme machen. Es ist lokal betriebsfähig und unterstützt eine Vielzahl von Datenbanken und Datenquellen.

chunky (8/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: Ein Open-Source-Toolkit für zuverlässige RAG-Pipelines, das PDFs in Markdown konvertiert, Dokumente bereinigt, Chunks inspiziert, Chunking-Strategien vergleicht und Metadaten für LLM-Anwendungen bereichert.
Warum relevant: Chunky ist ein leistungsstarkes Werkzeug, das die Verarbeitung und Analyse von Dokumenten vereinfacht. Es ist lokal betriebsfähig und bietet eine Vielzahl von Funktionen, die die Qualität von RAG-Pipelines verbessern.

self-hosted-ai-stack (7/10)

Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 7/10
Was es macht: Ein vollständig selbstgehostetes AI-Stack mit Docker Compose, das Ollama, AnythingLLM, LiteLLM, Whisper, Kokoro, Embeddings, Docling und MCP Gateway umfasst. Es ist lokal betriebsfähig, privat standardmäßig und unterstützt mehrere Architekturen (amd64, arm64) mit optionaler NVIDIA-GPU-Beschleunigung.
Warum relevant: Dieses Projekt bietet eine umfassende Lösung für die lokale Bereitstellung von AI-Tools, die eine hohe Anonymität und Kontrolle über die Daten gewährleistet. Es ist besonders für Entwickler und Organisationen geeignet, die eine private und leistungsfähige AI-Infrastruktur benötigen.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: Docling vereinfacht die Verarbeitung von Dokumenten, indem es verschiedene Formate, einschließlich fortgeschrittene PDF-Verarbeitung, unterstützt und nahtlose Integrationen mit dem gen AI-Ökosystem bietet.
Warum relevant: Quarkus-Docling ist ein nützliches Werkzeug für die Verarbeitung von Dokumenten in Java-Anwendungen. Es ist lokal betriebsfähig und bietet eine einfache Integration in bestehende Quarkus-Projekte.

Quelle: GitHub Search API

👁 1 Aufrufe 👤 1 Leser