Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) ![Vorschau](https://github.githubassets.com/assets/GitHub-Mark-ea2971cee799.png) In diesem Artikel stellen wir die neuesten Entwicklungen im Bere

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

Vorschau

In diesem Artikel stellen wir die neuesten Entwicklungen im Bereich RAG-Systeme und Parser-Pipelines vor. Diese Projekte bieten innovative Lösungen für die Verarbeitung und Analyse von Dokumenten, die lokal betrieben werden können und dabei die Datenschutzbedenken der Nutzer berücksichtigen.

flexible-graphrag (9/10)

Repository: stevereiner/flexible-graphrag
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 1/1 = 9/10
Was es macht: `flexible-graphrag` ist ein umfassendes System, das verschiedene Datenquellen und Datenbanken (wie Property Graph, RDF, Vector, OpenSearch, Elasticsearch, Alfresco) unterstützt. Es bietet automatische Synchronisierung, Wissensgraphen, Ontologien, LLMs, Dokumentverarbeitung und mehr. Die Pipeline umfasst GraphRAG, RAG-only und Hybrid Search, sowie AI-Chat-Funktionen.
Warum relevant: Das Projekt ist hochgradig innovativ und bietet eine breite Palette von Funktionen, die lokal betrieben werden können. Es ist gut dokumentiert und hat eine hohe Anzahl von Sternen, was auf eine hohe Reife und Akzeptanz hinweist.

self-hosted-ai-stack (8/10)

Repository: hwdsl2/self-hosted-ai-stack
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 8/10
Was es macht: `self-hosted-ai-stack` ermöglicht es, eine vollständige, lokal betriebene AI-Stack mit Docker Compose zu bereitstellen. Es umfasst Ollama, LiteLLM, AnythingLLM, Whisper, WhisperLive, Kokoro, Embeddings, Docling und MCP Gateway. Die Stack ist leichtgewichtig, privat und unterstützt NVIDIA CUDA-Beschleunigung.
Warum relevant: Dieses Projekt ist besonders relevant für Nutzer, die eine vollständige, lokal betriebene AI-Infrastruktur benötigen. Es ist gut dokumentiert und hat eine hohe Anzahl von Sternen, was auf eine hohe Reife und Akzeptanz hinweist.

GustoBot (7/10)

Repository: skygazer42/GustoBot
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 1/2 | Innovation 2/2 | Reife 1/1 = 7/10
Was es macht: `GustoBot` ist ein umfassendes Multi-Agenten-System für den Kundensupport, das auf Langraph basiert. Es unterstützt txt2sql, txt2cypher, LightRAG und mehr. Das System ist in Python geschrieben und bietet eine breite Palette von Funktionen für die Verarbeitung und Analyse von Textdaten.
Warum relevant: Das Projekt ist innovativ und bietet eine breite Palette von Funktionen, die lokal betrieben werden können. Es hat eine hohe Anzahl von Sternen, was auf eine hohe Reife und Akzeptanz hinweist.

quarkus-docling (6/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: `quarkus-docling` vereinfacht die Verarbeitung von Dokumenten und unterstützt verschiedene Formate, einschließlich PDF. Es bietet nahtlose Integrationen in das gen AI-Ökosystem und ist als Quarkus-Erweiterung verfügbar.
Warum relevant: Dieses Projekt ist besonders relevant für Nutzer, die eine robuste Dokumentverarbeitung in einer Java-Umgebung benötigen. Es ist gut dokumentiert und hat eine moderate Anzahl von Sternen, was auf eine akzeptable Reife hinweist.

transmutation (6/10)

Repository: hivellm/transmutation
Bewertung: RAG-Kern 1/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 1/2 | Reife 1/1 = 6/10
Was es macht: `transmutation` ist ein Rust-basiertes Modul zur Dokumentkonvertierung, das verschiedene Dateiformate in optimierte Text- und Bildausgaben für LLM-Verarbeitung und Vektorembeddings umwandelt. Es nutzt Docling für fortgeschrittene Dokumentenverarbeitung.
Warum relevant: Dieses Projekt ist besonders relevant für Nutzer, die eine effiziente und performante Dokumentkonvertierung benötigen. Es ist gut dokumentiert und hat eine moderate Anzahl von Sternen, was auf eine akzeptable Reife hinweist.


Quelle: GitHub Search API

👁 0 Aufrufe 👤 0 Leser