Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) In diesem Artikel stellen wir die neuesten GitHub-Projekte im Bereich Retrieval-Augmented Generation (RAG) und Dokumentverarbeitung vor. Diese Pro

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die neuesten GitHub-Projekte im Bereich Retrieval-Augmented Generation (RAG) und Dokumentverarbeitung vor. Diese Projekte kombinieren moderne KI-Ansätze mit flexiblen Selfhosting-Lösungen, um eigene Datenquellen effektiv zu nutzen.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 1/1 = 9/10
Was es macht: NexusRAG ist ein hybrider RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling sowie visuelle Intelligenz für Bilder und Tabellenkennungen.
Warum relevant: Lokal betreibbar via Docker oder Ollama-Modelle, ermöglicht es Benutzern, eigene Datenquellen effektiv zu nutzen.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein Produktionsfähiges RAG-API, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW dichten Vektoren und BM25 sparsamen Matching sowie Cross-Erkenner-Reranking.
Warum relevant: Lokal betreibbar, unterstützt Layout-aware Dokumentextraktion via Docling und hat eine hohe Genauigkeit auf dem Open RAG Bench.

chunky (6/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 1/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert. Es unterstützt verschiedene Chunking-Strategien für RAG-Pipelines.
Warum relevant: Lokal betreibbar, bietet eine flexible Lösung zur Dokumentverarbeitung.

quarkus-docling (5/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 0/2 | Innovation 0/2 | Reife 1/1 = 5/10
Was es macht: quarkus-docling ist eine Quarkus-Erweiterung, die das Verarbeiten und Parsen verschiedener Dokumentformate vereinfacht.
Warum relevant: Unterstützt fortgeschrittene PDF-Verarbeitung und bietet Anbindungen an den gen AI-Ökosystem.

Da weniger als 3 Projekte eine Note von 5 oder höher erreichen, sind die obigen Projekte die besten Optionen zurzeit.

👁 0 Aufrufe 👤 0 Leser

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert