Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

# Aktuelle RAG-Systeme und Parser-Pipelines (GitHub) In diesem Artikel stellen wir die aktuellsten und innovativsten Projekte im Bereich Retrieval-Augmented Generation (RAG) sowie Dokumentenverarbeit

Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)

In diesem Artikel stellen wir die aktuellsten und innovativsten Projekte im Bereich Retrieval-Augmented Generation (RAG) sowie Dokumentenverarbeitung vor. Diese Projekte bieten ein breites Spektrum an Funktionen, von der lokalen Betriebsfähigkeit über die Verarbeitung verschiedener Dokumente bis hin zu fortschrittlichen RAG-Pipelines.

NexusRAG (9/10)

Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrider RAG-System, das Vektorsuche, Wissensgraph (LightRAG) und cross-encoder-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling sowie visuelle Intelligenz wie Bild-/Tabellenkennungen und agente Streamchat-Funktionen.
Warum relevant: Dank seiner Vielfalt an Funktionen und der Möglichkeit, es lokal mit Ollama-Modellen zu betreiben, ist NexusRAG ein leistungsfähiges Tool für die Verarbeitung eigener Daten.

RustyRAG (8/10)

Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein robustes RAG-API-Projekt, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW-dichten Vektoren und BM25-schlanken Matches sowie cross-encoder-Reranking.
Warum relevant: Dank seiner hohen Genauigkeit (94,5% auf Open RAG Bench) und der Unterstützung von Cerebras, Groq, Milvus und Jina AI ist RustyRAG ein leistungsfähiges Tool für die lokale Verarbeitung von Dokumenten.

chunky (6/10)

Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 6/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert, bevor es die beste Chunking-Strategie für RAG-Pipelines auswählt.
Warum relevant: Dank seiner Unterstützung von Markdown, PDFs und anderen Dokumentenformaten sowie der Möglichkeit, es lokal zu betreiben, ist chunky ein nützliches Tool für die Vorbereitung von Daten.

quarkus-docling (4/10)

Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 0/2 | Reife 0/1 = 4/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung und Analyse verschiedener Dokumentformate, einschließlich fortgeschrittener PDF-Verständnisfunktionen.
Warum relevant: Obwohl es keine vollständige RAG-Pipeline bietet, ist es ein nützliches Tool für die lokale Verarbeitung von Dokumenten.


Quelle: GitHub Search API

👁 5 Aufrufe 👤 5 Leser

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert