Aktuelle RAG-Systeme und Parser-Pipelines (GitHub)
In diesem Artikel stellen wir Ihnen die aktuellsten Retrieval-Augmented-Generation (RAG)-Systeme und Dokumentenverarbeitungspipelines vor, die auf GitHub entwickelt wurden. Diese Projekte bieten innovative Lösungen für das Verarbeiten und Auswerten von Dokumenten mit KI.
NexusRAG (9/10)
Repository: LeDat98/NexusRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 2/2 | Reife 0/1 = 9/10
Was es macht: NexusRAG ist ein hybrides RAG-System, das Vektorsuche, einen Wissensgraphen (LightRAG) und Cross-Erkenner-Reranking kombiniert. Es unterstützt die Verarbeitung von Dokumenten mit Docling sowie visuelle Intelligenz für Bilder und Tabellenkennungen. Das System kann lokal oder in der Cloud mit Ollama-Modellen betrieben werden.
Warum relevant: Dank seiner Vielfalt an Funktionen und Flexibilität bei der Modellierung ist NexusRAG eine starke Wahl für komplexe Anwendungen, die Dokumente aus verschiedenen Quellen verarbeiten und analysieren müssen.
RustyRAG (8/10)
Repository: AlphaCorp-AI/RustyRAG
Bewertung: RAG-Kern 3/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 8/10
Was es macht: RustyRAG ist ein Produktionsfähiges RAG-API, das in Rust geschrieben wurde. Es bietet eine hybride Suche mit HNSW dichten Vektoren und BM25 sparsamen Matching sowie Cross-Erkenner-Reranking und layout-awarees Dokumentenauszug über Docling.
Warum relevant: Dank seiner hohen Genauigkeit (94,5% auf Open RAG Bench) und der Unterstützung von Cerebras, Groq, Milvus und Jina AI ist RustyRAG eine robuste Lösung für Unternehmen, die Dokumentenverarbeitung in großem Umfang durchführen.
chunky (7/10)
Repository: GiovanniPasq/chunky
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 2/2 | Innovation 1/2 | Reife 0/1 = 7/10
Was es macht: chunky ist ein Tool, das Markdown-Dokumente konvertiert und validiert. Es unterstützt verschiedene Chunking-Strategien für RAG-Pipelines.
Warum relevant: Für Entwickler, die ihre Dokumentenverarbeitung auf eine optimale Weise anpassen möchten, bietet chunky eine flexiblen Ansatz zur Textsegmentierung.
quarkus-docling (5/10)
Repository: quarkiverse/quarkus-docling
Bewertung: RAG-Kern 2/3 | Dokumente 2/2 | Selfhosting 1/2 | Innovation 0/2 | Reife 1/1 = 5/10
Was es macht: quarkus-docling vereinfacht die Verarbeitung und Analyse von Dokumenten in verschiedenen Formaten, einschließlich fortgeschrittener PDF-Verstehensfähigkeiten.
Warum relevant: Für Entwickler, die eine einfache Integration von Dokumentenverarbeitungs-Funktionen in ihre Anwendungen benötigen, bietet quarkus-docling eine gute Grundlage.
Quelle: GitHub Search API