[Self-hosted AI for Linux servers, with mesh networking across hosts](https://old.reddit.com/r/selfhosted/comments/1symk0e/selfhosted_ai_for_linux_servers_with_mesh/) (8/10)

Einleitung

Die Reddit-Community diskutiert aktuell verschiedene Aspekte bezüglich erschwinglicher lokaler KI-Setups. Dabei geht es um Hardware-Empfehlungen, Software-Optionen und spezifische Anwendungen wie Tool-Calling und Multi-Step-Tasks. Die folgenden Beiträge bieten praktische Tipps und Erfahrungsberichte, die für ein budgetbewusstes lokales Agenten-Setup hilfreich sein können.

Self-hosted AI for Linux servers, with mesh networking across hosts (8/10)

Bewertung: Praxis 3/3 | Hardware 2/3 | Agenten 2/2 | Aktualitaet 1/2 = 8/10

Der Beitrag stellt eine selbstgehostete KI-App namens Rete vor, die auf Linux, Mac und Windows läuft. Sie verwendet llama.cpp für die lokale Modellausführung und bietet eine Web-UI. Besonders interessant ist die Mesh-Netzwerkfunktion, die es ermöglicht, die Rechenleistung mehrerer Geräte zu poolen. Dies ist besonders nützlich, um größere Modelle auf unterlegenen Geräten zu betreiben. Die Lizenzierung ist transparent und kostengünstig.

How do I do this (7/10)

Bewertung: Praxis 2/3 | Hardware 2/3 | Agenten 1/2 | Aktualitaet 2/2 = 7/10

Der Nutzer möchte ein Offline-Überlebens-Telefon mit lokaler KI-LLM einrichten. Es wird empfohlen, llamafile zu verwenden, da es klein und einfach zu betreiben ist. Die Diskussion umfasst auch die Bedenken bezüglich der Akkulaufzeit und Speicherverwendung, was für ein budgetbewusstes Setup relevant ist.

Need advice on what to do with new (to me) hardware. (6/10)

Bewertung: Praxis 2/3 | Hardware 2/3 | Agenten 1/2 | Aktualitaet 1/2 = 6/10

Der Nutzer hat eine neue Server-Hardware erhalten und sucht Ratschläge, wie er diese nutzen kann. Es wird vorgeschlagen, Stable Diffusion-Modelle zu betreiben oder einen Kubernetes-Cluster aufzusetzen. Die enorme RAM-Kapazität (1.5TB) bietet viele Möglichkeiten für KI-Anwendungen, auch ohne GPU.

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16 · Hugging Face (6/10)

Bewertung: Praxis 1/3 | Hardware 2/3 | Agenten 2/2 | Aktualitaet 1/2 = 6/10

Der Beitrag stellt das Nemotron-3-Nano-Omni-30B-A3B-Reasoning-Modell vor, das für reasoning- und tool-calling-Fähigkeiten optimiert ist. Es wird in der Diskussion erwähnt, dass dieses Modell auf günstiger Hardware wie der RTX 3060 laufen kann, was es für budgetbewusste Setups interessant macht.

Study: 2x+ coding performance of 7B model without touching the coding agent (5/10)

Bewertung: Praxis 1/3 | Hardware 1/3 | Agenten 2/2 | Aktualitaet 1/2 = 5/10

Die Studie zeigt, dass das Leistungsverhalten eines 7B-Modells bei coding-aufgaben um das Doppelte verbessert werden kann, ohne den Agenten selbst zu verändern. Dies ist relevant für Nutzer, die agentische Fähigkeiten wie Code-Generierung benötigen und auf günstiger Hardware arbeiten.

Weitere Beiträge:

– Homelab Backup solutions
– Antra v1.1.4, the app I use to fill my Navidrome library with hi-res FLAC from my own Tidal/Qobuz/Amazon accounts
– Antra v1.1.4, the app I use to fill my Navidrome library with hi-res FLAC from my own Tidal/Qobuz/Amazon accounts
– feel free to post your self-hosted ai assisted projects 24×7 in this self_hosted_ai
– Can I host myself streaming games (like on Twitch) to my own website?
– Hey, where can I get cheap firewall subscription licenses for a year or multiple years for using at home? Fortinet and Sonicwall seem expensive. Thank you.
– Xiami mimo-v2.5 pro MIT license surpasses Opus 4.5 on arena

👁 0 Aufrufe 👤 0 Leser