Reddit Apple-Silicon-Lagebild: Mac Studio, MLX und Cluster
Einleitung: Diese Zusammenfassung bietet einen Überblick über aktuelle Diskussionen und Erfahrungen im Reddit-Forum r/LocalLLaMA, speziell im Kontext von Apple-Silicon, Mac Studio, MLX und Clustern. Ziel ist es, den Leser bei der Entscheidung für eine Apple-Silicon-Hardware und die Nutzung von OpenCode zu unterstützen.
Feedback Wanted: Building for easier local AI (6/10) — OpenCode-Fit: BEDINGT

Verdict (1 Satz): Ein nützliches Tool für die einfache Einrichtung von LLMs, aber ohne spezifische Benchmarks für Apple-Silicon und OpenCode.
Hardware: Linux, Windows, Mac
Modell: Nicht spezifisch
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single / Multi
Investment-Empfehlung: „Warten“
Kontext (2-3 Saetze): Das Projekt zielt darauf ab, die Einrichtung von LLMs auf verschiedenen Plattformen zu vereinfachen. Es bietet eine benutzerfreundliche UI und automatische Parallelisierung, aber spezifische Benchmarks für Apple-Silicon und OpenCode fehlen.
Output Length Constrained Summarization using GRPO on tiny LLMs | smolcluster (8/10) — OpenCode-Fit: JA

Verdict (1 Satz): Interessante Forschungsergebnisse zur Summarization auf Apple-Silicon-Clustern, die für OpenCode relevant sein können.
Hardware: 3x Mac mini M4 (16 GB RAM)
Modell: Qwen2.5-0.5B-Instruct, LFM-2.5-350M
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Multi
Investment-Empfehlung: „Jetzt kaufen“
Kontext (2-3 Saetze): Das Projekt untersucht, ob kleine LLMs auf Apple-Silicon-Clustern effektiv für die Summarization verwendet werden können. Es zeigt, dass ein gestufter Curriculum (längenbasiertes Training vor qualitativem Training) bessere Ergebnisse liefert.
Running on a macbook, and having issues with crashing? Maybe this will help… (7/10) — OpenCode-Fit: BEDINGT
Verdict (1 Satz): Nützliche Tipps zur Stabilität von LLMs auf MacBooks, aber ohne spezifische Benchmarks für OpenCode.
Hardware: MacBook Pro M2 Max (64 GB RAM)
Modell: Qwen3.6 35b A3B
tok/s-Claim: 49 tokens/sec generation, 400+ on prompt processing
Cluster-Bezug: Single
Investment-Empfehlung: „Warten“
Kontext (2-3 Saetze): Der Post bietet praktische Tipps zur Optimierung und Stabilität von LLMs auf MacBooks, einschließlich der Verwendung von GGUF-Modellen und der Anpassung von Systemeinstellungen.
Added direct model downloads right from the UI in Anubis OSS – if anyone would help test that would be great (5/10) — OpenCode-Fit: BEDINGT
Verdict (1 Satz): Ein nützliches Tool für die einfache Verwaltung von LLMs auf Apple-Silicon, aber ohne spezifische Benchmarks für OpenCode.
Hardware: Apple Silicon Mac
Modell: Ollama, LM Studio, MLX, Apple Intelligence
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single
Investment-Empfehlung: „Warten“
Kontext (2-3 Saetze): Anubis OSS ist eine Mac-App zur Benchmarking von LLMs, die nun die direkte Modell-Download-Funktion unterstützt. Es bietet eine benutzerfreundliche UI, aber spezifische Benchmarks für OpenCode fehlen.
AI content detector based on Qwen 0.8b fine-tuned on Pangram dataset (6/10) — OpenCode-Fit: NEIN

Verdict (1 Satz): Ein interessantes Projekt zur Erkennung von AI-generiertem Inhalt, aber nicht direkt relevant für OpenCode.
Hardware: M1 MacBook Pro
Modell: Qwen 3.5 0.8B
tok/s-Claim: Unter 1 Sekunde
Cluster-Bezug: Single
Investment-Empfehlung: „Rechnet sich nicht“
Kontext (2-3 Saetze): Der Post stellt ein Chrome-Extension vor, das Qwen 3.5 0.8B verwendet, um die Wahrscheinlichkeit von AI-generiertem Inhalt zu ermitteln. Es ist schnell und lokal ausführbar, aber nicht direkt für OpenCode relevant.
Old Mac Pro still proving its worth (7/10) — OpenCode-Fit: BEDINGT

Verdict (1 Satz): Ein alter Mac Pro kann immer noch nützlich für LLMs sein, aber die Leistung ist begrenzt.
Hardware: Mac Pro (2013), 64 GB RAM, 2x D700 GPUs
Modell: Qwen 3.5 9B Q4 MTP, Qwen 2.5 coder q4
tok/s-Claim: 11 t/s output (70k context), 22 t/s output (70k context)
Cluster-Bezug: Single
Investment-Empfehlung: „Rechnet sich nicht“
Kontext (2-3 Saetze): Der Post zeigt, dass ein alter Mac Pro mit Vulkan-Unterstützung immer noch für LLMs verwendet werden kann. Die Leistung ist jedoch begrenzt und nicht ideal für OpenCode.
I have macbook m4 16’ 48GB. I use claude code and want to try local one (5/10) — OpenCode-Fit: BEDINGT
Verdict (1 Satz): Ein guter Einstiegspunkt für LLMs auf MacBooks, aber ohne spezifische Benchmarks für OpenCode.
Hardware: MacBook Pro M4 (16″), 48 GB RAM
Modell: Qwen 3.6 27B
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single
Investment-Empfehlung: „Warten“
Kontext (2-3 Saetze): Der Post bietet praktische Tipps zur Auswahl und Nutzung von LLMs auf MacBooks, einschließlich der Verwendung von LM Studio und MLX-Modellen.
What workstation to get for ~13k EUR? (8/10) — OpenCode-Fit: JA
Verdict (1 Satz): Eine detaillierte Analyse der Hardware-Optionen für LLMs, die Mac Studio als starke Wahl für OpenCode hervorhebt.
Hardware: M5 Ultra Mac Studio (256 GB Unified Memory), RTX PRO 5000 (48 GB)
Modell: DeepSeek-V4-Flash, MiniMax-M2.7
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single
Investment-Empfehlung: „Jetzt kaufen“
Kontext (2-3 Saetze): Der Post vergleicht verschiedene Workstation-Optionen im Budget von 13.000 EUR und hebt die Vorteile des M5 Ultra Mac Studio hervor, insbesondere für die Ausführung von großen LLMs wie DeepSeek-V4-Flash und MiniMax-M2.7.
Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP (8/10) — OpenCode-Fit: JA
Verdict (1 Satz): Ein hochperformantes Modell für Apple-Silicon, das für OpenCode geeignet ist.
Hardware: Beelink gtr9 pro + Strix Halo
Modell: Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single
Investment-Empfehlung: „Jetzt kaufen“
Kontext (2-3 Saetze): Der Post stellt das Modell Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP vor, das auf Apple-Silicon optimiert ist und in OpenCode verwendet werden kann. Es bietet hohe Stabilität und Leistung.
TTS Benchmark Comparison (all known TTS up until May 2026) (5/10) — OpenCode-Fit: NEIN
Verdict (1 Satz): Ein nützlicher Benchmark für TTS-Tools, aber nicht direkt relevant für OpenCode.
Hardware: Windows, Mac, Linux
Modell: Various TTS models
tok/s-Claim: Nicht im Post belegt
Cluster-Bezug: Single
Investment-Empfehlung: „Rechnet sich nicht“
Kontext (2-3 Saetze): Der Post bietet einen Benchmark für verschiedene TTS-Tools, der für die Auswahl von TTS-Modellen nützlich sein kann, aber nicht direkt für OpenCode relevant ist.
I added native MTP to exo for Qwen3.6 MLX models; here are the exactness and speed results (9/10) — OpenCode-Fit: JA

Verdict (1 Satz): Ein wichtiger Beitrag zur Verbesserung der Leistung von Qwen3.6-Modellen auf Apple-Silicon-Clustern, der für OpenCode relevant ist.
Hardware: Mac
Modell: Qwen3.6 27B, Qwen3.6 35B-A3B
tok/s-Claim: 27B: 17.27 tok/s (MTP off), 29.56 tok/s (K=1), 34.06 tok/s (K=2), 33.79 tok/s (K=3) 35B-A3B: 85.14 tok/s (MTP off), 98.59 tok/s (K=1), 92.27 tok/s (K=2), 80.53 tok/s (K=3)
Cluster-Bezug: Multi
Investment-Empfehlung: „Jetzt kaufen“
Kontext (2-3 Saetze): Der Post beschreibt die Implementierung von native MTP in exo für Qwen3.6-MLX-Modelle, die die Leistung und Genauigkeit erheblich verbessert. Es bietet detaillierte Benchmarks und Empfehlungen für die Verwendung auf Apple-Silicon-Clustern.
Weitere Beiträge:
– Sharing my ‚Local-LLM-Toolkit‘ repo
– I have macbook m4 16’ 48GB. I use claude code and want to try local one