Die Dezentralisierung frisst die KI-Rechenleistung von beiden Seiten. Auf der einen Seite wird die Inferenz lokal: - Apple Intelligence auf dem M5 Neural Engine - Microsoft Copilot+ auf X Elite. Auf der anderen Seite werden große Rechenzentren dezentralisiert: - Crowdsourced GPUs (Gensyn) - Modell-parallele Schwärme (Pluralis)