Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Marktteilnehmer geworden, der sogar zu einem erheblichen Rückgang des Aktienkurs von NVIDIA beiträgt.

Deepseeks Wettbewerbsvorteil liegt in seinen innovativen Architektur- und Trainingsmethoden. Schlüsseltechnologien umfassen:
- Multi-Token-Vorhersage (MTP): Anstatt Wörter einzeln vorherzusagen, prognostiziert MTP mehrere Wörter gleichzeitig, steigern Sie die Genauigkeit und Effizienz.
- Mischung von Experten (MOE): Diese Architektur verwendet mehrere neuronale Netzwerke, beschleunigt das Training und die Verbesserung der Leistung. Deepseek V3 verwendet 256 Netzwerke und aktiviert acht für jedes Token.
- Multi-Head Latent Achtung (MLA): MLA konzentriert sich wiederholt auf wichtige Satzteile und minimiert das Risiko, wichtige Informationen zu übersehen.
Deepseek behauptete zunächst, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit 2048 GPUs ausgebildet zu haben. Die semianalyse ergab jedoch eine weitaus größere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100 und zusätzliche H20S, verteilten sich auf mehrere Rechenzentren. Dies entspricht einer gesamten Serverinvestition von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten auf 944 Mio. USD geschätzt werden.

Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und bietet eine beispiellose Kontrolle über Optimierung und Innovationsimplementierung. Dieser selbstfinanzierte Ansatz fördert Agilität und schnelle Entscheidungsfindung. Das Unternehmen zieht auch Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.

Deepseeks anfängliche Schulungskosten in Höhe von 6 Millionen US -Dollar ist irreführend. Es spiegelt nur die Nutzung der GPU vor dem Training wider, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die Gesamtinvestition des Unternehmens in die KI -Entwicklung beträgt 500 Millionen US -Dollar. Trotz dieser erheblichen Investitionen ermöglicht seine magere Struktur eine effiziente Implementierung von Innovationen.

Der Erfolg von Deepseek zeigt das Potenzial gut finanzierter unabhängiger KI-Unternehmen, mit Branchenriesen zu konkurrieren. Die Erfolge sind jedoch auf Milliarden in Investitionen, technischen Durchbrüchen und einem starken Team, nicht auf ein revolutionäres Budget zurückzuführen. Trotzdem bleiben die Kosten von Deepseek deutlich niedriger als die Wettbewerber. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für R1 aus, verglichen mit Chatgpts 100 Millionen US -Dollar für Chatgpt4O. Dies unterstreicht den erheblichen Kostenvorteil trotz der aufgeblähten anfänglichen Ansprüche.