Chatbot baru Deepseek mempunyai pengenalan yang mengagumkan: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." AI ini, produk permulaan Cina Deepseek, telah menjadi pemain pasaran utama, bahkan menyumbang kepada penurunan harga saham Nvidia yang ketara.

Kelebihan daya saing DeepSeek terletak pada kaedah seni bina dan latihan yang inovatif. Teknologi utama termasuk:
- Ramalan Multi-Token (MTP): Daripada meramalkan kata-kata secara individu, MTP meramalkan pelbagai perkataan secara serentak, meningkatkan ketepatan dan kecekapan.
- Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf, mempercepatkan latihan dan meningkatkan prestasi. DeepSeek V3 menggunakan 256 rangkaian, mengaktifkan lapan untuk setiap token.
- Perhatian Laten Multi-Head (MLA): MLA memberi tumpuan kepada bahagian-bahagian kalimat penting berulang kali, meminimumkan risiko menghadap maklumat penting.
Deepseek pada mulanya mendakwa telah melatih rangkaian saraf Deepseek V3 yang kuat untuk hanya $ 6 juta menggunakan 2048 GPU. Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang jauh lebih besar: kira -kira 50,000 NVIDIA Hopper GPU, termasuk 10,000 H800s, 10,000 H100s, dan H20 tambahan, tersebar di pelbagai pusat data. Ini mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan sebanyak $ 944 juta.

DeepSeek, anak syarikat dana lindung nilai Cina yang tinggi, memiliki pusat datanya, menyediakan kawalan yang tiada tandingannya terhadap pelaksanaan pengoptimuman dan inovasi. Pendekatan yang dibiayai sendiri ini memupuk ketangkasan dan membuat keputusan yang cepat. Syarikat itu juga menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya dari universiti -universiti China.

Tuntutan kos latihan awal $ 6 juta Deepseek adalah mengelirukan; Ia hanya mencerminkan penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Jumlah pelaburan syarikat dalam pembangunan AI melebihi $ 500 juta. Walaupun pelaburan besar ini, struktur tanpa lemak membolehkan pelaksanaan inovasi yang cekap.

Kejayaan DeepSeek mempamerkan potensi syarikat AI bebas yang dibiayai dengan baik untuk bersaing dengan gergasi industri. Walau bagaimanapun, pencapaiannya disebabkan oleh berbilion -bilion dalam pelaburan, kejayaan teknikal, dan pasukan yang kuat, bukan bajet revolusioner. Walau bagaimanapun, kos DeepSeek kekal jauh lebih rendah daripada pesaing. Sebagai contoh, DeepSeek membelanjakan $ 5 juta pada R1, berbanding $ 100 juta untuk ChatGPT4O. Ini menonjolkan kelebihan kos yang signifikan, walaupun tuntutan awal yang melambung.