Bahay Balita Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo

May-akda : Charlotte Mar 22,2025

Ipinagmamalaki ng bagong chatbot ng Deepseek ang isang kahanga -hangang pagpapakilala: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang AI na ito, isang produkto ng China Startup Deepseek, ay mabilis na naging isang pangunahing manlalaro ng merkado, kahit na nag -aambag sa isang makabuluhang pagbagsak sa presyo ng stock ni Nvidia.

Pagsubok sa Deepseek Larawan: ensigame.com

Ang mapagkumpitensyang gilid ng DeepSeek ay nakasalalay sa makabagong mga pamamaraan ng arkitektura at pagsasanay. Ang mga pangunahing teknolohiya ay kasama ang:

  • Multi-Token Prediction (MTP): Sa halip na mahulaan ang mga salita nang paisa-isa, ang mga pagtataya ng MTP ay maraming mga salita nang sabay-sabay, pagpapalakas ng kawastuhan at kahusayan.
  • Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng maraming mga neural network, pabilis na pagsasanay at pagpapabuti ng pagganap. Ang Deepseek V3 ay gumagamit ng 256 na mga network, pag -activate ng walong para sa bawat token.
  • Multi-head latent pansin (MLA): Ang MLA ay nakatuon sa mga mahahalagang bahagi ng pangungusap nang paulit-ulit, na binabawasan ang panganib ng pagtatanong ng mahalagang impormasyon.

Una nang inangkin ng Deepseek na sinanay ang malakas na Deepseek V3 Neural Network para sa isang $ 6 milyon lamang gamit ang 2048 GPU. Gayunpaman, ang semianalysis ay nagsiwalat ng isang mas malaking imprastraktura: humigit -kumulang 50,000 NVIDIA HOPPER GPU, kabilang ang 10,000 H800s, 10,000 H100s, at karagdagang mga H20, kumalat sa maraming mga sentro ng data. Ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

Deepseek v3 Larawan: ensigame.com

Ang Deepseek, isang subsidiary ng Chinese Hedge Fund High-flyer, ay nagmamay-ari ng mga data center nito, na nagbibigay ng walang kaparis na kontrol sa pag-optimize at pagpapatupad ng pagbabago. Ang diskarte na pinondohan ng sarili ay nagtataguyod ng liksi at mabilis na paggawa ng desisyon. Ang kumpanya ay nakakaakit din ng nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa mga unibersidad sa Tsino.

Deepseek Larawan: ensigame.com

Ang paunang $ 6 milyong paghahabol sa gastos sa pagsasanay sa Deepseek ay nakaliligaw; Sinasalamin lamang nito ang paggamit ng pre-training GPU, hindi kasama ang pananaliksik, pagpipino, pagproseso ng data, at imprastraktura. Ang kabuuang pamumuhunan ng kumpanya sa pag -unlad ng AI ay lumampas sa $ 500 milyon. Sa kabila ng malaking pamumuhunan na ito, ang istraktura ng sandalan nito ay nagbibigay -daan para sa mahusay na pagpapatupad ng pagbabago.

Deepseek Larawan: ensigame.com

Ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng mahusay na pinondohan na independiyenteng mga kumpanya ng AI upang makipagkumpetensya sa mga higanteng industriya. Gayunpaman, ang mga nagawa nito ay naiugnay sa bilyun -bilyong pamumuhunan, mga teknikal na pambihirang tagumpay, at isang malakas na koponan, hindi isang rebolusyonaryong badyet. Kahit na, ang mga gastos sa Deepseek ay nananatiling mas mababa kaysa sa mga kakumpitensya. Halimbawa, ang Deepseek ay gumugol ng $ 5 milyon sa R1, kumpara sa $ 100 milyon ng Chatgpt para sa Chatgpt4O. Itinampok nito ang makabuluhang kalamangan sa gastos, sa kabila ng napalaki na paunang pag -angkin.

Pinakabagong Mga Artikulo
Pinakabagong Laro