Deepseek'in yeni sohbet botu etkileyici bir tanıtımla övünüyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Çin girişiminin bir ürünü olan bu AI, hızla büyük bir pazar oyuncusu haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulundu.

Deepseek'in rekabet avantajı yenilikçi mimarisi ve eğitim yöntemlerinde yatmaktadır. Anahtar teknolojiler şunları içerir:
- Çoklu Tahmini Tahmin (MTP): Kelimeleri ayrı ayrı tahmin etmek yerine, MTP aynı anda birden fazla kelimeyi tahmin ederek doğruluğu ve verimliliği artırır.
- Uzmanların Karışımı (MOE): Bu mimari, eğitimi hızlandırarak ve performansı artırarak birden fazla sinir ağı kullanıyor. Deepseek V3 256 ağ kullanır ve her jeton için sekiz etkinleştirilir.
- Çok Baş Gizli Dikkat (MLA): MLA, önemli bilgileri gözden geçirme riskini en aza indirerek önemli cümle parçalarına tekrar tekrar odaklanır.
Deepseek başlangıçta güçlü Deepseek V3 sinir ağını 2048 GPU kullanarak sadece 6 milyon dolarlık eğittiğini iddia etti. Bununla birlikte, semianaliz çok daha büyük bir altyapı ortaya koydu: 10.000 H800, 10.000 H100 ve ek H20 dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları birden fazla veri merkezine yayıldı. Bu, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel giderlerin 944 milyon dolar olduğu tahmin edilmektedir.

Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, optimizasyon ve inovasyon uygulaması üzerinde benzersiz bir kontrol sağlayan veri merkezlerinin sahibidir. Bu kendi kendine finanse edilen yaklaşım çevikliği ve hızlı karar vermeyi teşvik eder. Şirket ayrıca en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden.

Deepseek'in ilk 6 milyon dolarlık eğitim maliyet talebi yanıltıcıdır; Yalnızca araştırma, iyileştirme, veri işleme ve altyapı hariç, eğitim öncesi GPU kullanımını yansıtır. Şirketin AI gelişimine toplam yatırımı 500 milyon doları aşıyor. Bu önemli yatırıma rağmen, yalın yapısı verimli inovasyon uygulamasına izin vermektedir.

Deepseek'in başarısı, iyi finanse edilen bağımsız AI şirketlerinin endüstri devleriyle rekabet etme potansiyelini sergiliyor. Bununla birlikte, başarıları milyarlarca yatırım, teknik atılımlar ve devrimci bir bütçe değil, güçlü bir ekibe atfedilebilir. Buna rağmen, Deepseek'in maliyetleri rakiplerden önemli ölçüde daha düşük kalır. Örneğin, Deepseek, Chatgpt'in ChatGpt4o için 100 milyon dolarına kıyasla R1'e 5 milyon dolar harcadı. Bu, şişirilmiş ilk iddialara rağmen önemli maliyet avantajını vurgulamaktadır.