首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Charlotte Mar 22,2025

DeepSeek的新聊天机器人拥有令人印象深刻的介绍:“嗨,我被创建了,您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”这种AI是中国初创公司DeepSeek的产物,已迅速成为主要市场参与者,甚至导致NVIDIA的股价大幅下降。

DeepSeek测试图片:ensigame.com

DeepSeek的竞争优势在于其创新的建筑和培训方法。关键技术包括:

  • 多语预测(MTP): MTP不是单独预测单词,而是同时预测多个单词,从而提高准确性和效率。
  • 专家的混合物(MOE):该体系结构使用多个神经网络,加速培训并提高性能。 DeepSeek V3使用256个网络,每个令牌都激活了8个网络。
  • 多头潜在注意力(MLA): MLA反复致力于至关重要的句子部分,从而最大程度地减少了忽略重要信息的风险。

DeepSeek最初声称使用2048 GPU培训了其强大的DeepSeek V3神经网络,仅需600万美元。然而,半分析显示出更大的基础设施:大约50,000个NVIDIA HOPPER GPU,包括10,000 H800,10,000 H100和其他H20,分布在多个数据中心。这代表了一笔总额约16亿美元的服务器投资,运营费用估计为9.44亿美元。

DeepSeek V3图片:ensigame.com

DeepSeek是中国对冲基金高飞行员的子公司拥有其数据中心,提供了对优化和创新实施的无与伦比的控制。这种自资助的方法促进了敏捷性和快速决策。该公司还吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。

DeepSeek图片:ensigame.com

DeepSeek最初的600万美元培训成本索赔具有误导性;它仅反映了训练前的GPU使用情况,不包括研究,改进,数据处理和基础架构。该公司对AI开发的总投资超过5亿美元。尽管进行了大量投资,但其精益结构允许有效的创新实施。

DeepSeek图片:ensigame.com

DeepSeek的成功展示了资金充足的独立AI公司与行业巨头竞争的潜力。但是,其成就归因于数十亿美元的投资,技术突破和强大的团队,而不是革命性的预算。即便如此,DeepSeek的成本仍大大低于竞争对手。例如,DeepSeek在R1上花费了500万美元,而Chatgpt的Chatgpt4o $ 1亿美元。尽管初始索赔夸大了,但这凸显了巨大的成本优势。

最新文章
  • Fortnite带来了五次逃亡模式,并添加了鳄鱼

    ​ Epic Games的Fortnite Update 34.10带回了流行的“度假”模式和传奇的Midas!最初从第1章开始,从3月11日至4月1日返回。这次,玩家必须找到散落在岛上的三个水晶灯之一,以逃离等待的货车。

    by Andrew Mar 22,2025

  • 神奇宝贝睡眠推出了Suicune研究活动!

    ​与PokémonSleep的最新活动一起,以雄伟的Suicune为特色!直到9月16日,才参加Suicune研究活动,并解锁了这种传奇的水型神奇宝贝的睡眠模式的秘密。如何在神奇宝贝睡眠中“捕捉” Suicune catching suicune

    by Emery Mar 22,2025

最新游戏
Fallout: Vault 69

休闲  /  0.07  /  235.00M

下载
Wood Sortpuz

益智解谜  /  1.03  /  61.9 MB

下载
Master of Card Battle

卡牌  /  0.3.1  /  82.00M

下载
Goblin Dungeon

冒险  /  0.0.9  /  164.8 MB

下载