DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 15:17:52
- 来源:24直播网
1月28日宣 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | ATP杭州赛:头号种子卢布列夫02不敌鲁瓦耶,爆冷出局
- 体育战报 | 斯诺克英格兰赛:周跃龙54逆转晋级,艾伦让4追5
- 体育战报 | 中国羽毛球大师赛,两对中国组合晋级混双四强
- 体育战报 | 张之臻实力提升拒绝被复仇,网友点出小布输球原因:老毛病又犯了
- 体育战报 | 郑钦文领衔豪华宁波赛,即将开启!
- 体育战报 | 当微软的AI开始指导网球运动,这项运动会变得更无聊还是更好看
- 体育战报 | 斯诺克英格兰赛:小特胜袁思俊,塞尔比胜雷佩凡,庞俊旭出局
- 体育战报 | 双喜临门!商竣程三盘激战开启卫冕之路,时隔八个月再尝胜利滋味
- 体育战报 | 泪目!陈梦回归训练备战,31岁女乒王牌剑指全运会:三巨头争冠
- 体育战报 | 诋毁世界冠军朱雨玲,51岁无业男子已被移送法办

- 德甲 | 上演帽子戏法,拜仁官推晒凯恩与队友以及比赛用球的合影
- 意甲 | 小孔塞桑贴地斩难救主!尤文11战平维罗纳,意甲三连胜戛然而止
- 意甲 | 意媒:米兰将现场考察乌迪内斯中卫索莱和托马斯克里斯滕森
- 意甲 | 自2023年2月以来,米兰首次达成意甲3连胜+3场零封
- 意甲 | 五大联赛单场2射1传,普利西奇是近20年美国球员第二人
- 体育战报 | ATP杭州赛:头号种子卢布列夫02不敌鲁瓦耶,爆冷出局
- 英超 | 7黄2红!曼联21战胜切尔西!一根筋的阿莫林击败秒怂的马雷斯卡
- 英超 | B席罗德里:英超最强对手是利物浦,欧冠最强对手是皇马
- 英超 | 马雷斯卡:10打10的比赛和之前完全不同球员们的努力值得肯定
- 英超 | 头球摆渡助攻B费破门!多古社媒庆祝:朝着正确的方向又迈出一步