中美AI再对账,DeepSeek这把真的超出硅谷了吗?
栏目:成功案例 发布时间:2025-01-27 09:01
出品|搜狐科技作者|郑松毅编纂|杨锦AI年夜模子“角斗场”,被来自中国的“黑马”掀翻了天。DeepSeek最新出品的R1模子,宣布不到一周的时光,曾经胜利跃升至寰球模子排行榜第三名,与OpenAI的GPT-4o并列。停止北京时光1月26日17:50分,DeepSeek在美区苹果App Store收费榜升至第六位,超越谷歌Gemini、微软Copilot。或是因为短期内涌入用户太多,本日下战书另有网友反应DeepSeek呈现了短时闪崩景象。值得一提的是,R1不只是开源模子,练习本钱要比GPT-4o足足廉价20倍。DeepSeek也因而取得了不少新名称,诸如“国产AI之光”、“AI届的拼多多”等。 开展全文
从DeepSeek颁布的测试成果来看,在编码、数学、通识等方面,R1的表示都与OpenAI的o1模子半斤八两。
网友感慨,“是时间撤消我昂贵的OpenAI模子订阅了。”也有在美网友刷屏批评,“美国的AI当先位置立刻要不保了?”
图灵奖取得者杨破昆,从另一个角度发文表现,“比‘中国超出了美国’更适合的说法是,开源模子此次真正获得了成功。”
硅谷猎奇心不减
中国研发企业DeepSeek的“横空降生”,惹起硅谷AI界的一众猎奇。
无论是OpenAI、Meta、英伟达如许的科技巨子,仍是杨破昆、吴恩达等顶尖AI学者,在对DeepSeek的评估中都呈现了一个雷同的描述词——“不堪设想”。
据外媒报道,“Meta 的 AI 部分正感触到压力,工程师们正在猖狂地分析 DeepSeek,并从中复制能复制的所有。”
DeepSeek“出圈”,究竟做对了什么?
简略来说,DeepSeek胜利用低本钱,练习出了高品质的年夜模子。且最难过的是,其仍在坚持寻求AGI的初心。
《福布斯》提到,“它让天下意识到,中国并未退出这场比赛(AI)。”
自DeepSeek掀起热议以来,对其技巧论文的剖析良多。归纳综合来看,DeepSeek不抉择搭已有模子架构的“便车”,而是抉择了翻新。
复旦年夜学教学、MOSS年夜模子名目担任人邱锡鹏向搜狐科技先容,“DeepSeek此次重要是AI Infra(AI基本设备,包含AI安排、算力治理等)做得好,高效应用了资本。”
在R1模子的练习进程中,DeepSeek直接将强化进修(RL)利用于基本模子,而非像以往依附人类标注数据停止监视微调(SFT)。如许做的目标是,让模子从零开端“自我退化”,从而取得推理才能。
有个比方很切当,“就像人进修语文,是从偏旁部首跟拼音基本常识学起,而不是在任何人的领导下直接进修造句。如许打下的基本更踏实。”
别的,固然DeepSeek跟OpenAI都选用了Transformer架构,但DeepSeek采取了全新的“多头潜伏留神力机制架构(MLA)”,年夜幅增加了盘算量,晋升模子练习效力。
综合以上,DeepSeek播种的成果就是——相对的性价比。廉价到什么水平?看其颁布的一张价钱对照图便知。
无论是输入仍是输出Token价钱,DeepSeek都要比OpenAI的o1模子廉价数十倍,且机能表示与其相称。
不为人知的是,在客岁引燃的“年夜模子价钱战”,也恰是由DeepSeek掀起的。
在DeepSeek发布贬价后,字节、阿里巴巴、百度等一众海内年夜厂跟进,乃至不吝“烧钱补助”。
在与暗涌的一场对话中,DeepSeek开创人梁文锋对一直贬价的“打法”说明道,“抢用户并不是咱们的重要目标。贬价一方面是由于咱们在摸索下一代模子的构造中,本钱先降上去了,另一方面也感到无论 API,仍是 AI,都应当是普惠的、大家能够用得起的货色。”
一群“猖狂”的人
DeepSeek既不在中国年夜模子“六小虎”之列,也不像百度、阿里巴巴等科技年夜厂,在AI比赛一开端就备受注视。
DeepSeek真正在AI圈内闯闻名声,是在2024年5月宣布高性价比模子DeepSeek V2,在剧烈竞争中为本人占得了“一席之地”。
与良多外界的猜想差别,DeepSeek不精深莫测的“奇才”,都是一些Top高校的结业生,或是博四、博五没结业的练习生。
现在,DeepSeek正在掀起新的一场“复刻怒潮”,只有强化进修,不监视微调。
Meta、UC伯克利、喷鼻港科技年夜学等一众产学界机构,正在用“缩小镜”深研DeepSeek论文,并实验复现。或者,全天下正在进入AI的下一分水岭。
谈及对忽然“出圈”的见解,梁文锋给出的说明是,“在美国天天产生的大批翻新里,这长短常一般的一个。之以是惊奇,是由于此次中国事以翻新者的身份呈现,而不是刻板印象中的follow(追随者)。”
对将来,梁文锋跟团队想的很明白,“要参加到寰球翻新海潮中去,而不是习气于拿他人的翻新过去,做利用变现。”
在他看来,“中国并不缺人才,DeepSeek的V2模子不海内的人参加,都是外乡的。前 50 名顶尖人才可能不在中国,但兴许咱们能本人打造如许的人。”
后面提到, DeepSeek最难过的是仍在保持寻求AGI的纯洁技巧初心。
北京智源人工智能研讨院副院长兼总工程师林咏华曾向搜狐科技先容,“放眼当下AI市场,各人对利用的寻求是激烈的,反不雅仍在寻求AGI的研讨团队数目却在一直增加,昂扬的科研本钱劝退了良多人。”
DeepSeek的身上,背负着同样的压力。在梁文锋的表述中,可能清楚感触到翻新就是昂贵且低效的。投资人也会出于贸易好处的考量对名目信念时而不定。
但这所有,仿佛并未影响梁文锋跟他的年青团队成为一群“猖狂”的人,在泥泞的途径上,保持追随挂在天涯的“技巧幻想”。
中美AI差距不存在了吗?
DeepSeek的成就可不雅,能否象征着中国AI开展曾经赶超了美国?
360团体开创人周鸿祎在最新宣布的视频中表现,“中美当初AI竞争日益剧烈,但终极必定是中国成功。就像中国在制作业范畴曾经克服了美国一样,中国AI公司的发明力曾经刹不住车了。”
“未来假如要抗衡美国的AI技巧霸权,中国年夜模子技巧复仇者同盟战队里必定有DeepSeek的一份,由于这家公司跟它的开创人十分低调,他们技巧才能跟将来远景被市场重大低估了。”周鸿祎说。
清华年夜学盘算机系长聘副教学刘知远以为,“中国跟美国的AI差距显明缩小了,良多人不佩服,当初DeepSeek等用实例让各人看到了这点。”
但他夸大,“近来看到越来越多‘中国AI曾经超越美国’、‘DeepSeek耻辱OpenAI’的说法,我感到不太好。要警戒从非常达观转向了非常悲观。感到咱们曾经片面超出、遥遥当先了,远远不。”
他提到,“AGI新技巧还在减速演进,将来开展门路尚不明白。咱们仍在追逐阶段,曾经不是瞠乎其后,但也只能说是望其项背。”
“在他人曾经摸索出来的路上追随快跑是绝对轻易的,接上去咱们要面临一团将来迷雾,怎样祖先一步探出新路,是更艰苦跟有挑衅的事,须要百倍投入、百倍尽力。”
在刘知远看来,DeepSeek出圈的意思是,“十分好的让人们看到中国AI的盼望,但远未到瓮中捉鳖、上风在我的田地。咱们在人才贮备、算力资本跟翻新生态方面另有宏大差距。只有脑筋苏醒、施展本身上风,一直补充差距,才干走好前面更有挑衅的路。”前往搜狐,检查更多