只招1%的蠢才,这家中国公司让硅谷难安
栏目:行业新闻 发布时间:2025-01-27 09:01
本文来自:凤凰网科技,作者:Danny、董雨晴OpenAI的最强敌手呈现了,这一次来自中国。2025年一开年就火遍寰球的DeepSeek(深度求索),1月20日晚演出了一场“狙击珍珠港”——宣布推理模子 DeepSeek-R1 正式版,同步开源模子权重,并容许用户应用模子输出、经由过程模子蒸馏等方法练习其余模子。这款年夜模子在数学、代码、天然言语推理等义务上,机能比肩OpenAI o1正式版。R1版本的推出,在海内被惊呼“这才是真正的开放的人工智能”。英伟达高等研讨迷信家Jim Fan在评估R1模子时就如许说道:“咱们生涯在如许一个时期:一个不是美国公司的AI企业却实现了 OpenAI建立时的任务——做真正开放的前沿研讨、为全部人赋能。”凤凰网科技在此前的文章《英伟达的最年夜空头呈现了》中曾具体先容过深度求索(DeepSeek)跟其系列年夜模子的中心竞争力起源,现在看来,DeepSeek的翻新含金量还在回升。跟着DeepSeek的翻新气力成为寰球热议议题,外界也愈发存眷,这家中国外乡科技公司及其背地的掌舵人,毕竟有何特殊之处?一个浙年夜学霸,勇闯无人区1985年,梁文锋诞生于广东湛江的一个五线都会。其详细的童年景长轨迹已弗成考,从公然信息独一可知的是,梁文锋有在采访中提到过本人的父亲是一名小学教师。2002年,17岁的梁文锋凭仗优良成就考入浙江年夜学电子信息工程专业。2007年,22岁的梁文锋又考上了浙江年夜学信息与通讯工程专业硕士。师从项志宇,重要做呆板视觉研讨。2008年,23岁的梁文锋在浙江年夜学攻读硕士学位时期,与同窗组建团队,开端网络市场行情、金融市场相干数据以及微观经济数据。这一年,他率领团队应用呆板进修技巧摸索全主动量化买卖,而事先正值寰球金融危急的暴发。有新闻称,年夜疆开创人汪滔曾约请梁文锋独特创业,彼时年夜疆正处于起步阶段。假如梁文锋参加,或者也能在年夜疆的开展中实现财产自在。但梁文锋深信人工智能将转变天下,终极决议自力创业。 开展全文 2010年6月,25岁的梁文锋从浙江年夜学信息与通讯工程专业硕士结业,其结业论文标题为《基于低本钱PTZ摄像机的目的跟踪算法研讨》。 硕士结业后的第三年,28岁的梁文锋将人工智能与量化买卖联合,跟浙江年夜学的徐进校友创建了雅克比投资(杭州雅克比投资治理无限公司)。2015年,他们独特创建杭州幻方科技无限公司,也就是明天的浙江九章资产治理无限公司,次年又建立了宁波幻方量化投资治理合资企业(无限合资)。 所谓量化投资,艰深地说就是用盘算机代替人,经由过程数目化方法,顺序化收回交易指令,投资收益较为稳固。 经由多少年时光,幻方量化就在海内敏捷突起。2016年10月,幻方量化推出第一个AI模子,第一份由深度进修天生的买卖仓位上线履行。到2017岁尾,多少乎全部的量化战略都采取AI模子盘算。2019年,幻方量化治理范围冲破百亿,成为海内量化私募“四巨子”之一。 尔后的幻方量化乃至一度成为中国首家冲破千亿的私募量化年夜厂,正确地说也是迄今为止业内独一范围曾迈过千亿年夜关的量化私募。这时期梁文锋在量化投资范畴积聚了强盛的技巧气力跟算力资本,幻方量化以强盛的算力支撑驰名。 2023年,寰球人工智能高潮暴发,梁文锋也离开了他创业之路的第十个年初。 昔时5月,38岁的梁文锋发布要做通用人工智能(AGI)。7月,杭州深度求索人工智能基本技巧研讨无限公司(DeepSeek)建立,专一于AI年夜模子的研讨与开辟。梁文锋也成为量化投资者投身AI创业的“第一人”。 之后就是爽文脚本式的“AI界拼多多”突起之路,就连年夜厂也只能是追随,“在豆包跟阿里云之前,DeepSeek开始在全网下降了模子本钱”,一位AI算法工程师对凤凰网科技表现,这让他印象十分深入。 2024年5月,DeepSeek宣布的DeepSeek V2的开源模子率先拉起了行业内的价钱战。DeepSeek V2供给了一种前所未有的性价比:推理本钱被降到每百万token仅1块钱,约即是Llama3 70B的七分之一,GPT-4 Turbo的七非常之一。 同年12月26日,仅仅时隔7个月,DeepSeek就又宣布了DeepSeek V3,再次推翻了行业对价钱的认知。DeepSeek V3的API订价为输入每百万tokens 0.5元(缓存掷中)/2元(缓存未掷中),输出每百万tokens 8元,与字节Doubao-pro-256k订价输入每百万tokens 5元,输出每百万tokens 9元的程度相称,在国产模子中性价比持续晋升。 现在,当行业还沉迷在DeepSeek V3的震动中时,DeepSeek-R1正式版又来了。这一次,DeepSeek真正激发了硅谷的惊恐。 微软CEO萨蒂亚・纳德拉在瑞士达沃斯天下经济论坛上表现:“看到DeepSeek的新模子,真的令人印象十分深入。他们实在无效地开辟出了一款开源模子,在推理盘算方面表示杰出,且超等盘算效力极高。” “咱们必需十分、十分当真地看待中国的这些停顿,”纳德拉说。 DeepSeek的可贵之处,还是翻新 “DeepSeek确实有过人之处,业内都感到他们可能是用了一些o1的数据做蒸馏,但在算法层面做了更好的翻新”,一位行业从业人士以为。 在刚建立的一年多时光里,DeepSeek始终不声不响,据凤凰网科技懂得,这家公司乃至不设破公关团队。甚至于,当少数年夜模子公司都在争声量,抢时光的时间,DeepSeek在闷声实验翻新。 DeepSeek的翻新也是自下而上,多少乎存在于全部公司外部。比方,时至本日,梁文锋的一样平常仍旧是看论文、写代码、参加小组探讨。是少有的能堪比一线研讨员才能的公司掌舵者。 因为一开端的目的就是AGI,以是DeepSeek素来不做追随战略,即像其余贸易类公司一样,抉择跟随寰球开始进的模子,用短平快的方法做好利用,而是在模子构造层面做从0-1的翻新。 在接收《暗涌》采访时,梁文锋也曾明白地表白,“由于咱们感到当初最主要的是参加到寰球翻新的海潮里去。从前良多年,中国公司习气了他人做技巧翻新,咱们拿过去做利用变现,但这并非是一种天经地义。这一海浪潮里,咱们的动身点,就不是乘隙赚一笔,而是走到技巧的前沿,去推进全部生态开展”。 从前,碍于人才形成跟资源气力,中国企业做的每每是无限的翻新,但现现在,强如字节等企业,曾经无数百亿美元范围的年度利润。据凤凰网科技此前得悉,字节豆包年夜模子团队已在外部组建AGI临时研讨团队,代号“Seed Edge”。 这象征着,翻新已不再是困难,难的是怎样坚持人才密度,以及领有自负。 据多位与DeepSeek有过打仗的行业人士表述,DeepSeek的上风之处就在于人才密度极高,且多来自于中国外乡市场。 “DeepSeek从一开端团队就是百人阁下范围,但个个都很抗打”,一位AI行业猎头对凤凰网科技表现,“实在晚期Kimi也曾想走这个道路,只是不特殊胜利。” 另一位与DeepSeek有过打仗的行业人士称,“DeepSeek给出的薪酬报酬十分存在竞争力,这让其始终对人才有很强的吸引力”。 此前据多家媒体报道,雷军曾亲身脱手“挖deepseek的人”,付出的薪酬则在万万元级别。这团体恰是DeepSeek-V2的要害开辟者之一罗福莉,一个95后。 据量子位收拾材料发明,DeepSeek团队最年夜的特色就是年青。应届生、在读生,特殊是来自清北的应届生在此中十分活泼。 “只招1%的蠢才,去做99%中国公司做不到的事件。”口试过DeepSeek的应届生如许评估其应聘作风。 这也使得DeepSeek全员高低,都坚持着极致的翻新能源。 梁文峰在接收《暗涌》采访时同样表白过一个观念:DeepSeek在招人时重要看才能,而不是看教训。“咱们的中心技巧岗亭,基础以应届跟结业一两年的工资主”。而且梁文锋还表白,“V2模子不海内返来的人,都是外乡的。前50名顶尖人才可能不在中国,但兴许咱们能本人打造如许的人。” 跟上一代功成名就的故事差别,DeepSeek代表的是一个硬核翻新时期的到来。上一代的胜利人士是属于互联网的,他们在技巧层面的冲破并未几,更多是拼速率、拼资源、拼范围。 一个可喜的旌旗灯号是,DeepSeek不是孤例,同样来自杭州外乡市场,宇树科技最新推出的呆板人B2-W同样冷艳寰球,宇树科技的开创人兼CEO王兴兴,本科就读于浙江理工年夜学机器与主动把持学院机电专业,本科结业落后入上海年夜学攻读机器工程专业研讨生。 咱们也有来由信任,中国科技翻新的故事曾经翻入了新一页。 参考材料 1. 揭秘DeepSeek:一个更极致的中国技巧幻想主义故事,暗涌Waves,作者:于丽丽 2. 全网都在扒的DeepSeek团队,是清北应届生撑起一片天,量子位 3. DeepSeek开创人梁文锋,广东人,仅靠百名中国顺序员,赶超OpenAI,CEO来信 本内容为作者自力观念,不代表虎嗅破场。未经容许不得转载,受权事件请接洽 [email protected]前往搜狐,检查更多
服务热线
400-123-4567