被“减弱”的英伟达,此次又想蹭呆板人的热度
栏目:公司资讯 发布时间:2025-02-01 09:01
前阵子,老黄在 CES 上又狠狠秀了波肌肉。不外呢年夜少数人,基础都被全新的 RTX 50 系显卡给吸住了,世超这两天研讨了下发明,那些被咱 “ 冷清 ” 的新技巧里,一个两个实在也都憋着年夜招。就拿 Cosmos 天下基本模子平台来说,这但是个让 AI 可能懂得物理天下的好货色。 依据官方的说法, Cosmos 平台是一个专门为物理人工智能开辟者计划的平台。这又是物理人工智能,又是开辟者,打眼一看,似乎跟咱也没啥太年夜关联。但年夜伙儿先别焦急,此次 Cosmos 一宣布,技巧讲演一甩,有些报道的题目曾经用上了 “ 开启物理 AI 年夜时期 ” 如许的字眼,连老黄都说 “ 呆板人的 ChatGPT 时辰行将到来 ” 。 而世超也去翻了翻 Cosmos 的技巧讲演,这么说吧, Cosmos 就比如物理 AI ( 呆板人、无人车等 )的 “ 黄埔军校 ” ,我们当前能不克不及指望呆板人养老,它说不定能帮上年夜忙。 我们能够简略把 Cosmos 平台,当成一个东西箱,里边儿大略集成了天下基本模子 ( WFM ) 、高等分词器器、保险护栏以及减速数据处置管道这么多少个 “ 东西 ” 。前面那多少个专业名词没据说过没关系,但模子总该晓得是啥吧。此次,英伟达一口吻在 Cosmos 上宣布了 8 个天下基本模子,并且都是基于 2000 万小时的视频练习出来的,参数目从 40 亿到 140 亿不等,依据差别场景的利用需要,还能够分为 Nano 、 Super 跟 Ultra 三种。看着唬人,但天下基本模子,跟我们熟习的图像、视频天生模子差未几,是 天生式 AI 模子。只不外它天生的货色并不是视频那么简略,更正确的说,当你输入文本、图像、视频或许活动数据当前,天下基本模子天生的是 有物理法则的 “ 场景 ” 、 “ 情况 ” 。实质上,就是分解出高度仿真的数据,来实现物理 AI 跟虚构情况的交互。至于其余的什么高等分词器、保险护栏跟减速数据处置管道,咱懂得个大略就行。像高等分词器能够把庞杂的数据简化,给数据划重点。保险护栏就更好懂得了,就是避免无害的输出,维护隐衷。别的, Cosmos 还用到了一个 “ 先预练习再后练习 ” 的方法。大略意思是,预练习阶段先给模子喂年夜范围的实在视频数据,最少要让模子晓得物理天下究竟是咋运行的。接着,后练习阶段再详细成绩详细剖析,对预练习模子停止微调,满意特定义务的需要。总之就是, Cosmos 平台经由过程种种技巧手腕,为物理 AI 构建出了 一个跟事实物理天下相似的空间跟交互情况。不外说了这么半天,可能有差友仍是没太清楚,这玩意儿究竟能用来干啥。实在这个成绩,老黄曾经在宣布会上讲得很明白了,就是呆板人跟主动驾驶汽车。拿呆板人行业来说,为啥这么多年了始终没啥年夜冲破, 很主要的一个起因就是缺数据。跟年夜言语模子不太一样,呆板人练习须要的数据不仅是笔墨、图像那么简略,由于呆板人要感知这个天下,还要跟这个天下发生交互,以是它就得进修物理法则、静态变更。但这些数据,偏偏是最难网络的。仍是拿呆板人洗碗举例,看似举措很简略,但呆板人想学会你得有视觉数据,比方餐具的外形巨细、油污水平,另有抓放碗的力度、用多鼎力气擦洗这些力学数据,固然,洗碗进程中手臂挪动、抓取角度的调剂,包含一些庞杂的静态要素,也须要网络、标注数据。像之前的斯坦福 Aloha 家务呆板人,仍是开辟者经由过程亲自树模 “ 遥控 ” 呆板人实现指定举措,来网络数据。以是这个时间, Cosmos 就派上用处了。模仿出一个洗碗情况,不就相称于,提前给呆板人预习了一遍事实天下,等模子班师了,再放到事实天下去实操。如许一来, 练习效力上去了,本钱也能把持住。依照英伟达官方的先容,当初曾经有一局部呆板人跟主动驾驶公司用上了 Cosmos 。OpenAI 投的那家 1X ,用 Cosmos 来给呆板人做静态计划。小鹏也用 Cosmos 来分解种种气象跟路况的数据,练习主动驾驶算法。固然了,精准模仿事实天下只是幻想状况下的 Cosmos ,包含技巧讲演里也提到,现阶段的天下基本模子还比拟晚期, 天生的视频并不完整合乎物理法则。该说不说,世超当初也感到走天下模子这条路,确切有搞头。假如有一天, AI 能对事实天下停止模仿乃至是一比一复刻,并像我们人一样懂得天下、做出决议,这才更切近我们人类对人工智能的冀望。客岁,包含 Lecun 、李飞飞这些 AI 年夜拿,另有谷歌 Deepmind ,实在都在研讨天下模子。世超盲猜一波,往年活着界模子跟呆板人范畴里,可能会呈现冲破性的停顿。但不论成与不成, 善于 “ 卖铲子 ” 的英伟达,都是谁人最年夜赢家。撰文:西西编纂:江江 面线 美编:子曰 图片、材料起源:NVIDIACosmos World Foundation Model Platform for Physical AI局部图源收集前往搜狐,检查更多
服务热线
400-123-4567