美国一高中生用AI做作业遭学校严惩

近日,美国一高中生使用生成式AI完成作业而引发纠纷的案件引起教育界的广泛讨论。

据美国知名科技媒体Ars technica报道,美国马萨诸塞州的高中生RNH(化名)因借助AI完成作业而被学校处罚,其父母哈里斯夫妇对此不满并提起诉讼,要求学校恢复孩子的成绩,遭美国联邦法院驳回,法院最终裁定校方处罚正确。

据报道,本案的主角是一名就读于美国马萨诸塞州Hingham高中的学生。2023年12月,该生在完成美国大学先修课程(AP)历史项目的作业时,复制并粘贴了在线AI工具生成的文本,且未在作业中注明这一点。

对此,学校方指出,虽然他们允许学生用AI来制定研究课题和搜索资料来源,但该生却未经选择地直接复制了AI生成的文本,包括引用不存在的书籍。从文档的修改历史上看,该生只花了大约52分钟,而其他学生则花了7到9个小时做这项作业。学校认为该生违反了学校的学术诚信规则,因此进行了相关惩罚,包括作业被判不及格,并被要求周六留校察看。这一处罚直接导致该生历史课成绩从B降至C+,也失去了其参加国家荣誉学会的选拔资格。

面对学校的处罚,哈里斯夫妇表示强烈不满,他们认为,学生手册中并未明确规定学生不能使用AI,“他们基本上是因为一条根本不存在的规定而惩罚他。”

哈里斯向美国地区法院马萨诸塞州分区法院提起诉讼,要求学校撤销对孩子的处罚。但该法院对双方提交的证据审理后,在本月驳回了诉讼请求。

法官认为,从目前的事实来看,没有任何初步证据表明老师在认定学生使用AI作弊方面过于草率。相反,学校在作出决定前进行了详细的调查,包括使用多个AI工具来检测作业、查看文档修改记录等。尽管学生手册中没有具体提到AI,但该校曾多次向学生强调了学术诚信的重要性。对于处罚,法官认为,“学校在处理此类学术不端案件时享有广泛的自由裁量权。”

该案件结果引发了关于AI在教育领域应用的广泛讨论。一方面,有人认为学校做法十分符合学术诚信的原则,维护了教育的公平性和公正性。“如果学生可以随意使用AI完成作业,那学术成果的真实性和可信度将大打折扣。”另一方面,也有部分人觉得学校的处罚过于严厉,缺乏灵活性,学校应该更多地引导学生如何合理使用AI,而不是简单地对其进行处罚。

2024年失败的三个AI产品,Meta的AI角色被点名

人工智能(AI)无疑是眼下最为炙手可热的前沿技术之一。无论是科技巨头还是新兴创业公司,都争先恐后地投身于这一领域,期望在激烈的市场竞争中抢占先机。然而,部分企业似乎陷入了盲目跟风的误区,仅仅为了搭上AI这趟快车,不顾技术与产品实际需求是否契合,导致一些AI产品难以经受市场考验,最终节节败退。

11月28日,美国知名新闻网站Mashable评选出2024年遭遇失败的三款颇具代表性的AI产品案例,其中包括Rabbit r1 AI语音助手、Meta的AI角色、Humane的Ai Pin。虽然这三款产品虽然对于中国消费者来说比较陌生,但这些产品的失败对于中国的AI创业者来说有参考意义,为此澎湃科技编译了该报道。

Rabbit r1 AI语音助手:从热卖到遇冷

Rabbit r1 

Rabbit r1在今年1月份首次亮相时曾引发抢购热潮,在短短两天内就售出了2万台。这款售价200美元的手持橙色设备号称借助大动作模型,可通过语音指令在手机应用中执行任务,如拍照、描述画面、推荐食谱、总结文本等,提供比手机更便捷、专注的用户体验。

Rabbit CEO杰西・吕(Jesse Lyu)指出,该产品旨在简化操作流程,用户无需打开应用程序,只需向r1下达指令,即可完成诸如叫车等操作。不少消费者被Rabbit r1的说法所吸引,对其AI技术应用寄予厚望,期待它能带来无缝交互体验。不过,也有部分消费者认为,这款设备功能有限,不能打电话、浏览网页,且需依赖手机才能实现完整功能,吸引力欠佳。

事实证明,Rabbit r1的很多功能还停留在概念阶段,在实际应用上暴露出诸多问题,比如系统漏洞、性能不稳定等,整体的用户体验远低于预期。此外,r1还被发现存在严重的安全漏洞,可能泄露所有设备历史响应记录,这使其声誉一落千丈。即便该公司有望改进技术,但其糟糕口碑已难以挽回,产品热度迅速消退。

据媒体报道,Rabbit r1是一款基于Android和ChatGPT的个人助理设备,由科技初创公司Rabbit Inc开发,该公司成立于2022年,总部位于洛杉矶。

Meta 的 AI 角色:尴尬收场的名人模仿秀

Meta 

2023年9月,科技巨头Meta推出AI角色项目,其核心是使用名人肖像的聊天机器人,例如模仿足球明星汤姆・布雷迪(Tom Brady)的形象,打造出一个“直言不讳的体育辩论者”Bru。Meta期望通过这些虚拟角色与用户互动,提供独特娱乐体验。

只是,AI角色并不是名人的AI版本。尽管Bru的个性与它所使用的名人面孔有微弱的联系,但也只是恰好长得像公众人物,与用户使用ChatGPT时看着名人照片的效果相差无几。

据报道,Meta为使用名人肖像权花费了高达500万美元,其互动效果却尴尬、怪异,与预期的有趣体验相差甚远,最终,该项目仅维持一年便宣告结束。Meta虽未明确解释原因,但表示从中学到了如何让AI更好服务用户的经验,暗示该项目未能达到预期市场效果。

Humane的 Ai Pin:技术与现实的落差

Humane

去年11月,Humane公司推出Ai Pin可穿戴设备,售价699美元。该产品号称是“智能手机杀手”,支持语音指令操作,无需手机就能实现拍照、录像、问答、信息发送等功能,试图通过创新设计重塑人机交互方式,“将AI融入日常生活”。

为此,Ai Pin采用了不少独特设计,如手掌投影仪取代屏幕、触摸板辅助语音操作,并且可以像胸针一样佩戴。但在发布前,该产品就问题频出。Humane的宣传视频中,Ai Pin两度答错问题,引发公众质疑,随后公司紧急修改视频。

今年4月产品发货后,用户评价也是普遍不佳,设备运行缓慢、音乐播放功能残缺、投影仪在强光下无法使用、发热严重等问题令人沮丧。此外,Ai Pin每月还需支付24 美元订阅费才能正常使用,否则如同废铁。更糟糕的是,该产品还被曝出电池因“质量问题” 存在 “火灾安全风险”,因此公司不得不建议用户停止使用充电盒。

市场反应冷淡,退货率居高不下,销量也是急剧下滑。据报道,尽管Humane上月将价格降至499美元,但消费者仍持观望态度,产品前景堪忧。此外,产品发布几周后,Humane公司就在寻找买家,试图以7.5亿至10亿美元的价格出售该业务。不过,鉴于产品差评如潮,这一目标也颇具挑战。

Humane 成立于2018年,是由前苹果设计和工程团队Imran Chaudhri 和Bethany Bongiorno 夫妇组成的团队创立,所以可以理解Humane 是一家夫妻店。

“还没挣到钱已经卷入价格战”,机器人卷向国外

一台协作机械臂售价2万元以下,继工业机器人之后,在国内发展不过十年时间的协作机器人也进入了价格战。日前,协作机器人鼻祖、丹麦机器人企业优傲机器人(UR)对外宣布,为提高机器人成本和价格竞争力,该公司在中国建立生产能力。

高工机器人产业研究所(GGII)所长卢瀚宸对澎湃科技表示,协作机器人国产化率充分,外部环境导致需求收缩,内资客户对于价格的导向过于明显,加剧供应商价格战,国产厂商以粗暴直接的方式争夺市场形成存量竞争。但内卷的本质是产品同质化,在技术方面没有形成代差。

与协作机器人不同,近两年兴起的人形机器人赛道由于产品尚未规模化,价格战还没出现,但“内卷”依然存在,只不过卷的是融资、品牌和供应商。卢瀚宸表示,当前人形机器人产业仍处于百花争鸣阶段,从产业发展规律来看,未来仅有少数厂商能够存活。2025年,收敛是一个重要关键词,企业不能无限扩散,而是要收敛自己的能力和投入,聚焦具体场景和落地应用。而协作机器人出清的阀门已经打开。

机器人厂商以简单粗暴的价格战来争夺市场形成存量竞争。

“内卷本质是同质化”

从2008年优傲机器人推出全球首台商用协作机器人,到2014年中国厂商陆陆续续开发出各类协作机器人产品,如今协作机器人已进入产业化进程中,协作机器人的市场化教育基本完成,能够满足诸多行业的应用需求,国产化率已接近90%。

高工机器人产业研究所所长卢瀚宸告诉澎湃科技,协作机器人行业内卷,很大程度上正是在国产化率充分的前提下,外部环境导致需求收缩,外资客户、中外合资客户的订单更多转为内资客户,内资客户对于价格的导向过于明显,加剧供应商价格战,国产厂商以这类简单粗暴的方式争夺市场形成存量竞争。

一位协作机器人企业创始人此前对澎湃科技表示,相比去年,今年机器人行业内卷更是“走火入魔”。在工业机器人领域,一台协作机械臂售价2万元以下,“市场价格没有最低,只有更低,很多销售价格实际上已经低于产品的材料价格了。”他表示,极致的价格内卷会牺牲产品质量和行业创新能力,最终反噬用户。

“在诸多细分赛道中,只要国产化率比较充分,结果就是内卷化程度更深,大部分厂商可能都还没有真正通过这个产品挣到钱,就开始打价格战,这是比较尴尬的事情。”卢瀚宸认为,内卷的本质是产品同质化,在技术方面没有形成代差。国产协作机器人与国外相比没有形成突出的技术差距,中国厂商也擅长以价格抹平技术上的差距,“在中国市场用这种方式行得通,但要出海就行不通了。从长远来看,必须回归产品本身、回到品牌、回到服务。”

谈及协作机器人行业的内卷,优傲全球首席商务官Stacey Moser说,不只是在中国,全球竞争在加速。竞争有助于推动市场进一步增长,有竞争证明技术有应用前景,竞争能够拓宽协作机器人应用范围。

人形机器人“卷”供应商

相对于协作机器人,人形机器人的发展阶段不同。人形机器人行业的发展不能以“内卷”一言蔽之。

卢瀚宸表示,当前人形机器人行业热闹、玩家众多,有赖于国内供应商,人形机器人的综合成本下降较快。但中国市场尚没有一家企业在产业化应用中实现闭环,人形机器人行业尚未实现产业落地。“相当于还没有真正实现规模化,就开始已经开卷成本了。”他认为,当前行业处于“焦灼”状态,如果说“卷”,“卷”的也是融资、品牌、供应商,卷的是人形机器人视频制作,“这对产业价值的体现可能不太明显,不能说没有价值,但我们不能停留在这个层面。”

国产人形机器人企业的一位工作人员表示,现阶段,国内人形机器人行业还远称不上内卷,内卷是指市场恶性竞争,与扫地机器人、工业机器人不同,人形机器人产业现阶段并不是成熟行业,大部分人形机器人公司近两年成立,产品处于demo阶段,现阶段聚焦的是寻求落地应用场景,这更像是一种有助于技术成熟的良性“卷”。

该工作人员表示,购买人形机器人的客户对产品的要求是能让人形机器人自主干活,无需远程人为操控,在工厂生产时也不影响产线安全生产,即便人形机器人价格高,也有厂商愿意买单,“并不是谁报的价格便宜,工厂就愿意采购谁。”他坦言,人形机器人产品落地交付,也并不是单纯靠技术,而在于要结合技术为客户提供完整解决方案,厂商更看重的是人形机器人的实际应用价值,即能否最大程度替代人工,提高生产效率。厂商对人形机器人的考量还集中在自主化、智能程度上。“传统工业机器人已经在该有的自动化领域发挥得非常好,对于人形机器人,厂商的要求还是集中在能否完成智能化和柔性化的生产,这是人形最大的价值。”

2025年,收敛是行业关键词

人形机器人产业化落地仍需时间。

卢瀚宸表示,目前业内在观望海外人形机器人的落地进展,这无疑会对中国厂商造成较大影响,一旦海外人形机器人实现落地,中国厂商将何去何从,这是更值得思考的问题。

国内厂商更擅长硬件,模型与系统开发较为欠缺,欧美厂商会把更多精力聚焦在软件和模型,这也是国内外机器人开发的主要差距,硬件和软件本身是密不可分的。卢瀚宸表示,人形机器人能力的提升有赖于软件能力的加强,高质量场景数据集会成为人形机器人落地的核心壁垒之一。

工业机器人研发及制造商上海捷勃特机器人有限公司董事长蒋耀此前在接受澎湃科技采访时表示,无论是工业机器人,还是人形机器人,机器人企业最终拼的是软件,软件早期投入大,但再生产成本低,未来工业大模型和AI算法将决定制造生态系统智能化的上限。

此外,从生态链的角度来看,卢瀚宸表示,当前极少厂商有能力包揽整机、大模型、系统、应用等机器人行业所有业务,对于创业公司而言,明确定位是更重要的,“把硬件做得足够好、足够高端、足够性价比,也是一个好定位。”对于人形机器人行业来说,2025年,“收敛”是一个关键词。卢瀚宸认为,企业不能无限扩散,而是要收敛自己的能力和投入,聚焦具体场景和落地应用。

人形机器人就像早年的造车新势力。当前人形机器人产业仍处于百花争鸣阶段,从产业发展规律来看,未来仅有少数厂商能够存活。“如果还能存在那么多企业,就说明这个行业还有很长的路要走,还有更多的事情要做。”卢瀚宸表示,而协作机器人出清的阀门已经打开。

蒋耀告诉澎湃科技,无论是工业机器人还是人形机器人,机器人行业要正向竞争,性能和性价比要做到国际一流,要依靠技术创新、自研能力和资源调度整合,回避红海,差异化竞争。

ChatGPT发布两周年,OpenAI“官司缠身”

ChatGPT的诞生加速了生成式人工智能领域的融资,但这一趋势的引领者OpenAI却因版权问题和转向营利性公司导致“官司缠身”,两周年生日过得似乎并不顺心。

美媒《商业内幕》12月1日报道,据CBInsights的数据,仅2022年-2023年,人工智能领域的融资增长了五倍。生成式人工智能热潮中最大的受益者是大型科技公司。彭博社报道,自2022年1月以来,标普500指数中的科技公司上涨了30%,而小型公司仅上涨了15%。同样,咨询公司也预计人工智能将在收入中占据越来越大的比例。波士顿咨询公司(Boston Consulting Group)的一位发言人透露,该公司有五分之一的收入来自人工智能,其中很大一部分工作是为客户提供生成式人工智能相关的咨询服务。麦肯锡(McKinsey)的人工智能相关业务目前占其总业务的近40%,而其中相当大的一部分正向生成式人工智能转移。

自ChatGPT诞生之日起,其版权问题和是否转向营利性企业导致的法律纠纷从未停歇。

彭博社消息称,埃隆·马斯克要求美国一法院阻止OpenAI“非法”转型为营利性企业。OpenAI的一位发言人表示,马斯克的申请“重复,且依然毫无根据”。

今年2月,马斯克提起诉讼,称其在为OpenAI的创立提供资金等支持时,与该公司两名联合创始人曾有协议,OpenAI应为“非营利组织”,但OpenAI违背了创始目标和使命,转而追求利润。6月,马斯克撤回这一诉讼,8月份又重新起诉。今年11月,马斯克对OpenAI提起的诉讼再度升级,指控OpenAI试图垄断生成式人工智能市场。

除此之外,OpenAI还面临着多起版权官司,加拿大多家主要新闻机构11月29日状告OpenAI未经许可使用加拿大媒体文章来训练人工智能聊天机器人ChatGPT。

据法新社报道,包括《环球邮报》(Globe and Mail)、加拿大广播公司(CBC)在内的六家媒体因“未经授权就使用其文章训练AI模型”,要求OpenAI予以每篇(未经授权就使用的)稿件2万加币(约合人民币10.35万元)的赔偿金。本案可能让OpenAI付出数十亿美元代价。

这是加拿大媒体首次因侵犯作品版权起诉OpenAI,上述媒体同时要求OpenAI今后停止此类行为。在回应加拿大媒体的指控时,OpenAI的发言人说,该公司“还没有机会审查这些指控”,但“我们的模型是在公开渠道数据的基础上训练出来的,立足于相关国际版权原则,这些原则对创作者是公平的,并支持创新”。

此前,美国《纽约时报》也曾以侵犯版权为由对OpenAI及微软提起诉讼。目前,该案仍在取证阶段。2024年4月,另有8家美国媒体加入对OpenAI和微软的起诉。

追问|手术治疗阿尔茨海默病?长期效果仍有待观察

·章一新医生不希望夸大这个手术的疗效,他说,这个手术并不能让患者的认知水平回归正常,并且手术的长期效果仍然有待观察,“现在随访时间最长的只有七八个月,需要等待更长时间的随访证据,和更大的样本量,以确认它的疗效。”

视频里,一名64岁的女士坐在镜头前,微微低着头,眼神低垂,直直地看着某处,像是在发呆。有人问她:“今天是几月几号?”“现在是什么季节知道吗?”“是哪一年知道吗?”她转了几下眼珠,张了张嘴巴,答不上来。但在手术后第3天,她再次坐在镜头前,已经能直视对面的提问者,且面带微笑。被问:“今天是星期几?”她回答说:“星期天。”又被问:“今天是几月几号?”她说:“几月几号就蒙住了,因为不上班。”回答问题时,她的手会擦擦自己的嘴,又捋捋自己的衣服。

这位女士是一名重度阿尔茨海默病(Alzheimer’s Disease, AD)患者,接受颈部淋巴管/结-静脉吻合术(Lymphaticovenous Anastomosis,LVA)后,多项症状明显改善。她的手术由上海交通大学医学院附属第九人民医院(以下简称“九院”)整复外科重建显微外科中心主任章一新教授团队开展。

2024年11月18日,章一新在接受澎湃科技采访时介绍,按照这个手术的原理,阿尔茨海默病与大脑中的淋巴循环障碍有关,大脑中的代谢废物——尤其是病理性蛋白排出减少,在大脑中累积,损害神经细胞,导致阿尔茨海默病的进展。“人体有血液系统和淋巴系统两套系统,它们都是人体代谢废物排出的通道。”章一新说,“我们在颈部动手术——它是连接大脑和身体的枢纽,搭个桥,把原先回流不畅的淋巴通路引流到血管,使得大脑中的代谢废物更加顺畅地排出。”

手术治疗阿尔茨海默病的原理

九院的淋巴外科由张涤生院士在上世纪五六十年代创立,是九院整复外科的王牌特色专科之一,这也让颈部淋巴管/结-静脉吻合术进入章一新的视野。章一新说,他们在两三年前就已经关注到这个手术,当时,一家民营医院的院长称这个手术可以改善阿尔茨海默病症状,大家几乎都是怀疑的,章一新也不例外。关注一段时间后,他在录像中看到治疗的效果不错,于是他们团队也开始研究,查找相关文献后,他们认为手术的原理和结果相吻合。经过将近一年的伦理审批,2024年2月,他们启动了一个研究性项目,开始招募患者。“我们也对原来的手术方式进行了改良。”他说,“我们对颈部解剖很熟悉,相同的术式我们过去在四肢也做,只是换了一个部位,因此难度不大,手术的损伤不大,出血也很少。”

2024年11月13日,美国神经内科执业医生朱建华撰文介绍该手术的起源:“2015年,硬脑膜存在淋巴系统被正式认可,一群美国华盛顿大学的神经科学家把它发表在世界顶级杂志《自然》。进一步研究发现尸体解剖中有老年或AD病人的硬脑膜淋巴系统损害;动物模型中堵塞硬膜淋巴可以导致小鼠脑功能紊乱。今年2月,中国海南大学周非凡实验室在《自然-通讯》发表文章,用红外线照射来增加老年小鼠的硬膜淋巴引流,发现对这些小鼠的认知能力有一定改善。今年6月,上海交大李霞博士及小组在英国医学杂志的老年精神病刊上报告了一个病人的手术结果。这是一个比较完整的试验,包括伦理认证,病情定性、术前和术后的影像证据,术前术后的临床评估和家人的报告。这是一个淋巴-颈静脉对接,总结止于术后5周。”

对于手术的原理,朱建华保留怀疑态度。“大脑本身并无淋巴系统。在大脑外面有三层膜,由外至内是硬脑膜、蛛网膜和紧贴大脑的软脑膜。在硬膜(最外层)上的确有淋巴系统存在,它的作用存在争议,它和大脑实质之间还存在2道屏障。如果使硬膜上的淋巴系统加强引流,或许可以多清除一些大脑代谢产生的废物,比如经过千折百难才到达硬膜的淀粉样蛋白。”他写道,“但是,淀粉样蛋白对AD的致病影响并非唯一,也很可能是多因素中的一种,多清除一些并不会对AD的治疗起到巨大和立即的作用。”

阿尔茨海默病是一种起病隐匿、呈进行性发展的神经退行性疾病,临床特征主要为认知障碍、精神行为异常和社会生活功能减退。据美国阿尔茨海默病协会(Alzheimer’s Association)数据,全球约有5500万人患有阿尔茨海默病和其他痴呆症。AD患者的大脑有两个主要特征:β-淀粉样蛋白的斑块和由tau蛋白形成的缠结。章一新说,“我们还不明白阿尔茨海默病的具体机制,但是淋巴循环的机理讲得通。”

需更大的样本量、更长的随访确证疗效

近两年,日本卫材药业(Eisai)和美国渤健公司(Biogen)联合开发的阿尔茨海默病新药Leqembi,和美国药企礼来(LLY.US)的阿尔茨海默病新药Kisunla相继上市,可延缓早期阿尔茨海默病患者的认知障碍进展。但对于中重度患者并没有体现出明显疗效。截至目前,阿尔茨海默病仍然不是一种可以治愈的疾病。

章一新告诉澎湃科技,目前有将近30名患者接受了手术,大部分是中重度阿尔茨海默病患者。“轻度的阿尔茨海默病患者症状较轻,接受手术的愿望就不强烈,手术后症状的改善也会很轻微。中重度的阿尔茨海默病患者及家属有很迫切的改善症状的愿望,因为很多患者已经不能行动,都不认识人了,手术后,改善就会很明显。”

“现在看到的效果是,每个人的症状都能改善,但是有的人改善得多,有的人改善得少。手术能够减缓阿尔茨海默病的进程,甚至有可能让病情不再进展。”章一新说,这取决于大脑中还有多少功能良好的神经细胞,“病理性蛋白对神经细胞的损害是不可逆的,如果损害太多,手术的改善就没那么明显。所以建议早做。”

他记得第一位接受他手术的患者来自上海,那位患者手术后的第二天,记忆就出现改善,能够认出照顾自己的亲属,认字和算数能力也有明显进步,走路变得更加敏捷,精气神也不一样了,原本木讷的面部也有了更多表情。

但是章一新不希望夸大这个手术的疗效,他说,这个手术并不能让患者的认知水平回归正常,并且手术的长期效果仍然有待观察,“现在随访时间最长的只有七八个月,需要等待更长时间的随访证据,和更大的样本量,以确认它的疗效。”

国内很多地方的整形科、手外科、烧伤科等早早就开展了颈深淋巴-静脉吻合手术。例如,据“中南大学湘雅医院骨科”公众号2024年3月24日消息,该院手显微外科唐举玉教授团队为一位86岁的阿尔茨海默病患者开展颈深淋巴-静脉吻合手术,术后该名患者的阿尔茨海默病症状有效缓解。“郑州市第一人民医院”公众号2024年9月12日消息称,该院烧伤修复重建显微外科狄海平主任团队与神经内科认知功能障碍病区李艾帆主任团队联合章一新教授团队共同为2位阿尔茨海默病患者开展颈深淋巴-静脉吻合手术。

近期也有很多神经外科和神经内科开展该手术的消息被报道。公开信息显示,2024年7月,山东省蓬莱人民医院神经外科主任刘元东团队开展了治疗阿尔茨海默病的“颈深淋巴-静脉吻合术”;2024年8月,贵州省遵义市第一人民医院神经外科诊疗中心付晓红博士等团队为一位77岁的患者实施贵州省首例阿尔茨海默病“颈深淋巴-静脉吻合”手术;2024年9月,哈尔滨医科大学附属第二医院神经外科主任郭冕教授、河北医科大学附属第二医院神经外科吴建梁教授、杨利军主任医师团队联合神经内科董梅教授团队、上海市浦东新区浦南医院神经外科主任赵江团队也开展了同类手术。

“世界模型”究竟是什么?会成为人工智能的下一个前沿领域吗?

·世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。

·尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。此外,世界模型也存在幻觉问题。

近年来,人工智能(AI)领域涌现出一种被称为“世界模型”(World Models)或“世界模拟器”的新概念,被一些行内人士视为AI的下一个重大前沿。AI领域的领军人物李飞飞创立的World Labs(世界实验室)已筹集了2.3亿美元资金,致力于构建“大型世界模型”(LWM);与此同时,谷歌DeepMind也聘请了OpenAI视频生成器Sora的创造者之一,参与“世界模拟器”的研究。

什么是“世界模型”?近日,科技媒体TechCrunch的高级记者凯尔·威格斯(Kyle Wiggers)撰文,梳理了关于“世界模型”的一系列问题,以下是澎湃科技(www.thepaper.cn)编译。

什么是世界模型?

世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。

AI研究人员大卫·哈(David Ha)和尤尔根·施米德胡伯(Jürgen Schmidhuber)以棒球击球手为例,论述了击球手只有几毫秒的时间决定如何挥棒,这比视觉信号传递到大脑的时间还短。他们之所以能击中时速160公里的快速球,是因为他们能本能地预测球的位置。

两位研究人员写道:“对于职业选手来说,这一切都是在潜意识中完成的。他们的肌肉会反射性地在正确的时间和位置挥棒,与其内在心智模型的预测一致。他们可以快速根据对未来的预测而采取行动,但无需有意识地推演可能的未来情景以制定计划。”

正是这种世界心智模型的潜意识推理能力,让一些科技研究者认为,世界模型是实现人类级别智能的前提。

世界模型有哪些应用潜力?

尽管这个概念已经存在了几十年,世界模型最近因其在生成式视频领域的应用而备受关注。目前,大多数AI生成的视频都会陷入“恐怖谷”现象,观看时间稍长就会出现画面崩坏,如四肢扭曲或融合。

传统的生成式模型可能能够准确预测篮球会弹跳,但并不真正理解其中的原因,就像大型语言模型实际上是基于神经网络的概率推理,给出最可能符合读者预期的答案,而非真正理解词语和短语背后的意义。然而,具有基本物理认知的世界模型将更善于展现“篮球的真实弹跳”。

为了实现这种洞察力,世界模型需要在大量的照片、音频、视频和文本数据上进行训练,旨在创建对世界运作方式的内部表征,并具备推理行动后果的能力。

Snap前AI主管、现Higgsfield公司CEO亚历克斯·马什拉博夫(Alex Mashrabov)表示:“观众期望他们观看的世界与现实相似。如果一根羽毛以铁砧的重量下落,或者保龄球飞上数百英尺的高空,这会让观众出戏。有了强大的世界模型,创作者就无需定义每个物体的运动方式——这既繁琐又低效——因为模型将能够自行理解原理。”

然而,改进视频生成只是世界模型的冰山一角。包括Meta首席AI科学家杨立昆(Yann LeCun)在内的研究人员认为,这些模型未来可用于数字和物理领域的复杂预测和规划。

在今年早些时候的一次演讲中,杨立昆描述了世界模型如何通过推理来实现目标。一个具有基础“世界”表示(例如一段脏房间的视频)的模型,给定一个目标(干净的房间),可以推导出一系列行动(使用吸尘器、清洗餐具、倒垃圾)来实现目标。这并非因为它观察到了这种模式,而是因为它在更深层次上理解了事物如何从脏到净。

“我们需要能够理解世界的机器;具备记忆、直觉和常识的机器——能够像人类一样推理和规划的机器,”杨立昆表示。“尽管你可能听到一些最热情之人的吹嘘,但当前的人工智能系统并不具备这些能力。”

虽然杨立昆估计我们距离他设想的世界模型至少还有十年的时间,但当今的世界模型已经显示出其作为基本物理模拟器的前景。

OpenAI 在一篇博客中认为 Sora 是一个世界模型,可以模拟画家在画布上留下画笔笔触等动作。像 Sora 这样的模型——以及 Sora 本身——也可以有效地模拟视频游戏。例如,Sora 可以渲染类似 Minecraft 的UI和游戏世界。

World Labs 联合创始人贾斯汀·约翰逊(Justin Johnson)在a16z播客的一集中表示,未来世界模型可能能够按需生成3D世界,用于游戏、虚拟摄影等。

“我们已经有能力创建虚拟的交互式世界,但这需要花费数亿美元和大量的开发时间,”约翰逊表示,“‘世界模型’不仅可以让用户获得图片或视频片段,还可以获得一个模拟效果完备、充满活力的交互式 3D 世界。”

实现世界模型面临哪些技术挑战?

尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。虽然一些最新的语言模型可以在现代智能手机上运行,但Sora(多少算一种早期世界模型)需要数千个GPU来训练和运行,尤其是在其使用变得普及的情况下。

世界模型和所有AI模型一样,也会产生幻觉,并内化训练数据中的偏见。一个主要由欧洲城市晴天视频训练的世界模型,可能难以理解或正确描绘韩国城市的雪景。

亚历克斯·马什拉博夫指出,训练数据的匮乏可能会加剧这些问题。“我们已经看到模型在生成某种类型或种族的人物时受到限制,”他说。“世界模型的训练数据必须足够广泛,以涵盖多样化的情景,同时也要足够具体,使AI能够深入理解这些情景的细微差别。”

AI初创公司Runway的CEO克里斯托瓦尔·瓦伦苏埃拉(Cristóbal Valenzuela)在最近的一篇文章中表示,数据和工程问题阻碍了当前模型准确捕捉世界中生物(如人类和动物)行为的能力。“模型需要生成一致的环境地图,”他说,“并具备在这些环境中导航和互动的能力。”

世界模型能为具身智能提供技术基础

如果所有主要障碍都被克服,亚历克斯·马什拉博夫认为,世界模型可以“更稳定地”将AI与现实世界连接起来,不仅在虚拟世界生成方面,而且也在机器人技术和AI决策方面取得突破。

这也可能催生更强大的机器人。如今的机器人在功能上受到限制,因为它们缺乏对周围现实世界(或自身身体)的意识。世界模型可以为它们提供这种意识,至少在一定程度上可以。

“有了先进的世界模型,AI可以对其所处的任何情境形成自身的理解,”他说,“并开始推理出可能的解决方案。”

世界模型能够为人工智能提供理解真实的三维物理世界的能力,使人形机器人真正感知真实世界,对具身智能的实现具有重大意义。

自主研制+最大直径,我国又一超大直径盾构机“江海号”下线

10月31日,一台最大开挖直径达16.64米的超大直径盾构机在湖南长沙下线,将应用于目前世界最长公路水下盾构隧道——海太长江隧道施工。这是我国迄今自主研制的最大直径盾构机,标志着国产超大直径盾构机产业化取得新突破。

“江海号”将应用于海太长江隧道施工

这台盾构机取名为“江海号”,由中国铁建重工集团、中铁十四局集团联合打造,整机长约145米,总重量约5000吨。记者在现场了解到,“江海号”是以海太长江隧道工程跨越长江、毗邻大海两个意向融合命名,其刀盘涂装有向前进击的蔚蓝色巨浪,寓意着盾构机将聚力潜行、通达江海。

海太长江隧道位于江苏省长江入海口区域,北起南通海门区,南至苏州太仓市。工程线路全长39.07公里,过江隧道长11.185公里,采用双向六车道高速公路设计标准,设计速度为100公里每小时。其中盾构隧道段长9315米,最大开挖直径达16.64米,沿线需穿越淤泥质粉质黏土夹粉土与粉细砂复合地层等复杂地质带,最大埋深约75米,最高水压达7.5巴,具有超长距离、超大直径、超高水压、超大埋深、复杂工况等特点。

“江海号”将面临多项挑战

中铁十四局海太长江隧道项目高级工程师宋欢介绍,盾构机将在长江水下完成超长距离独头掘进,特别是在穿越长江及两岸大堤时,沉降要求控制在1厘米之内,施工难度大,且江中地质勘探覆盖的区域有限,不可控的未知区域多,犹如“摸石头过河”。超16.6米超大直径意味着盾构机刀盘开挖所需扭矩大,对主驱动轴承负载大;7.5巴超高水压对主驱动密封、盾尾密封等部件的承压能力要求高,在保持较高性能负载的前提下,如何保证整机在江底复杂环境中连续掘进9315米是研制团队面临的主要挑战和难题。

中国铁建重工集团掘进机研究设计院高级工程师范瑞强介绍,针对项目施工风险和难点,研制团队通过创新攻关,在刀盘刀具、主驱动等关键部件上采取针对性设计,配置具有常压换刀功能的软土刀盘和合金大、硬度高、覆盖广、耐磨强的切削刀具,主驱动配置伸缩功能,可感知刀盘整体受力,有效避免特殊情况下刀盘异常受力造成的主轴承过载,方便换刀作业、辅助刀盘脱困,并配置主驱动状态监测系统,对主驱动运行状态进行连续监控。同时,因地制宜设计盾体外形尺寸、结构厚度,增大油缸规格,优化泥浆环流系统和注浆系统等,强化整机性能,配置管片连接构件智能拼装系统,满足工程施工需求。

据介绍,研制团队还结合多年来在水下和大直径盾构隧道施工经验,通过加大盾构机刀盘开口率,配置高压力、大流量的中心冲刷系统及刀盘结泥饼预警系统,并搭配伸缩摄像装置,无需人员带压进舱即可观察刀盘工作区域情况,有效判别和降低刀盘结泥饼风险,提高底部排渣效率。同时还应用自主研发的第四代同步注双液浆技术,实现盾构隧道沉降的毫米级精度控制,保证施工安全及效率。

我国超大直径盾构机研制实现新跨越

据了解,业界通常把14米及以上直径盾构机称为超大直径盾构机。“江海号”是继直径16.07米“京华号”成功下线并应用后,我国企业自主研制的又一超大直径盾构机。“江海号”的成功下线,标志着我国企业在16米级超大直径盾构机研制和应用领域实现新跨越,已形成超大直径盾构机全产业链产业化发展能力。

海太长江隧道是《长江干线过江通道布局规划(2020-2035年)》和《江苏省长江经济带综合立体交通运输走廊规划》重点推动建设项目,也是江苏“十四五”重点推进的过江通道项目,计划于2028年基本建成。建成后,可以有效分流苏通长江大桥的流量,对落实长三角区域一体化发展和长江经济带发展国家战略,优化长江干线过江通道布局,推动沿江城市群跨江融合发展等具有重要意义。

OpenAI硬件战略调整,计划2026年起生产自研AI芯片

10月30日,据路透社报道,OpenAI将进行硬件战略调整,旨在优化计算资源和降低成本。OpenAI将引入AMD的MI300系列芯片,同时继续使用英伟达(Nasdaq:NVDA)的GPU。此外,OpenAI还与博通(Broadcom Inc.)和台积电(TSMC)合作,计划于2026年开始生产自研的定制AI芯片。

路透社在报道中提及,OpenAI已组建了由约20名工程师组成的芯片开发团队,其中包括曾参与谷歌Tensor处理器项目的高级工程师。但是,按照OpenAI目前的时间表,定制芯片的真正生产预计要到2026年才能实现。

OpenAI此前主要依赖英伟达的GPU进行模型训练和推理。目前,英伟达的GPU占据超过80%的市场份额,但芯片短缺、英伟达AI算力卡供不应求、成本上升等问题导致OpenAI正寻求替代方案。

通过引入AMD的MI300系列芯片,OpenAI不仅能够确保高性能计算,还能分散供应风险。

除了引入AMD芯片,OpenAI 正在与博通合作开发新的定制芯片,旨在处理其用于AI推理的大型负载,并与台积电合作以确保具备芯片制造能力。

OpenAI原本计划建立一个芯片制造厂网络,但由于成本和时间限制,这项计划已暂时搁置。目前OpenAI将重点投入内部芯片设计,与博通和台积电等行业伙伴合作,以确保芯片供应的稳定性。

训练像ChatGPT这样的AI模型成本高昂。根据此前报道,OpenAI预计今年将亏损50亿美元,而收入为37亿美元。计算成本,即处理大规模数据集和开发模型所需的硬件、电力和云服务费用,是该公司最大的支出。

目前,英伟达的GPU占据了超过80%的硬件市场份额。由于芯片供应短缺和价格上升,促使OpenAI开始探索AI硬件的内部开发或外部替代方案。这一策略与亚马逊、Meta、谷歌和微软等科技巨头相似,即通过定制芯片降低成本并确保AI硬件的获取渠道。但是,谷歌、微软和亚马逊在这一领域的努力已经领先了几个阶段,OpenAI可能需要大量资金才能具备真正的竞争力。

今年10月,OpenAI刚完成66亿美元(约合人民币463亿元)新一轮融资,该轮融资由Thrive Capital领投,微软、英伟达、Altimeter Capital、富达基金、软银及阿布扎比国家支持的MGX投资公司参投,投后估值达1570亿美元。OpenAI希望利用这些资金加强算力资源,持续扩展其AI工具和技术研究的能力。

过赤道了,“雪龙2”号驶入南半球

由自然资源部组织的中国第41次南极考察队在本月初从广州正式出征,奔赴南极。考察队分别搭乘“雪龙”号和“雪龙2”号科考船,由于两船船速不同,今天上午(6日),“雪龙2”号刚刚穿越赤道。

目前,“雪龙”号和“雪龙2”号已经先后穿越赤道,下一步,两艘船都将面临南半球西风带的考验。

燧原科技创始人张亚林:AI发展的关键目标是要让大家都用得起

·由于国内人工智能算力产业起步较晚、基础较差,目前国产AI算力能否真正被使用且易用,这是国产算力芯片面临的重大挑战。

张亚林指出,算法迭代和应用更新是推动AI前进的原动力,没有算法和大模型的持续更新和迭代,以及各种应用场景的层出不穷,人工智能的发展依然可能是昙花一现。真正的AI公司必须通过深度结合场景,打造高性价比产品,以实现人工智能的广泛应用。他认为,当前AI算力能否真正被使用并易用,这是国产算力芯片面临的重大挑战。

燧原科技创始人张亚林

在创立燧原科技之前,张亚林曾在AMD工作了11年,他带领AMD上海研发中心成功开发并量产多颗旗舰处理器;近日,张亚林获得了2023年度上海市科学技术奖青年科技杰出贡献奖。

张亚林表示,从技术发展角度来看,大模型让人工智能实现了从感知和判断到生成和创造的巨大跨越,正在快速重塑数字时代的发展模式。

人工智能要落地,必须通过与场景的深度结合,进行系统化、集约化的赋能,打造高性价比的产品。举例而言,可以通过AI技术对目前已有的互联网应用进行深度赋能和升级,打造出更好的性价比和商业回报,进一步增加用户的黏性和付费意愿,让广告、推荐、搜索等高回报率的应用进一步深入人心。这样的方式才能真正实现人工智能第一波的应用落地。

张亚林认为,现在的人工智能离真正能够带来的社会价值、生产力价值和商业价值,还有一定的距离。人工智能现在依然是一个赋能型的工具,还没有真正达到高层次的人工智能,还是处在一个协助赋能的阶段。但他预测,在未来的十年内一定会有超级人工智能,或者更高级的通用人工智能出现。到那个时候,可以指望人工智能不仅仅是赋能,而是真正有效地解决人和企业的运作问题。

伴随商业化应用不断向纵深推进,大模型推理市场被大大拓展和激活,也随之带来了智能算力需求的增加。AI训练要求高性能、高存储、高带宽,追求极致计算能力;而AI推理算力要求高效能、低功耗、低延时,追求极致性价比。

由于国内人工智能算力产业起步较晚、基础较差,目前国产AI算力能否真正被使用且易用,这是国产算力芯片面临的重大挑战。在国产化替代的大背景之下,破除产业壁垒,加强协同合作,构建合作共赢的AI算力生态体系是必经之路。以原始创新的软硬件架构开发产品,这是唯一正确且必须坚持的路线。

今年5月,由燧原科技产品提供支撑的宜昌点军智算中心实现运营。张亚林指出,智算中心是一个至少3-5年长周期的落地运营过程,需要投建方、运营方、使用方一起合作共赢。在张亚林看来,人工智能这些年的发展,早已从底层的芯片,走向了一个集成的系统。“这样一个大的系统,需要从十几个维度统筹去解决问题。我们认为一个公司必须把核心的领域掌握在自己手里,比如成本结构掌握在自己手里,把整个系统的设计链条成本降到最低,复杂度降到最低,最终才能产生一个最佳性价比的产品。”