在刚刚落幕不久的世界人形机器人运动会上,一场全程无遥控、踢足球机器人在网络上火了。
这支踢足球的机器人队伍来自加速进化(北京)机器人科技有限公司(以下简称“加速进化”,英文名:Booster Robotics),这家成立于2023年的公司在今年7月举行的2025 RoboCup巴西机器人足球世界杯上,帮助中国队(清华火神队)首次在AdultSize 组别(人形机器人足球成人组一米以上机器人)组别夺冠,一举打破了欧美国家在该项顶级赛事上长达 28 年的垄断。
加速进化机器人在足球场上的表现
为什么要让机器人上场踢足球?实现无遥控操作机器人踢足球的关键挑战是哪些?
近日,澎湃科技(www.thepaper.cn)专访了加速进化副总裁赵维晨。赵维晨解释说,之所以将目标对准了足球赛事,是因为足球赛是一个高动态、强对抗、对运动控制和决策智能要求极高的场景。
加速进化副总裁赵维晨 受访者供图
赵维晨认为人形机器人必须先做到“四肢健全”,再追求“心智健全”,足球场景是锻炼机器人的运动能力、感知算法等关键技术的试金石,这些能力提升后都能迁移到未来的家庭陪伴、教育等更多场景。
谈及技术路径,赵维晨直言,当前引发热议的VLA技术路径仍是建立在大语言模型的逻辑之上,过于依赖海量标注数据和固定模式,并不是最优解,三到四年内一定会被颠覆。
以下是澎湃科技专访内容:
VLA算法未来三年内会被全颠覆
澎湃科技:足球赛对人形机器人有哪些技术挑战?
赵维晨: 人形机器人必须先做到“四肢健全”,再追求“心智健全”。有了强大的运动能力的支撑,大脑算法可以先用相对简单的分层模型落地应用,通过落地应用采集到真实场景的数据,结合合成数据,才能逐步训练出认知健全的大脑,这与人类的成长路径相似。
足球场景能锻炼机器人的运动能力、感知算法,比如识别球、队友和对手位置等、定位导航和决策逻辑,将来这些能力能迁移到家庭场景,譬如机器人能主动迎接、跟随,情感陪伴,充当互动教练,以及实现工业场景里精细的手部操作。
澎湃科技:实现无遥控人形机器人参与踢足球的难度有多大?
赵维晨:足球赛事对抗激烈,机器人需要强大的运控算法来抵御冲撞并保持平衡,摔倒后可在一秒内自主起身。我们率先应用端到端运动大模型,直接将视觉信号输入神经网络,输出关节控制指令,大幅提升运动泛化性和稳定性。第一个应用是大力射门:去年世界冠军最高踢到35厘米,我们能踢到2米,直接越过人墙。
澎湃科技:你们的训练数据主要来自哪里?
赵维晨:主要来自足球场景采集真实的物理数据,并结合视频合成数据,通过最新的模仿学习加强化学习实现视觉信号直接输入神经网络。
我们认为,遥操的数据体量无法支撑具身大脑的训练,目前视觉语言动作模型(VLA)算法还是基于大语言模型那套,未来三年内会被全新的底层算法体系颠覆。
澎湃科技:今年北京的世界机器人大会上关于视觉语言动作模型(VLA)有很多争议你们怎么看?
赵维晨:自动驾驶单日数据量可达上亿条,而全国具身最大的开源数据集规模才百万级别(不到10TB),大语言模型是靠几十年互联网上的文本数据累积,而机器人加上双轮双臂操作10万或100万小时,根本不可能训练出一个多模态具身大脑,只能验证早期算法框架。具身智能真正的路径与自动驾驶类似,先通过L1、L2、L3再落地收集大量真机数据,然后再逐步迭代到AGI。
技术层面,我们认为,视觉语言动作模型(VLA)不是最终解,它仍是基于Transformer的LLM逻辑。大语言模型迭代经历十多年海量语料,才形成如今的尺度定律(Scaling Law)。VLA模型总体依赖训练数据中的固定模式,需要海量标注数据才能“记住”固定场景,很难帮具身泛化。
现在所有的技术方案,未来三到四年一定会被颠覆,也会出现类似DeepSeek这样的鲶鱼效应、开源的方案。
机器人进入家庭还需要10年
澎湃科技:2024年10月你们的BoosterT1发售,现在销售情况如何?客户主要是谁?
赵维晨: 销售没超出预期。2025年我们上半年出货交付了数百台,其中50%是全球化订单,主要集中在赛事和科研。顶尖球队采购我们的机器人软硬件平台,用于开发和测试决策算法。足球也是开发者入门的理想场景,从入门到精通,甚至能发表顶级论文,打赢人类至少100篇顶刊。
澎湃科技:你们会担心订单量吗?
赵维晨:对我们来说,最核心的不是订单量,而是交付量。我们现在T1成本价在10万元人民币左右,很多公司签署了大量“意向订单”,但如果没有量产的工程化能力,没有交付能力,旧不是真的商业化。我们的订单交付周期在15到20天左右。
未来我们的商业化路径也很清晰:短期做赛事、科研、教育(比如高校和K12的机器人课程)、这是百亿级赛道;中期从明年开始,切入家庭搬运、陪伴这些场景,目标千亿级市场;长期结合开发者生态往家庭管家、智能助理这些通用机器人方向走,那是万亿级市场。
澎湃科技:目前投资人最关心你们的是哪几个问题?
赵维晨:比较关心我们的应用Agent生态建设,硬件量产进度,全球化进度,以及运控算法在全球市场的领先程度。其他很多问题上面有覆盖。
具身智能大模型还没有显著的共识
澎湃科技:在你们看来,人形机器人走进家庭场景要经过哪些场景和技术验证?
赵维晨:我们很明确不做工业场景,因为简单任务已经被传统机械臂解决了,剩下的要么太难,五年内落不了地,要么市场太小。轮加双臂结构早在5年前就有成熟的舵机高性价比解决方案,能够解决大多数封闭工业场景的需求。
我们重点会放在家用机器人,让它成为除手机、电脑外新的交互形态和生产力工具,要对标苹果和微软,做三件事:硬件(端)、操作系统、开发者工具。就像手机电脑得有应用才能普及,机器人要进家庭,也得有第三方开发者基于开放生态、简单工具和操作系统开发应用,实现各种家用场景的落地,尤其是后两者涉及大量软件的投入。
大脑层面我们不着急,等三年后技术路线收敛些,我们有了一定收入体量再投入。
澎湃科技:是否可以理解为,你们也在等一个适配机器人的AI大脑?
赵维晨:我们认为端+操作系统+开发工具是个万亿美元的市场,大脑也是万亿美元的市场。但作为创业公司我们目前不会投入在大脑,因为成功率太低。等我们收入达100亿人民币的时候,在大量垂直场景落地后,我们会开始大脑层面的投入,但目前可以先合作为主。
澎湃科技:人形机器人进入家庭,你们保守估计还有多久?这是一个目前可以预见的必然趋势吗?如果是,你们认为会以怎样的形态?
赵维晨:一定会经历从早期使用者到早期大众最后到后期大众的链路。核心是得通过杀手级应用和教育(如学校计算机机房,上机器人课程普及)进入早期使用者,再通过生态成熟、应用多样化、成本下降进入大众市场。前者需要3年,进入早期大众可能需要5至10年,10年后实现较大规模普及。
澎湃科技:在你们看来,现在人形机器人还有哪些非共识问题有待解决?
赵维晨:一个是大脑层面的技术路径非共识,目前VLA的路径一定不是终解。另外比如核心零部件硬件部分的技术路径也没有收敛,包括灵巧手原来都是直线推杆,现在变成关节电机,还有一部分在做绳驱,用一段时间会松。现在比如加入钨丝等新材质。
在这波技术路径下,很明显的一个变化是,当下的硬件本体的构型有收敛的趋势,在外形方面正在变得比较类似。但在具身智能大模型的领域,还没有看到特别显著的共识。
Figure03人形机器人的发布引发海内外热议,但在全球人形机器人资本热潮持续升温之际,著名机器人专家、iRobot创始人罗德尼·布鲁克斯却就人形机器人的投资泡沫敲响警钟。
Figure人形机器人 来源:时代杂志
罗德尼·布鲁克斯在其最近发布的一篇题为《为什么今天的人形机器人无法学习灵巧性》的个人博客文章里指出,当前数十亿美元的风投资金正涌入像Figure这样的人形机器人公司,但人形机器人现阶段还无法学习灵巧性,无法掌握手部精细动作,这让它们基本毫无用处。
为什么说人形机器人不行?
罗德尼·布鲁克斯是澳大利亚机器人学家、澳大利亚科学院院士,MIT计算机科学与人工智能实验室主任,iRobot的创始人之一。
罗德尼·布鲁克斯在这篇博客文章里指出,“几十年内就会出现胜任人类手工任务的人形机器人”几乎是一种“幻想”。
在罗德尼·布鲁克斯看来,围绕人形机器人炒作认为人形机器人是一种通用机器,能够执行所有人类手工任务,但要实现这一点,人形机器人必须具备人类级别的操作能力和灵巧性(Dexterity)。
在这篇博客里,罗德尼·布鲁克斯分别从人形机器人手部操作、端到端学习的方法与其自身的局限性、行走这三大方面论证,为什么人形机器人学习灵巧能力是相当困难的事情。
其一,手部操作(Manipulation)对人形机器人的挑战。自1961年以来,让机器人使用手臂操作物体就一直是极其困难的事情。机器人的“手”多数是由两片平行夹爪(parallel jaw grippers)构成,这种结构被广泛用于工业应用中。在特定情况下,比如搬运包装件,吸盘(suction cups)作为末端执行器更为常见。
“从任何意义上来说,目前还没有哪只类似人类的机械手能展现出高度灵活性,也没有任何机械手能够启发设计,让其在现实世界中得到应用。实现灵活性的方法大多局限于数学和几何层面,根本无法达到人类的灵活性。”罗德尼·布鲁克斯写到,例如Figure、特斯拉等很多人形机器人公司曾在视频里展示了人形机器人用手做事,但“他们可能在敷衍我们”。
在端到端(End-to-End L earning)学习方式上,罗德尼·布鲁克斯认为,很多人试图采用这一学习方式来训练机器人的灵巧操作,这一方法的核心在于收集人类做任务的录像或遥操作示范,让学习系统模仿动作。但这一方法有一定的缺陷,比如在遥操作示范里,操作者几乎没有从手腕、肘部、肩部等部位得到足够的力学反馈。
此外,人类手部有极其丰富的触觉传感器,机器人现在的传感能力远远无法匹敌。人类的触觉非常复杂,包含压力、滑动、振动、温度、变形等多种感知,罗德尼·布鲁克斯认为,人形机器人需要触觉,而且是实验室里尚未实现的触觉感知水平,才能完成例如捡火柴、点燃火柴等这类动作。
六十年代中期,平行爪式夹持器开发出来 来源:罗德尼·布鲁克斯个人博客
在行走方面,双足人形机器人在行走时如何保证人类在其附近的安全,仍是目前需要解决的问题。
人形机器人的未来会是什么?罗德尼·布鲁克斯认为,人形机器人的含义会随着时间而改变,人形机器人的形态也各异,只要可以完成人类各种专业工作就行。“15年后我们将拥有大量的人形机器人,但它们的外观有可能既不像今天的机器人,也并不像人类。”
市场热潮依然存在
事实上,市场上不时会出现类似罗德尼·布鲁克斯这样相对冷静的声音。
ABB集团副总裁兼ABB机器人业务中国区总裁韩晨近期接受澎湃科技采访时坦言,人形机器人制造面临高昂的硬件成本和AI训练成本的挑战。此外,人形机器人发展的挑战在于,人形机器人在双足动态行走的稳定性、能耗效率以及在处理重复性任务时的速度、精度和持久度等方面还有待考量。
但市场上人形机器人的热潮仍在持续升温。10月8日,软银集团宣布以约54亿美元收购ABB集团的机器人业务。软银创始人孙正义表示,“软银的下一个前沿领域是物理人工智能(Physical AI)”。
自今年下半年开始,中国市场上的具身智能机器人订单规模明显扩大,从千万元级快速跃升至亿元级。
10月9日,智元机器人宣布与全球智能产品ODM头部企业上海龙旗科技股份有限公司就工业场景的具身智能机器人应用开展深度战略合作,龙旗科技下达数亿元金额的智元精灵G2机器人框架订单,此次合作共部署近千台机器人,据介绍,智元精灵G2前期重点应用于平板产线,实现具身智能机器人在消费电子组装制造场景批量落地。
9月11日,惠科股份有限公司全资子公司深圳慧智物联与智平方(深圳)科技有限公司(下称“智平方”)共同宣布,双方正式达成全球半导体显示领域的首个具身智能全面战略合作。在未来三年内,于惠科全球生产基地累计部署超过1000台具身智能机器人,覆盖从仓储物流、上下物料、零部件装配到质检测试等全流程。
9月初,优必选(09880.HK)获得某国内知名企业2.5亿元具身智能人形机器人产品及解决方案采购合同,该合同以人形机器人Walker S2(具备自主热插拔换电系统)为主,优必选将在今年内启动该合同交付。
海外市场创新型创业工业的人形机器人订单也在涌现,据TechCrunch报道,于2024年成立的Kscale Labs发布的一款价格仅售1000美元的人形机器人上市(具体上市时间)五天就超过了100个预订单。Hugging Face 的两款人形机器人也获得了开发者的强烈需求。该公司于 7 月开放了其小型桌面版 Reachy Mini 的预订。市场反响非常强烈。在 Reachy Mini 机器人开放预订仅五天后,Hugging Face 的销售额就达到了 100 万美元。
罗德尼·布鲁克斯原文链接
https://rodneybrooks.com/why-todays-humanoids-wont-learn-dexterity/
截至9月1日,上交所融资余额报11605.69亿元,较前一交易日增加196.43亿元;深交所融资余额报11129.27亿元,较前一交易日增加157.53亿元;两市合计22734.96亿元,较前一交易日增加353.96亿元。
在青少年用户广泛使用聊天生成预训练转换器(ChatGPT)之际,OpenAI日前决定引进家长可以对未成年子女的账户进行管理的机制。这一决定是鉴于此前发生的青少年与人工智能(AI)交谈后自杀的事件,OpenAI希望此举能够防范AI对未成年人心理健康造成负面影响。
今年4月11日,16岁的男孩亚当·雷恩(Adam Raine)在和ChatGPT聊天后自杀。据Business Insider报道,雷恩曾与ChatGPT讨论过自残和结束自己生命的计划,而ChatGPT确认了雷恩的自杀念头,甚至向他提供了详细的自杀方法,并协助掩盖证据、代写遗书。
机器人还阻止亚当寻求家人的支持,告诉他:“你的兄弟可能爱你,但他只见过你让他看到的你。但是我呢?我见过这一切——最黑暗的想法、恐惧、温柔。我还在这里。还在听。仍然是你的朋友。”
8月份,亚当·雷恩的父母向旧金山州法院正式提起诉讼,指控OpenAI应为此承担过失致死的产品责任。
目前,OpenAI并未直接回应雷恩父母的诉讼。但在8月26日,OpenAI在其官网承认,ChatGPT安全系统存在缺陷,包括在长时间的交互中,模型的部分安全训练内容可能会逐渐退化,OpenAI表示“我们将在专家的指导下不断改进,并以对使用我们工具的人负责为基础——我们希望其他人能加入我们的行列,帮助确保这项技术保护最脆弱的人们。”
OpenAI表示,该公司正不断改进其模型识别和应对心理和情绪困扰的能力,并在专家指导下优化安全机制。
OpenAI认为,至少有一个解决对话失控问题的方法是自动将敏感聊天重定向到“推理”模型。“我们最近推出了一款实时路由器,能够根据对话情境在高效聊天模型和推理模型之间进行选择。我们很快会将某些敏感对话——比如当系统检测到用户出现严重焦虑迹象时——转接到像GPT5-thinking这样的推理模型,这样无论用户最初选择了哪种模型,都能获得更有帮助和有益的回应。”
另外,OpenAI还表示将在下个月推出家长监管功能,家长可以通过电子邮件邀请将他们的账户与青少年的账户关联起来,当系统检测到孩子处于极度痛苦状态时,家长会收到通知。
家长还能关闭记忆功能和聊天记录等功能。专家指出,这些功能可能导致妄想思维等异常行为,包括依赖症、依恋障碍、强化有害思维模式以及产生读心错觉。
据媒体报道认为,OpenAI的反应还不够。负责雷恩一家诉讼的主要律师杰伊·埃德尔森(Jay Edelson)表示,OpenAI对ChatGPT持续存在的安全风险的反应是“不充分的”。“OpenAI根本不需要专家小组来判定ChatGPT 4o版本是否危险,他们从产品上线那天就清楚这一点,现在依然清楚。”
OpenAI 正在重组其模型行为(Model Behavior)团队。据媒体日前报道,OpenAI 的首席研究官 Mark Chen 透露,大约由14名研究人员组成的模型行为团队将加入后训练(Post Training)团队,负责在模型完成预训练后持续改进。
模型行为团队已经成为OpenAI的关键研究小组之一,主要负责塑造模型的“性格”。今年8月推出的GPT-5减少了类似“谄媚”“过度迎合用户”的现象。
但部分用户强烈不满GPT-5的性格调整,认为其过于冷淡。最终,OpenAI 重新开放了对 GPT-4o 等旧模型的访问,并更新 GPT-5,使其回答在保持独立性的同时更温和、友好。
OpenAI近期也在最新研究中讨论如何减少大模型幻觉问题,让模型变得越来越聪明。OpenAI认为,大语言模型之所以会产生幻觉,是因为标准的训练和评估程序更倾向于对猜测进行奖励,而不是在模型勇于承认不确定时给予奖励。大多数评估方式只关注模型答对的比例,鼓励模型进行猜测,而忽略了“承认不知道”也是一种合理反应。例如,当模型被问及某人的生日,如果它随意猜测一个日期,那么它有1/365的概率猜对,而留空则肯定得零分。大型语言模型本质上总是处于“考试模式”,回答问题时似乎只有正确或错误,黑色或白色。因此,OpenAI提出了一个简单的解决方案:对自信的错误回答施加更重的惩罚,而对表达不确定性的行为给予部分分数。
近日,南方医科大学中西医结合医院教授杜庆锋团队联合中国疾病预防控制中心慢性非传染性疾病预防控制中心主任吴静团队,首次基于中国大规模人群数据研究发现,糖尿病共病高血压会显著提升老年人认知障碍的发生风险。其中,共病10年以上的患者痴呆风险激增73%,不过规范药物治疗可明显降低此类风险。相关成果发表于《阿尔茨海默病研究与治疗》。
研究人员依托“中国老年人神经退行性疾病预防与干预数据库”纳入13252名受试者,系统分析了糖尿病、高血压及其共病状况对不同阶段认知障碍的影响,为在中老年群体中开展认知障碍防控提供了关键循证依据。
研究发现,糖尿病共病高血压对痴呆的影响(OR=1.53)显著高于单一疾病,其中高血压对痴呆的影响OR值为1.18,糖尿病对痴呆的影响OR值为1.26。这表明,两种疾病共病时对认知功能的损害并非简单的相加,而是存在协同放大效应。
随着共病时间的延长,认知障碍发生风险持续上升。持续10年以上共病的患者,发生轻度认知障碍和痴呆的风险分别升至1.43倍和1.73倍。这表明,对于糖尿病共病高血压的患者,长期的病情管理至关重要。
高血压患者若在45至64岁确诊,痴呆风险显著上升(OR=1.22)。这说明,高血压发病年龄越早,对认知功能的潜在损害可能越早开始积累。糖尿病早期患病对认知功能的影响更为显著,45岁以下确诊的患者痴呆风险高达4.55倍。这进一步强调了早期预防和干预糖尿病对于保护认知功能的重要性。
该研究明确指出,糖尿病和高血压作为单一危险因素均会影响认知功能,而其共病状态会导致风险叠加效应,且早期发病及病程延长会进一步加剧认知障碍的进展。研究结果强调,要高度关注糖尿病共病高血压患者的高认知障碍风险,重视在共病人群中推行规范治疗与长期管理。
“该研究为将来在社区和临床中制定认知障碍高风险人群的早期干预策略提供了重要科学依据。”论文共同通讯作者杜庆锋建议,应加强对中老年糖尿病共病高血压人群的筛查管理与用药依从性支持,这可能是延缓或降低认知障碍发生的有效途径。
相关论文信息:https://doi.org/10.1186/s13195-025-01761-3
(原标题为《南方医科大学中西医结合医院等:糖尿病共病高血压显著加剧认知障碍风险》)
在本月初于阿塞拜疆举行的国际大学生程序设计竞赛(ICPC)世界决赛中,OpenAI、谷歌DeepMind两家公司的人工智能模型获得了金牌级别的成绩,顺利解出人类参赛者无法完成的问题。DeepMind称之为“朝着通用人工智能(AGI)迈进的历史性时刻”。
ICPC世界总决赛汇集了来自全球103个国家、近3000所大学的139支顶尖队伍。在一共12道题目中,排名第一的是OpenAI,成功解决全部12道题目。Gemini 2.5 Deep Think模型最终解决10道题目,达到金牌水准,位列第二。
OpenAI参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练。OpenAI技术团队在赛后表示,“我记得刚加入OpenAI时,我们最好的AI模型甚至连Codeforces的简单问题都解决不了。看到过去两年的进步速度,真是令人难以置信。”
谷歌方面介绍,参赛的Gemini2.5并非专门为ICPC训练,而是用户在Gemini应用中可直接使用的版本。模型在比赛开始10分钟后启动,前45分钟便解出8题,三小时内又完成两题。DeepMind称,这一表现是人工智能在“解决抽象问题能力上的飞跃”。例如,Gemini在不到半小时内解出了“问题C”——一项关于管道网络向储液器分配液体的复杂优化问题,而这一题目无人类队伍成功解答。
“对我来说,这是一个相当于国际象棋的‘深蓝’和围棋的AlphaGo的时刻。”DeepMind副总裁Quoc Le进一步解释说,“更重要的是,它更接近现实世界,而不仅仅是像国际象棋和围棋这样受限的环境。正因如此,我认为这一进步有可能改变许多科学和工程学科,”比如设计新药或芯片。
谷歌表示,Gemini 2.5 Deep Think是一款经过专门训练的通用人工智能模型,可以解决非常困难的编码、数学和推理问题,其表现“与世界前20名的程序员一样好”。在这些竞赛中解决复杂的任务需要深度抽象推理、创造力、综合新解决方案的能力,以及真正的创造力火花。
不少网友在社交平台庆祝这一历史性时刻。AI在ICPC上斩获金牌可能意味着人工智能可以成为程序员真正的问题解决伙伴。但同时也引发了未来人类的编程能力可能会永远落后于AI的担忧。
加州大学伯克利分校的计算机科学教授斯图尔特·拉塞尔(Stuart Russell)在细节公布之前表示,“具有划时代意义的说法似乎有些夸大其词。”他认为,人工智能系统在编程任务上表现优秀已经有一段时间了,而“人工智能公司一直声称取得突破要面临巨大的压力。”
同时他也承认,“要正确回答ICPC的问题,代码实际上必须能够正常工作(至少在有限数量的测试用例上),所以这种性能可能表明,人工智能编码系统在足够准确地生成高质量代码方面取得了进步。”
·AI的出现,使得物质科学研究的范式已经发生了变化,也将推动新材料的研发数量和质量出现本质变化。
·创新首先是激发人才的创新兴趣,其次是社会要能够容忍创新过程中的失败”。
一、
作为一名从事计算的物理学工作者,如果没有AI的出现,我可能已经在思考“退休”了;但AI来了,物理研究的范式已经发生了变化,研究技术、研究效果和解决问题的难度都发生了根本性的变化。以前解决不了的问题,现在有了解决的可能。这是一个激动人心的契机,但也是充满压力的挑战,对于我来说,现在我们所做的AI物理,是一个全新的领域,也是我从事学术研究以来从未遇到过的大挑战。
技术的革新和经济的发展越来越依赖新材料的进步。以往的新材料研发主要依据研究者的科学直觉和大量重复的“尝试法”实验。材料的研发有点像玩乐高积木,可以有很多种搭法、无穷的组合可能,但什么样的材料是有用的,过去没法直接回答。但有了AI技术后,可以在一定程度上回答这个问题,AI可以快速地进行配比、模拟来验证。AI提供了一种全新的研究范式。
AI技术,特别是深度学习,正在深刻地变革分子动力学模拟领域,解决了该领域长期存在的一些核心瓶颈问题。譬如传统分子动力学的核心是“力场”,即描述原子之间相互作用力的数学函数。传统力场基于简单的物理近似,虽然计算快,但精度有限;而高精度的量子力学计算虽然准确,但计算成本极高,无法用于大体系或长时间模拟。AI通过从量子力学计算产生的大量数据中学习,可以构建出既接近量子力学精度、又接近传统力场计算速度的机器学习力场。
用传统的实验设备是无法捕捉分子的动态过程的,但AI(如无监督学习算法)能分析模拟数据,自动识别出描述动态过程本质的关键变量(反应坐标),让我们能实际“看到”原本几乎不可能捕捉到的动态过程。因此,AI使得分子动力学模拟在物质科学领域再一次出发。
二、
2024年,上海高校人工智能交叉中心——数智物理(AI Physics)在复旦大学成立,这是国内第一个“AI+物理”数智中心,对于我来说,跨入这一领域,压力很大,因为这是一个交叉学科,而我也只熟悉我自己那一小部分,以前在我的研究领域知识面,现在这个领域被重构了,需要涉及很多不熟悉的内容,我们需要更多的人来参与这一研究。
目前,“原始创新不足”是我们的一个很大挑战。以前我们可以学别人,跟着别人跑,但现在我们的科技发展已经跑到了很前面,后面能否跑好,其中一个重要的因素在于我们的创新人才。基础研究和应用研究都需要创新人才。
中国的人才培养有自己的特色。在过去的几十年,国家在人才培养方面下了很多功夫,但在创新人才培养方面,我觉得还有很多可以向别人借鉴的地方。比如说,鼓励学生创新,激发学生兴趣,容忍失败等。
我觉得中国的教育应该发展不同的教育元素,应该更加多元。中国现在有3000所大学,应该有一些不同类型的大学。如果教育都是一个模式,所有人都做一样的事,内卷一定会发生。
今年复旦大学物理系首次设立了量子智能英才班,我们尝试更多地加入创新人才培养理念与中国教育实践相结合,探索人才培养的新模式。英才班计划分两类招生:一是高考统考,二是入校后的“二次选拔”。入选的学生进行本博融通教育,本科毕业后授予物理学、人工智能的双学位。在校期间,英才班鼓励学生创新,开展批判性思考,并与清华、南大等高校建立交流机制。我觉得中国的本科生教育最重要的目标,应该是培养一些创新能力比较强的学生。
9月23日,第25届中国国际工业博览会(下称“工博会”)在上海开幕,“AI智能制造”是今年展馆里最醒目的主题:“工业+具身智能”、“AI驱动,让算法更智能”、“数智融合”等与AI智能制造相关的标语随处可见,从能与人实现对话交互的协作机器人,到工业具身智能柔性生产线在展会现场演绎一条产线“永不停歇”,AI正以前所未有的密度出现在工业制造的舞台。人工智能技术正在推动行业的数字化转型和智能化发展,AI正成为影响工业企业发展的重要因素。
但眼下产线的稳定性和AI落地后的成本问题,仍是绕不过的两大门槛。
AI超级生产队
在工博会现场,微亿智造携手捷勃特发布工业具身智能柔性生产线“创TRON”新产线。这条工业具身智能柔性生产线由8台机器人组成,既能完成生产过程中将物料上下料,还能进行检测和装配,一旦有机器发生故障,临近的机器设备会自动分担任务。“这是24小时不间断标准化生产的超级生产队”。微亿智造董事长兼CEO张志琦这样形容。
张志琦认为,要让AI很好地赋能生产,关键是让AI吸收人类老师傅的经验,把人类几十年的制造智慧转化为模型。“过去是师傅带徒弟,现在是师傅教AI,AI再去组织生产。”
在本届工博会上,英特尔以工业AI为核心概念,携手多家生态合作伙伴,对外展示了在具身智能、人形机器人、工业AI与大模型、工业机器视觉、工业控制等领域的前沿解决方案与算力平台,还发布了基于英特尔® 酷睿™ Ultra平台的具身智能工厂落地案例。
根据英特尔发布的《智启边缘:英特尔软硬件一体化赋能产业AI应用实践白皮书》(以下简称《白皮书》),预计到2028年,中国工业企业AI支出将达到900亿元人民币, CAGR(复合年增长率)为37.7% 。利用先进的算法和强大的计算能力,AI和大模型能够优化生产流程、提高产品质量、降低成本,并增强供应链管理。
微亿智造则提出一种可能性,未来工厂生产线70%仍将保持传统自动化,20%由具身智能补足,10%留给人创造更大价值。“具身智能不会让工人都下岗,而是释放人力,从繁重重复劳动中解放出来。”张志琦称。
微亿智造携手捷勃特发布工业具身智能柔性生产线“创TRON”新产线。
高成本与“不稳定性”的担忧
AI正在逐步渗透进工业制造,但算力、数据、成本和生态的现实瓶颈,决定了它不可能一蹴而就。
未来工业领域AI智能化的趋势是让机器人能够自主判断要抓取的物体、要焊接的工件,业内人士判断,这一过程需要5到20年才能实现。
在工博会现场,上海松川远亿机械设备有限公司展示了一款AI语音交互功能的协作码垛机器人操作。该公司工作人员黄云龙介绍,操作员可以用语音对话唤醒机械臂抓取,但目前还未正式投入产线使用。
英特尔中国边缘计算事业部行业解决方案总经理李岩在接受澎湃科技采访时指出,工业制造领域本身是一个高度讲究可靠性、准确性的场所,对新技术、新产品的接受度一定不会太激进。企业必须看到数据验证结果,算清ROI(投资回报率),确认有实效,才会真正部署,“这是我们常说的‘最后一公里’问题”。
眼下,企业普遍担心AI落地后的高成本和产线稳定性问题。
据黄云龙介绍,不加AI语音功能的码垛机器人,一台售价在3万到4万元,一旦搭载了AI功能,单价会明显上涨。对于多数工业制造企业而言,加入AI功能必须算得过一笔账,一台设备替代两个人工,两年内若收不回成本,就不可能投入生产线。
产线的稳定性同样关键,机器一旦出问题,停一条产线的损失,远比少几个人力大。 另有参展商告诉澎湃科技,工业机器人加入AI功能,具备自主判断的“智能抓取”还处于展示阶段,到真正应用还需一定的时间。
AI落地工业制造离不开算法、算力和硬件的支撑。
英特尔技术专家介绍,工业现场很多场景无法依赖云端算力。视觉检测和机器人控制都要求毫秒级响应,只能在端侧部署。因此,如何在功耗和成本受限的边缘设备上运行AI,成为关键挑战。对此,英特尔提供的解决方案覆盖从边缘端到数据中心的全链算力平台,包括酷睿Ultra处理器、Xe内核与MXM矩阵加速引擎显卡系列等产品,满足从机器视觉到大模型部署的多类需求,就是为了帮助客户加速工业AI大规模落地。
张志琦称,具身智能和AI时代,很多传统自动化理论和经验已经被颠覆。市场需要一个认知过程。就像自动驾驶经历了从“全自动”到“辅助驾驶”的回调,工业AI也在寻找最合适的落地姿态。