多名科学家及多项成果获中国科学院2024年度杰出科技成就奖

今天(16日)中国科学院在北京表彰获2024年度中国科学院杰出科技成就奖的科学家和科研成果。

中国科学院物理研究所陈立泉院士、中国科学技术大学陈仙辉院士获个人成就奖,

“银河系早期形成与演化”等4项成果获基础研究奖,“大规模压缩空气储能新技术与应用”等5项成果获技术发明奖,

“黑土区耕地退化阻控与地力提升关键技术”等5项成果获科技攻关奖。

据了解,获个人成就奖的陈立泉院士自1976年起就从事并坚守锂电池研究,在我国最早开展锂电池基础研究和技术攻关,为我国锂电池从无到有、从“跟跑”到“领跑”作出了奠基性贡献。另外一名获个人成就奖的陈仙辉院士长期从事量子材料领域研究,在笼目超导体、界面超导、磁性拓扑绝缘体等前沿领域持续做出引领性工作。

2024年,为贯彻国家科技奖励改革精神,中国科学院修订了《中国科学院杰出科技成就奖励条例》,强化奖励导向,设立4个奖项实行分类评价。个人成就奖主要奖励长期活跃在科技前沿、取得重大创新成就、对相关学科领域发展作出卓越贡献的杰出科学家;基础研究奖旨在激励在基础研究和应用基础研究方面取得重大科学发现和原始创新成果;技术发明奖旨在激励在应用研究和技术开发方面获得高价值知识产权,通过推广应用取得显著经济效益、社会效益或生态效益;科技攻关奖旨在激励在国家重大科技攻关任务中突破关键核心技术,在解决国家重大战略需求或保障国家安全方面发挥关键作用。

研究称长期压力大的成年女性中风风险增加,但未在男性中发现此关联

北京时间3月6日,美国神经病学学会医学杂志《神经病学》(Neurology)在线发表的一项研究称,压力和中风之间存在关联,一些长期处于压力下的人患中风的风险更高。

“脑卒中”即人们常说的“中风”。《中国脑卒中防治报告(2023)》称,“脑卒中”是中国导致死亡和后天致残的主要病因,平均每28秒就有一人因脑卒中去世。

前述最新发表的研究选取了426名年龄在18至49岁之间的原因不明的缺血性中风患者,并根据其年龄和性别与另外426名未患中风的人进行对照研究。该研究采用问卷调查的方式,收集了中风患者在发病前一个月内的压力水平。通过对问卷得分进行计数,总分0到13代表低压力;14到26代表中等压力;27到40代表高压力。结果显示,中风患者的平均得分是13,而未患中风的参与者的平均得分是10;46%的中风患者压力水平为中等或较高,而在未患中风的参与者中,这一比例仅为33%。

通过调整排除教育水平、饮酒和血压等可能影响中风风险的因素后,研究人员发现,对于成年女性而言,处于中等压力状态下,其中风的风险增加约78%而成年男性的压力程度与中风风险的相关性不显著。

研究人员表示,值得注意的是,由于高压力水平的人群可能不易参与此类研究,这将影响研究结果,使得结论存在一定局限性。

“我们需要进行更多研究,探究为什么感受到压力的女性的中风风险更大”,参与该研究的芬兰赫尔辛基大学医院的尼古拉斯·马丁内斯-马詹德(Nicolas Martinez-Majander)博士表示,“此外,也要进一步明确为什么女性在中等压力下患中风的风险高于在高压力状态下的风险。我们通过更多地了解压力对中风的影响,以期找到更好的方法来预防中风”。

MiniMax发布新一代开源模型,首次大规模实现线性注意力机制

1月15日,澎湃科技(www.thepaper.cn)获悉,AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)发布并开源新一代01全新系列模型。该系列模型包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax称该系列模型可以实现高效超长文本输入。MiniMax认为,2025年将是Agent高速发展的关键年份,无论是单Agent系统还是多Agent系统,都需要更长的上下文来支持持续记忆和大量通信。

据了解,MiniMax-01系列模型首次大规模实现线性注意力机制,传统Transformer架构不再是唯一的选择。

MiniMax-01系列模型核心性能在多项任务评测结果显示结果

目前领先的大语言模型大都基于Transformer架构,而Transformer核心的自注意力机制是其计算成本的重要来源。为了优化计算效率,MiniMax研究社区提出了稀疏注意力、低秩分解和线性注意力等许多技术。通过使用线性注意力,原生Transformer的计算复杂度可从二次复杂度大幅下降到线性复杂度,在处理长输入的时候具有非常高的效率。

据了解,该模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

MiniMax认为,2025年将是Agent高速发展的关键年份,无论是单Agent系统还是多Agent系统,都需要更长的上下文来支持持续记忆和大量通信。MiniMax-01系列模型的推出,正是为了满足这一需求,迈出建立复杂Agent基础能力的第一步。

此外,MiniMax声称受益于架构的创新、效率的优化、集群训推一体的设计以及内部大量并发算力复用,得以用业内最低的价格区间提供文本和多模态理解的API,标准定价是输入token1元/百万token,输出token8元/百万token。

目前,MiniMax-01系列开源模型已应用于MiniMax旗下产品海螺AI,并在全球范围内上线,企业与个人开发者可前往MiniMax开放平台使用API。

北京将举办全球首个人形机器人半程马拉松比赛,支持更换电池

在北京市政府新闻办公室举行的发布会上,北京经济技术开发区(北京亦庄)发布消息称,将于4月13日举行北京亦庄半程马拉松赛,全球首个人形机器人半程马拉松赛将同期举行。

本次赛事采取机器人和运动员“同步报名、同一赛道、同时起跑”的原则。人形机器人将与运动员在起点同时鸣枪起跑,共跑同一路线。起点位于南海子公园一期南广场,终点位于通明湖国家信创园。

本次赛事将机器人的关门时间设置为3小时30分钟左右。在比赛过程中,机器人可更换电池,也可通过更换机器人以接力形式参赛。依据比赛过程中完赛时间、机器人更换次数进行综合评价,比赛过程中更换机器人每次罚时10分钟。

赛事设置了冠、亚、季军,还设置了完赛奖、最优耐力奖、最佳人气奖、最佳步态奖、最佳形态创意奖等系列奖项。比赛报名时间为2025年3月5日10时至2025年3月11日17时。

对话OpenAI前全球商业化负责人:效率、多模态、Agent是2025年AI的三大关键词

过往的2024年,AI在投融资市场呈现火热的趋势,美国“科技七巨头”市值增长了6万亿美元,类似OpenAI、Perplexity、xAI和Anthropic等AI明星企业都在2024年下半年频频传出新的融资消息。

和海外热火朝天的投资相比,中国AI市场经过两年的投入,行业竞争加剧,有不少创业公司开始扛不住大模型预训练消耗的资金和精力。2025年伊始,零一万物被曝其超大模型已经交由阿里训练,零一万物负责小参数、适中的行业模型。其创始人李开复对此回复称,“大家都看得很清楚,只有大厂能够‘烧’超大模型。”

“我不认为AI的价值在于专注开发模型,更重要的是应用,制胜之道是构建出更具有性价比、让每个人都能使用的平台和应用程序。”近日,OpenAI前全球商业化负责人、人工智能与商业战略专家Zack Kass在接受澎湃科技(www.thepaper.cn)专访时表示。

OpenAI前全球商业化负责人、人工智能与商业战略专家Zack Kass

Zack Kass认为,在过往的一年,AI价格变得更加低廉是显而易见的,这意味着仅专注模型本身和技术变化是不够的,让AI变得更加有性价比是一个发展趋势。对于中国AI初创公司来说,最应该关注的是将消费者应用程序变得更好、更高效、更具有性价比。

在Zack Kass看来,效率、多模态与AI Agent将是2025年AI的三大关键词。效率将推动AI技术的大众化,多模态将拓展AI的应用场景,而AI Agent则有望彻底改变软件行业的盈利模式。

【以下对话全文】:

AI正迅速变得更具有性价比

澎湃科技:就2024年AI整体的发展,你观察到哪些趋势性的变化?

Zack Kass:一方面我认为,其实人们并没有注意到人工智能对每个人的日常生活有多大的改善,仍在追问“AI泡沫”;另一方面,AI的价格迅速下降,这让我意想不到。这意味着,模型和技术变好是不够的,还要让它变得便宜。

成本的大幅降低意味着技术的可获取性大大提高,这在历史上往往预示着一场新经济的爆发式增长。当关键资源变得廉价时,通常会带来巨大的积极变化,我们希望AI尽可能便宜,这是一个大的趋势。

这个趋势对中国来说尤其有趣,这些模型的压缩使得它们能够以非常低廉的成本进行推理,从而实现技术的普遍平等。在这种情况下,我们实际上无法限制技术的获取。随着模型成本的持续降低,“单一模型提供商可以控制世界”的观点也站不住脚。

现阶段,依然很多人在警惕AI泡沫,认为过度夸大了人工智能的重要性,但我的看法是,现阶段人们还没有完全意识到人工智能真正的潜力。

澎湃科技:最近创新工场的联合创始人李开复在接受媒体采访时说,未来零一万物将不再追求训练超级大模型,创业公司投资大模型预训练的性价比太低。你怎么看?

Zack Kass:开发前沿模型是重要的,但更重要的是应用。李开复在这场大模型竞赛中的结果,并不是没有预测到。

我有一个“模型收益递减理论”,基本上是说,在某些时候,下一个新模型的出现并不重要。但在某些时候,新模型的出现又如此不可思议,然而总有一天新模型的出现会对我们不再那么重要,这表明朝着这个结果努力并不是真正的制胜之道,制胜之道是构建每个人都能使用的平台和应用程序。

澎湃科技:有没有你觉得在商业化做得比较好的AI公司?有哪些特点?

Zack Kass:Perplexity非常出色,因为它建立的模型是专门为一个非常关键的应用——搜索设计的。Perplexity把重点完全放在搜索这个巨大的类别上,建立了一个训练有素的模型。

我认为Perplexity的最终模式会是付费版本,它以后会卖广告的。更有趣的是,已经能看到很多软件公司在大规模地扩展自己的产品,很多人都在想办法在自己的软件产品中销售新的人工智能产品。

PerplexityAI

澎湃科技:对于中国企业想要利用AI的,你有什么建议?

Zack Kass:对于中国企业来说,采用人工智能有两种方式:第一种是改进内部流程,让AI帮助企业更好地运行,尤其是如果你是一家中小型企业,这样做就会非常有意义。互联网给我们带来了电子商务,一种全新的购买商品和服务的方式。反过来,AI也将以几乎无法想象的方式呈现新的商业模式,机会显然无处不在。

如果我是中国创业者,会更倾向于在AI软件或AI应用领域,尤其是生活消费类的方面。如果我成立一家人工智能公司,我会为像街角商店这样的消费场景开发人工智能软件。

总体来说,人们日常生活中涉及衣食住行的这类小生意,很容易快速实现商业化,也具有市场潜力,所以我认为向这些公司销售AI将会非常容易。

2025年的关键词是效率、多模态与AI Agent

澎湃科技:你对于2025年AI的发展有哪些预测?AI如何更好地融入我们的生活?

Zack Kass:目前,我们正处于第一个阶段——增强应用阶段。这在中国十分常见,即现有的应用程序,如微信等,现在借助AI获得授权或增强能力,我们只是接受了AI的存在,并将这些模型应用于现有应用程序中,从而现有世界的效率提高了30%~40%,用相同的应用程序能做更多事情。

接下来我们将进入自主代理(AI Agent)阶段。如今,大多数人已知晓自主代理,我们正快速接近一个不再需要打开应用程序并使用由AI授权或增强的应用程序的世界,而是将任务分配给AI代理,由其在应用程序和网络体验中执行任务。这令人兴奋,未来我们会花更少时间在应用程序本身上,而会把更多的时间将任务分配给在应用程序中执行任务的代理。

此外,在未来可能出现的多模态(multi-agent)AI世界中,可以在一定程度上操控手机上的不同软件,尤其是在通过不同的输入方式(如语音、图像、文字等)与手机应用程序进行交互时。

第三阶段是自然语言操作系统多模态。这一阶段稍显复杂,但主要会发生两件事:首先,我们将从携带个人电脑转变为佩戴它们,如以眼镜、手表或工作内容预测工具等形式出现。各大消费电子公司及部分非消费电子公司都在朝此方向努力,OpenAI也不例外。

我的观点是,世界很快将获得完全整合的、不计量的智能,能准确学习我们工作方式并嵌入到各种智能界面的世界里,未来了解大多数未知的事情并变得异常容易,人们也将认为完全获得智能是理所当然的。

澎湃科技:在你看来,人们应该如何应对这种变化?

Zack Kass:首先,你必须为事情的持续变化做好准备。现在世界发展得非常快,我建议大家将自身的适应性作为个人的核心战略,我希望所有的年轻人都能学会适应变化。现在仅仅说“我们可能会改变”是不够的,现在要求我们必须说“我们将改变”。

很多年轻人问我,“我应该学习什么才能获得一份好的工作”?我有一个令人失望的答案,“其实学什么并不重要”。你的专业与经济成果之间的正相关性正在快速下降,你学习的内容不再真正影响你的工作质量。

我并不认为AI会让更多人失业,这是人们对AI革命的误解。我最反感的是,我们开始围绕AI做不到的事情进行追问思考,我称之为“负空间(Negative Space)AI”。在美国硅谷每个人都在谈论AI能做的所有事情,关注AI积极的一面。比如,我去酒吧,有人发现我在OpenAI工作过,他们最喜欢问的问题是:“OpenAI接下来要建造什么?GPT-5什么时候到?”这是我最喜欢的问题,从来没有人问过我:“什么是AI不会实现的?”

如果担心会被AI取代的话,我们应该开始提升人文素质,AI将创造众多新兴工作岗位,并在全球范围内积累巨大价值,推动生活成本不断降低。

中国深海生命科学研究迈入国际前沿:“溟渊计划”实现多项全球突破

深渊钩虾样本。吴跃伟 图

3月7日上午,由上海交通大学、中国科学院深海科学与工程研究所、华大集团联合发起并执行的“溟渊计划”(马里亚纳海沟环境与生态研究计划,英文简称“MEER计划”)第一阶段成果发布会在海南三亚召开。

澎湃科技获悉,溟渊计划此次实现了多项全球突破,包括:人类首次到达雅浦海沟最深点,首次对深渊生态系统进行系统研究,首次建立全球深渊生物大数据库并开放共享等,这些成就的取得标志着中国深海生命科学研究迈入国际前沿。

“溟渊计划”研究团队多次深入深渊海底,发现深渊微生物在最深海域超高静水压(600-1100个大气压)下的异常繁盛,发现深渊两种代表性宏生物与深渊微生物之间存在趋同的适应机制,即深渊存在跨越物种边界的“共适应”策略,从而串联起了独特的深渊生态系统,描绘了首个海洋最深生态系统的图景。

在发布会上,“溟渊计划”发起人,上海交通大学生命科学技术学院/微生物代谢国家重点实验室、深部生命国际研究中心主任肖湘表示,“我们现在对于海底的了解,甚至还比不上对月球表面的了解。到海洋最深处去采样,它的难度就是挑战到月球采样的难度。”

深渊岩石样本。吴跃伟 图

早在上世纪初,就有学者投入到深渊微生物研究,然而受限于抗高压设备的制作技术,多个国际同行组织的深渊大科学计划最终未能达到良好预期。

在2020年之前,只有9人曾到达过海洋最深点马里亚纳海沟底部。2020年底,成功完成工程海试的中国第一艘万米级载人潜水器“奋斗者”号,凭借其独特的采样能力和超长海底作业时间,成为当今全球唯一具备深渊系统调查采样能力的载人潜水器。

2021年10月至12月期间,肖湘带领上海交通大学研究团队,与中国科学院深海科学与工程研究所、华大集团等国内多家科研单位共同参加了“奋斗者”号载人潜水器的深渊航次。科学家团队对马里亚纳海沟、雅浦海沟和菲律宾海盆6000米-11000米水深区域进行系统采集,获得水体、沉积物、宏生物等样本2000余份,其中雅浦海沟最深点为人类首次到达。

3月7日,“溟渊计划”(马里亚纳海沟环境与生态研究计划,英文简称“MEER计划”)第一阶段成果正式发布。

在深渊极端环境里,每下潜一米都是对设备性能的巨大挑战,每停留一秒都是用生命极限探索极端生命的生死竞速。团队顶着5次超强台风的冲击,经过33次科学例会的灵感碰撞,攻克了深渊极端高压环境下的采样与实验技术难题,建立了“深海采样-基因测序-数据分析-实验室验证”全链条科研模式。

“做这些数据(和研究),我们是有一个决心的,我们是去系统地采集,它是不可重复的,因为这是2021年10月到12月人类活动对深海影响的一个实时记录……一百年以后甚至一千年以后,人类再次考察(这个区域),他们看到的地球环境,是不是跟我们今天还一样?他们也会来评估我们今天对深渊的认识是不是客观真实的。”肖湘说。

肖湘透露,对于MEER计划科研成果的展示,“有一个美学设计,事实上我们这个系列一共是9篇论文(5篇待发),包括了‘实景’篇——深渊现场、‘解构’篇——生态解构、‘印象’篇——共性原则,这些组合起来就是深渊的全景画廊。”Cell杂志除了今天以封面专辑形式发布4篇论文,还专门给MEER计划开通了一个网站,未来的系列文章都会在这个网站上进行展示。

美国初创AI公司Perplexity提议与Tiktok美国业务合并

在短暂停止服务后,短视频社交媒体平台TikTok19日恢复在美国的服务。但有消息称,在18日早些时候,TikTok暂停服务前,美国人工智能初创公司Perplexity向TikTok母公司字节跳动提交了一份收购提案。据美国财经门户网站Investor’s Business Daily报道,该提案提出将Perplexity、TikTok美国以及新的资本合作伙伴合并成一个新实体。此合并方案允许字节跳动的大多数现有投资者保留股权。

19日,TikTok发表声明表示,将与美国候任总统特朗普一起寻找维持TikTok应用程序在美可用的长期解决方案。特朗普当日在社交媒体上发文,呼吁各公司不要让TikTok处于停止运转状态。特朗普说,他将于20日发布一项行政令,推迟TikTok“不卖就禁用”的法律生效时间,同时他还为Tiktok继续在美营运开出了条件,声称希望美国在合资企业中拥有50%的所有权。

Perplexity成立于2022年,是由AI 聊天机器人驱动的研究和对话搜索引擎,被称为生成性AI热潮中最有价值的年轻AI初创公司之一。该公司的早期投资者包括亚马逊创始人和新任CEO杰夫·贝索斯(Jeffrey Bezos)、Nvidia( NVDA )和风险投资公司New Enterprise Associates。在最新一轮融资后,Perplexity估值为90亿美元,大家对于其推出的收购提案不抱期望。Wedbush分析师Daniel Ives在一封电子邮件中对Investor’s Business Daily表示,“我们认为对Perplexity的收购无望,因其内在价值太低,不可能达成400多亿美元的交易。在TikTok竞争激烈的竞标过程中,马斯克是领先者。”

此前,TikTok已否认或将美国业务出售给马斯克,称未与马斯克方面谈过潜在的出售交易,且没有与中国监管层讨论过所谓出售的方案。马斯克现已成为特朗普的重要顾问,拥有社交媒体平台X,和杰夫·贝索斯(Jeff Bezos)是长期竞争对手。 

此外,Perplexity的竞争者虎视眈眈。初创公司OpenAI的ChatGPT功能与Perplexity相似,同样是通过访问网络搜集信息,进行总结、整合、输出答案。OpenAI近期获得66亿美元的新融资,估值达到1570亿美元。谷歌股价在2025年上涨了3.5%,去年上涨了37%,有了TikTok,Perplexity可能会成为Alphabet(GOOGL)更强大的竞争对手。

厚度仅为发丝直径二十万分之一!我国开创二维金属研究新领域

记者从中国科学院物理研究所获悉,该所科研团队近期成功研制出厚度仅为头发丝直径的二十万分之一的单原子层金属,这是国际上首次实现大面积二维金属材料的制备,开创了二维金属研究新领域。这种材料未来可以为超微型低功耗晶体管、透明显示等领域带来技术革新。该科研成果于北京时间3月13日在国际学术期刊《自然》发表。

在我们日常生活中,人们见到的材料都是三维的,也就是具有一定长度、宽度、高度,但如果把一个维度抹平,那就是二维材料。例如一本书就具有长宽高,而二维材料就像是从这本书上单独撕下来的一页纸,看上去只有长和宽,厚度在我们肉眼看来几乎为零。在科学界,真实的二维材料就是厚度为单个原子或者少数几个原子的材料,一般厚度仅仅是一张A4纸的百万分之一。

如何把金属材料也能做得这么薄呢?这在科学界极具挑战性。中国科学院物理研究所张广宇研究员带领团队发展了原子级制造的范德华挤压技术。这种技术采用的压砧是原子级平整、表面无悬挂键的材料。科研团队通过将金属熔化并利用团队前期制备的高质量单层二硫化钼范德华压砧挤压,实现了原子极限厚度下铋、锡、铅等二维金属的普适制备。二维金属的实现超越了当前二维范德华层状材料体系,补充了二维材料家族的一大块拼图。

范德华挤压技术制备二维金属的过程示意图

据了解,通过范德华挤压技术制备的二维金属上下均被单层二硫化钼所封装,具有非常好的环境稳定性。这项研究成果有望开创二维金属研究的新领域,为超微型低功耗晶体管、高频器件、透明显示、超灵敏传感探测、极致高效催化等众多领域带来技术革新。

百万真机数据只是杯水车薪,数据匮乏成为具身智能行业困境

·目前具身智能领域正处在类似于从GPT-1到GPT-2的过渡阶段,连最基础的物理世界的数据都还十分匮乏。遥操作方式获取的数据成本过于高昂且采集效率低,导致行业内很难获取。除了缺乏高质量数据,徐良威认为,具身智能数据服务行业内面临的首要难题是缺乏统一的数据集定义标准。

过去的一年,具身智能、人形机器人引发的关注与日俱增,但喧嚣过后,这一行业的发展也正面临着艰巨的挑战,其中训练具身智能大模型所需要的高质量数据在哪的问题成为眼下行业的一大共同的困扰。

日前,上海机器人初创公司智元机器人正式开源百万真机数据集AgiBot World使得数据缺乏问题再次被提起。智元机器人联合创始人、首席技术官彭志辉(网名为“稚晖君”)表示,在具身智能领域,真机数据的采集成本和门槛非常高,此次开源希望众多科研团队基于真实数据进行具身智能算法的训练,加速技术创新和产品应用。但在业内人士看来,“百万条真机数据量”对于行业来说只是杯水车薪,“只能训练一个动作的泛化,譬如分拣,对实现理想状态中的具身智能还远不够。”

除了数据缺乏的困扰之外,已有数据的标准化也是一个待解难题。

连最基础的数据都缺乏

不同于语言大模型的训练得益于互联网上海量的数据,具身智能“大脑”的训练则需要更多来自物理世界即真实世界动态环境中的交互数据,如何解决物理世界数据匮乏问题,成为眼下人形机器人技术演进路上最大的难题。

人形机器人创业企业之一——银河通用的创始人兼CTO、北京大学助理教授王鹤此前在不同场合多次提及具身智能领域面临数据集短缺的难题。王鹤认为,通用机器人背后的技术一定是具身大模型,要用数据驱动基础机器人大模型,让机器人能够有极高的泛化性和跨行业应用能力。但现有数据量不足以支持通用机器人的发展。

泛化性是指模型经过训练后,能够将一项行为应用到陌生的应用场景中的能力,在陌生场景中能自主识别任务并采取行动。国家地方共建人形机器人创新中心(以下简称“国地中心”)相关数据负责人在接受澎湃科技(www.thepaper.cn)采访时表示,行业内对于机器人泛化数据的获取始终是一大难题,现阶段,特斯拉的Optimus仍需要人为远程操作来帮助机器人完成任务,还不具备泛化能力。

国家地方共建人形机器人创新中心具身智能数据看板,澎湃科技记者拍摄。

北京航空航天大学机器人研究所名誉所长王田苗此前在接受澎湃科技采访时也指出,数据的匮乏让人形机器人很难具备泛化性。当前,机器人任务泛化、感知泛化和运动操作的三个泛化数据很难获取,比如让机器人叠衣服、骑自行车等这些数据很难得到。

王鹤团队从2023年开始探索大规模的灵巧手数据合成和大规模的泛化,2024年合成了10亿规模的数据体量,用于训练机器人的灵巧手。

总部位于深圳的一家向具身智能机器人提供基础场景数据和解决方案的创业公司艾欧智能联合创始人徐良威告诉澎湃科技,经过一年多对于机器人技术路径的探索发现,“只有通过海量数据训练才能够真正地通向具身智能”已经成为行业共识,通过仿真数据实现智能的可能性远远小于使用真实数据。然而,目前具身智能领域正处在类似于从GPT-1到GPT-2的过渡阶段,连最基础的物理世界的数据都还十分匮乏。

在徐良威看来,对于训练具身智能泛化能力来说,AgiBot World这种百万量级的数据集虽然已经取得明显的进步,但只是“杯水车薪,洒洒水而已”,达到理想的效果需要更大量的数据。

高质量数据获取采集成本过于昂贵

澎湃科技记者了解到,在具身智能领域实践中发展出四种具身智能采集训练数据:第一种是遥操作机器人数据,即需要一位人工数据采集员戴着遥操作手套,手把手示教,获取真机操作数据。通过这种方式获取的数据质量最高,但成本昂贵。第二种是仿真合成数据,在虚拟的3D仿真环境里从无到有地积累训练数据,这类训练数据以生成数据为主,与真实世界仍有较大差异。第三种是通过人类动作捕捉数据,也称为动作捕捉或动作追踪数据,是通过传感器、摄像头或其他设备,精确记录和分析人体运动的技术。这类方式获取的数据质量较高,但通过人类动作捕捉获取的数据,与机器人能否适配仍存在一定差异,需要后期继续做构型对齐相关工作。第四种数据来源是通过互联网获取人类动作视频或图像数据。这类方式的特点是能获得海量数据,但都是单一模态、非结构化且无标注的二维图像或视频信息,质量很差。

国地中心数据负责人指出,目前行业内最匮乏的是通过遥操作方式获取的高质量数据,仿真合成类数据获取成本低,但仍需要弥合仿真与现实世界的差距。然而,遥操作方式获取的数据成本过于高昂且采集效率低,导致行业内很难获取。

数据训练员穿上特制的动作捕捉服装训练人形机器人捕捉数据 

“一台遥操设备投入约35万元,再加上人工数据采集员的成本,每人每天大约采集500条数据,人工成本至少需要300元,即便长期投入也无法保证成功。”国地中心数据负责人估算,特斯拉的人形机器人Optimus至少需要数百万小时的数据才能完全准备好在特斯拉工厂工作,这期间可能需要至少5亿美元的数据采集成本。

上述国地中心数据负责人向澎湃科技透露,即便银河通用专注于强化机器人大脑模型,强调仿真合成数据的使用,但仍面临一定挑战。“在仿真环境中参数看似正确,但在物理世界中,即使是微小的偏差也会导致完全不同的结果。比如,人形机器人执行蹲下起身这类动作时,不同机器人可能会有不同表现,电机参数任何微小变化可能会导致机器人出现完全不同的行为,很难控制。”

由于泛化数据采集成本高、获取难度大,国地中心数据负责人透露,现阶段行业内大部分按照1:9或者1:10的数据比例训练机器人,即一条遥操作机器人数据配以9条或者10条仿真合成数据,但这个比例目前还没有定论。

缺乏统一标准的数据集

徐良威认为,另一个关键问题是如何实现高效的数据采集。虽然通过人工操作机器人可以获取高质量的数据,但这种方式的效率极低。徐良威称,智元对外称一周可采集50万条数据,综合一年数据量也不过只能达到千万量级,这对具身智能训练效率非常低,难以提速。

除了缺乏高质量数据,徐良威认为,具身智能数据服务行业内面临的首要难题是缺乏统一的数据集定义标准。尽管海外有Google这类科技巨头已开源部分数据集,国内也有智元机器人开源百万条真机数据集等,但不同公司开放的数据集格式能否兼容、能否保持数据质量的一致性很难说。

“北京和上海的开源数据集能否兼容、数据格式是否一致,以及数据托管的方式有哪些不同,这些还有待出台统一的数据标准。”徐良威说,目前国内众多机器人公司正处于“百花齐放”的状态,在数据管理上也各自为政,这导致公司之间沟通成本非常高。

在数据处理上,目前行业内也缺少统一的数据处理标准。“不同公司、机构或平台对处理数据的方法不一,机器人如果要有效利用这些数据,还需进一步处理。”徐良威说,每个团队或公司可能都需要从头开始处理标注数据,这会浪费大量时间和资源,且无法保证训练结果的通用性。

近期,国家地方共建具身智能机器人创新中心牵头立项的《人工智能具身智能数据采集规范》工信部行业标准,规范了具身智能数据集采集的格式,使不同公司采集的数据可以互相共享开源,加速模型“涌现”,在徐良威看来,对从业者来说无疑是一个积极的信号。

2025年会出现更多的数据采集训练场

世界模型的出现似乎给人形机器人带来一些新的希望。去年12月,李飞飞的世界模型开启了从数字世界向物理世界的跨越征程,实现了从一维数字智能向三维空间智能的重大转变。2025年1月6日,英伟达创始人兼首席执行官黄仁勋在2025CES(国际消费类电子产品展览会)期间,推出了涵盖生成世界基础模型的Cosmos世界基础模型平台,旨在加速自动驾驶汽车、机器人等物理AI系统开发。黄仁勋认为,“机器人的ChatGPT时刻即将到来。与大语言模型一样,世界基础模型对于推进机器人和自动驾驶汽车的开发至关重要。”

徐良威称,这一类世界模型为通用智能提供空间、时间、物理、语义等各方面的模型表征。理论上来说,一方面,世界模型的成功使得机器人“理解世界”具备可能性;另一方面,世界模型能够在各维度下生成符合世界规律的数据,有潜力成为机器人合成数据的新范式。不过,虽然世界已经有一些阶段性的成果推出,但真正在机器人上应用,直至能够商业落地也还需要进一步发展。

数据缺乏在成为业内共识的同时,各方也在采取解决方案。2024年8月,特斯拉对外高薪招募“数据采集员”;2024年12月27日,北京国地共建具身智能机器人创新数据采集基地亮相。

据了解,从2024年下半年开始,位于上海张江的国家地方共建人形机器人创新中心也在搭建基于自己平台的数据采集训练场,目前,训练场的场地搭建工作以及数据采集机器人设备也基本到位,2025年计划招聘一些数据采集员来配合遥操作数据采集。2025年预期量产机器人的数量会上升,随之带来的数据采集量也会大幅增长,在数据采集成本方面也会下降。“今后可能会有一批便携式数据采集工具出现,这样会进一步降低数据采集成本。”相关人士透露。

在徐良威看来,北京、上海相继表示要共建具身智能机器人创新数据采集基地和搭建实训、模拟应用场景建设,核心价值远不止数据采集本身,更重要的是能够集中资源、缩短数据积累的时间,也相应地缩短了具身智能市场准入时间。他预测,2025年不同地区会加快建设数据采集训练场,以便从0到1的过程中尽快实现机器人的落地应用,此外数据采集方式将更加多样化。

万米深渊之下:中国科学家揭秘海底世界的基因奥秘与生命奇迹

·人类活动在几十年间就能影响到深海,那么是不是反过来,在这个“角落”里发生的事情也会影响到我们?

超深渊带(Hadal zone)是指海平面6000米以下的区域。如同它的英文词源、冥界之王“哈迪斯”(Hades,有“地狱”之意)所暗示的那样,这片冰冷漆黑的海底幽狱荒芜且贫瘠,水压超过1100标准大气压,相当于每平方米承受1万2100吨的压力。

即便在这样的绝境中,生机也并未断绝。这些神秘的生物能够适应深海的极端环境,但人们对它们所知甚少。近日,一系列由中国科学家完成的研究揭示了一个庞大且繁荣的深渊生态系统,分析了其中微生物与两种宏生物适应极端环境的基因策略。研究于2025年3月6日以专辑形式发表在《细胞》(Cell)杂志上,首批包含4篇论文,还有多篇等待发表。

深渊中存在庞大且繁荣的生态系统。图片由该研究的作者提供。

这些研究是一项名为“溟渊计划”(马里亚纳海沟环境与生态研究计划,英文简称“MEER计划”)的深海系统性研究的成果,由上海交通大学、中国科学院深海科学与工程研究所、华大集团等多家单位联合主导。在2021年10月至12月期间,研究团队利用我国自主研发生产的“奋斗者”号载人潜水器,在马里亚纳海沟、雅浦海沟和菲律宾海盆的145个站点进行了32次潜水,在6000-11000水深处采集了2000余份水体、沉积物、宏生物等样本。

通过基因测序与分析,研究者们发现了7000多种可能是新物种的深渊微生物,它们通过不同的基因策略共同在海底形成了一个繁荣的“社会”。稍大一些的深渊钩虾具备庞大且重复的基因组,是人类基因组数量的4倍。更大的鱼类为了适应深海,演化出多种抗压的基因策略。研究表明,存在超越物种边界的对深渊环境的趋同适应策略。

研究人员是如何深入海底并进行研究的?深海生物又是如何绝境求生和共存的?这些发现与我们人类有什么关系?为了回答这些问题,澎湃科技日前采访了“溟渊计划”的研究人员。

搭乘“奋斗者”号潜入深渊

深渊研究的特殊之处在于具有代表性的深海区域散落世界各地,而有条件进行下潜的国家也寥寥无几。做这样的研究往往是机遇在前,计划在后。

2020年2月,中国研发生产的“奋斗者”号载人潜水器完成了总装和陆上联调。2020年11月10日,“奋斗者”号在马里亚纳海沟成功达到最深处,坐底深度10909米。是目前唯一一个可以同时将三人带到水下万米深度的潜具,也成了“溟渊计划”成行的前提。

“对人类来说,对中国来说,都是一次很难得的机会。我们提交的申请一通过,就立即过去了。”上海交通大学生命科学技术学院/微生物代谢国家重点实验室、深部生命国际研究中心主任肖湘说。

登上科考船奔赴采样点时,他和同事们还没有一份完整的采样和研究方案。他们集思广益,现场确定了科考目标,并联系安排各单位的科研和技术团队来落实研究计划的细节。

“要在船带着深渊样本回到港口之前,明确样本保存、处理、分析等流程。我们这些在岸上的来自不同研究单位的研究者也是‘临危受命’,一起参与到了这个大项目中来。”华大生命科学研究院实验研发高级工程师韩默说。

当科考船到达采样目的地附近时,就会放下“奋斗者”号。科学家和工程师们搭乘它下潜到深海后,可以通过机械臂操作采样装置进行海底沉积物采样,也能通过诱捕装置、海水过滤系统等其它设备来采取不同类型的生物样本。机械臂采完之后,将这些样本放到旁边一个“托盘”上一起带回来。算上下潜和上浮的时间,下潜人员一次要在潜器内待10多个小时。

“奋斗者”号正在采样。图片由该研究的作者提供。

“‘奋斗者’号里面是一个直径1.8米的钛合金球形座舱,可以坐三个人。坐在中间的是主驾,左边是副驾,负责辅助主驾、观察环境和操作机械臂等电气设施。科研人员坐在右边,需要采样的时候就跟主驾和副驾进行沟通。”华大生命科学研究院生物技术副研究员孟亮说。

样本采集上来后,科学家们在海面的科考船上马不停蹄地进行检测或处理,因为这些样本会因周围环境的理化性质发生剧变而迅速死亡。比如深渊钩虾,孟亮介绍道,我们采集到的钩虾样本虽然外表看起来没有发生明显变化,但它们的细胞极有可能已经破裂,生物大分子开始降解,若不及时处理就很难进行后续分析。

在科考的两个月时间里,研究团队通过这种“连轴转”的方式采取到了大量深渊生物样本。几名作者都表示,这些样本是极其珍贵的。它们不仅反映了特定时期的深海生态,也是人类对深海影响的历史记录。

“这是2021年10月到12月,人类对马里亚纳海沟底部影响情况的一个描述。未来,我们不知道什么时候才会再去。”肖湘说,“过了100年甚至1000年,有人再去采样拿到样本,再看到的海沟情况就可以跟我们现在的数据对比,就知道人类活动又影响了什么。”

“这组研究数据我们会尽量地公开,完整地展示出来。”他说。

深海生物的基因秘密

船靠港后,样本被送到各个合作单位的实验室进行基因组测序等检测和分析。研究人员们在这些数据的基础上对这些深渊生命基因功能、群体分布、适应机制等方面做出了诸多探索。

“以前也有研究报道在马里亚纳海沟等深渊里面有一些生命的存在,但这些生命到底规模多大,多样性有多高,是不是普遍存在,这些大家都不确定。而这次,我们首次确认了在万米深渊当中确实有一个繁荣的生态系统,特别是微生物。”韩默说。

这种繁荣首先体现在多样性规模上。“我们鉴定出7564个物种水平的代表性微生物基因组,其中89.4%是新发现的。这个规模有多大呢?它跟全球已知的所有海洋微生物物种数量相当,直接将我们对深渊微生物的认知提升了一个数量级,这还仅仅是这一次研究的发现。”

研究者们还发现,微生物去适应深渊极端环境的策略并不单一。有一些微生物可能以一种“精简”的方式来面对极端环境,假如一个代谢功能不是跟维持最基本生存有关,一些微生物干脆就会“抛弃”掉相关的基因,来节约能量和营养。

还有一些微生物选择了截然相反的策略。一方面,它们也会保留一些耐压或者抗氧化相关的基因,但同时它们会想方设法丰富对环境中各种因素的感知能力,利用不同的物质来维持自身的生存。

“打个比方,这两种策略就像肉食动物和杂食动物一样。肉食动物获取能量很高效,而杂食动物什么都能吃。就算环境变化也能生存。”韩默介绍道,这些策略的形成可能与深渊的整体环境压力与局部环境变化有关。

深渊微生物们既相互依赖,也相互竞争,形成了一个繁荣的社会。“一些精简型的微生物连基础代谢途径都是不完整的,它们没办法单独生存,必须有不同物种配合,例如利用其它微生物的代谢废物。这样就形成了一个复杂的代谢网络,用‘集体’的方式榨干这个贫瘠环境中的每一点资源。”韩默提到,“另一些微生物则会分泌抗菌肽等物质,杀死其它的微生物来获得更好的生存环境。”

除了微生物之外,研究者们还首次对一种深渊典型物种——钩虾(Hirondellea gigas)进行了全基因组测序,探索了它适应高压环境的生物机制。

“这种钩虾属于端足目,而我们平常说的虾属于十足目,二者勉强能算作‘远房表亲’。”孟亮介绍道,“钩虾是食腐动物,可以吃从海面沉降下来的残渣,同时也是深海鱼类的主要食物,因此它在深渊生态系统中发挥‘承上启下’的关键作用”

深渊钩虾是研究深渊生态的“明星物种”,但它的完整基因组一直没有被破解。在这次的研究中,研究团队凭借完善的样本前处理和长读长基因测序技术,成功将钩虾基因组“拼”了出来。

研究发现,钩虾基因组大小达13.92 GB,是人类基因组(3.2 GB)的4倍多,刷新了端足目的基因组纪录。在它的基因序列中,更是存在高达71.98%的重复序列。研究推测这可能与适应深海环境有关,但还需要进一步研究。

孟亮说,钩虾身上的一个“谜团”是它对压力的适应有着很大的弹性。“它的幼体在较浅的水域长成成体之后,就可以去更深的地方。它的垂直分布非常广,在最深的接近11000米的地方我们采集到过,在6800米的地方也有。这之间的压力变化是非常大的。”

研究者们首先瞄准了一种已知的能够帮助深渊物种抗压的化合物TMAO(氧化三甲胺),它能够起到稳定细胞蛋白结构的作用,调节细胞内外的渗透压平衡以应对压力变化。然而在深渊钩虾的基因组中,并没有直接找到完整的合成代谢通路。

“我们通过前人的研究找到了灵感——人类是可以通过肠道微生物共同合成TMAO的,钩虾会不会也是这样?”孟亮说,他们果然在钩虾肠道中发现了一些优势菌种,能够与宿主配合去合成TMAO并调节含量,以更好地适应压力环境。

钩虾与微生物的“协作”不止于此。研究发现,钩虾还能与微生物共同作用,将难以消化的木质素分解。

“深海的整个物质能量是非常匮乏的,对于个体较大、需要摄食的动物来说就很困难。表层沉降下来的食物不仅少,还是上面不要吃的‘渣渣’。钩虾需要高效利用这些物质,将其转化为营养。”

以往的研究发现,钩虾以难以消化的木质素为食。而在这次的研究中,研究者们找到了基因中分泌这种消化酶的完整通路,“有一些是钩虾自身所具备的,有一些是肠道微生物提供的。微生物不仅从宿主身上获得‘好处’,也要提供一点帮助,一起在艰难环境中求生。”孟亮说。

深渊生物身上还存在太多未解之谜。该系列另一篇研究通过11种深海鱼类的基因组比较研究发现,鱼类体内的TMAO浓度与深度没有显著相关性,这意味着深海生物可能有其它抗高压机制。该研究指出,多不饱和脂肪酸的积累也能维持细胞膜流动性,助力鱼类对抗高压。

原位采样帮助研究者获得了更加准确的深海样本,但毕竟无法直接在海底长期观察和现场检测,许多信息无法掌握。虽然研究者们已经深入到基因层面,但想要从基因中得到深渊生物适应极端环境的全部秘密,还需要大量的研究。

“我们知道这是一段基因序列,但是它的功能是什么?在极端环境适应性中作用的分子机理是什么?我们现在还没有完全研究清楚。所以希望成果发表之后,能够吸引更多同行的兴趣与关注,大家合力攻关,让我们对深渊物种的认识能更加深入。”孟亮说。

深渊与人类

有理论认为生命在海洋中发端,人类的祖先也是从海洋走向陆地。早期地球环境非常极端,生命也很可能在类似的环境中诞生。要验证这样的猜想,就需要去极端环境中探索。

“在深渊微生物研究中,我们虽然没有找到直接的证据,但确实注意到一些线索。有些微生物在演化树上更靠近基干部位的一些分支,它们在深渊里的繁荣可能意味着这里比起常规环境保留了更多生命演化的早期证据,这是一个不错的消息。”韩默告诉澎湃科技,“如果在后续研究中能找到一些早期生命乃至于生命起源的更多线索,我觉得会是非常振奋人心的。”

除了回答科学问题,深渊生物的“生存秘诀”也可以为人类所借鉴。肖湘提到,一些芳香族化合物在地面上是持久性污染物,难以被降解。但在深海里,没有其他营养来源的微生物竟然以这些化合物为食。“深海生命能够对付这些污染物,我们是不是可以用这些微生物来照顾我们的自然环境,造福人类?”

在医疗领域,原有的抗生素已经出现耐药性问题,而新型抗生素的发现进展缓慢。“新发现的深渊微生物有些能够分泌抗菌肽等物质,丰富了我们的储备,或许能为药品开发提供新的选择。”韩默说。

“我们看到生命的一些特殊的规律在深渊里有普遍性。我们现在已经在跟一些医院的沟通,看看能不能服务于医疗,不仅仅是作为药物辅助,还有对生命策略的理解。”肖湘还提到,“比如,理解极端医疗环境下病原微生物,环境微生物与宿主的关系。”

深渊与人类社会最直接的关系,或许在于它们尽管相隔遥远,却同属一个生态系统。不仅人类的活动能影响深渊,深渊也可能反过来对我们的生存环境造成影响。

“我们曾经在一些深渊海底发现了不少人类废弃物污染,废弃物塑料、玻璃、金属制品什么的,给我们很大冲击。如果不做这些研究,一般人可能很难想到离你几千公里的万米深渊可能会被你抛弃的垃圾污染。”韩默说,“易拉罐出现才多少年?人类活动在几十年间就能影响到深海,那么是不是反过来,在这个‘角落’里发生的事情也会影响到我们?”

他举例道,当人类的污染给深海带来了不一样的化学物质时,微生物一定会想办法适应这个被改变的环境,但我们并不了解这些改变可能带来的效应。

“当然,我们可以乐观地认为这些微生物把塑料都降解了,分解成小分子有机物,重新回到生态循环中。但有没有可能它们代谢污染物时产生有毒有害的物质?会不会最终无法在污染中生存,从而影响地球的物质和能量循环?”

“人类对于深渊生命的了解还是很浅薄的,如果放任污染,谁都不知道结果是好是坏。作为科研工作者,我觉得人们应当更加谨慎,未雨绸缪。”韩默说。