·世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。
·尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。此外,世界模型也存在幻觉问题。
近年来,人工智能(AI)领域涌现出一种被称为“世界模型”(World Models)或“世界模拟器”的新概念,被一些行内人士视为AI的下一个重大前沿。AI领域的领军人物李飞飞创立的World Labs(世界实验室)已筹集了2.3亿美元资金,致力于构建“大型世界模型”(LWM);与此同时,谷歌DeepMind也聘请了OpenAI视频生成器Sora的创造者之一,参与“世界模拟器”的研究。
什么是“世界模型”?近日,科技媒体TechCrunch的高级记者凯尔·威格斯(Kyle Wiggers)撰文,梳理了关于“世界模型”的一系列问题,以下是澎湃科技(www.thepaper.cn)编译。
什么是世界模型?
世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。
AI研究人员大卫·哈(David Ha)和尤尔根·施米德胡伯(Jürgen Schmidhuber)以棒球击球手为例,论述了击球手只有几毫秒的时间决定如何挥棒,这比视觉信号传递到大脑的时间还短。他们之所以能击中时速160公里的快速球,是因为他们能本能地预测球的位置。
两位研究人员写道:“对于职业选手来说,这一切都是在潜意识中完成的。他们的肌肉会反射性地在正确的时间和位置挥棒,与其内在心智模型的预测一致。他们可以快速根据对未来的预测而采取行动,但无需有意识地推演可能的未来情景以制定计划。”
正是这种世界心智模型的潜意识推理能力,让一些科技研究者认为,世界模型是实现人类级别智能的前提。
世界模型有哪些应用潜力?
尽管这个概念已经存在了几十年,世界模型最近因其在生成式视频领域的应用而备受关注。目前,大多数AI生成的视频都会陷入“恐怖谷”现象,观看时间稍长就会出现画面崩坏,如四肢扭曲或融合。
传统的生成式模型可能能够准确预测篮球会弹跳,但并不真正理解其中的原因,就像大型语言模型实际上是基于神经网络的概率推理,给出最可能符合读者预期的答案,而非真正理解词语和短语背后的意义。然而,具有基本物理认知的世界模型将更善于展现“篮球的真实弹跳”。
为了实现这种洞察力,世界模型需要在大量的照片、音频、视频和文本数据上进行训练,旨在创建对世界运作方式的内部表征,并具备推理行动后果的能力。
Snap前AI主管、现Higgsfield公司CEO亚历克斯·马什拉博夫(Alex Mashrabov)表示:“观众期望他们观看的世界与现实相似。如果一根羽毛以铁砧的重量下落,或者保龄球飞上数百英尺的高空,这会让观众出戏。有了强大的世界模型,创作者就无需定义每个物体的运动方式——这既繁琐又低效——因为模型将能够自行理解原理。”
然而,改进视频生成只是世界模型的冰山一角。包括Meta首席AI科学家杨立昆(Yann LeCun)在内的研究人员认为,这些模型未来可用于数字和物理领域的复杂预测和规划。
在今年早些时候的一次演讲中,杨立昆描述了世界模型如何通过推理来实现目标。一个具有基础“世界”表示(例如一段脏房间的视频)的模型,给定一个目标(干净的房间),可以推导出一系列行动(使用吸尘器、清洗餐具、倒垃圾)来实现目标。这并非因为它观察到了这种模式,而是因为它在更深层次上理解了事物如何从脏到净。
“我们需要能够理解世界的机器;具备记忆、直觉和常识的机器——能够像人类一样推理和规划的机器,”杨立昆表示。“尽管你可能听到一些最热情之人的吹嘘,但当前的人工智能系统并不具备这些能力。”
虽然杨立昆估计我们距离他设想的世界模型至少还有十年的时间,但当今的世界模型已经显示出其作为基本物理模拟器的前景。
OpenAI 在一篇博客中认为 Sora 是一个世界模型,可以模拟画家在画布上留下画笔笔触等动作。像 Sora 这样的模型——以及 Sora 本身——也可以有效地模拟视频游戏。例如,Sora 可以渲染类似 Minecraft 的UI和游戏世界。
World Labs 联合创始人贾斯汀·约翰逊(Justin Johnson)在a16z播客的一集中表示,未来世界模型可能能够按需生成3D世界,用于游戏、虚拟摄影等。
“我们已经有能力创建虚拟的交互式世界,但这需要花费数亿美元和大量的开发时间,”约翰逊表示,“‘世界模型’不仅可以让用户获得图片或视频片段,还可以获得一个模拟效果完备、充满活力的交互式 3D 世界。”
实现世界模型面临哪些技术挑战?
尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。虽然一些最新的语言模型可以在现代智能手机上运行,但Sora(多少算一种早期世界模型)需要数千个GPU来训练和运行,尤其是在其使用变得普及的情况下。
世界模型和所有AI模型一样,也会产生幻觉,并内化训练数据中的偏见。一个主要由欧洲城市晴天视频训练的世界模型,可能难以理解或正确描绘韩国城市的雪景。
亚历克斯·马什拉博夫指出,训练数据的匮乏可能会加剧这些问题。“我们已经看到模型在生成某种类型或种族的人物时受到限制,”他说。“世界模型的训练数据必须足够广泛,以涵盖多样化的情景,同时也要足够具体,使AI能够深入理解这些情景的细微差别。”
AI初创公司Runway的CEO克里斯托瓦尔·瓦伦苏埃拉(Cristóbal Valenzuela)在最近的一篇文章中表示,数据和工程问题阻碍了当前模型准确捕捉世界中生物(如人类和动物)行为的能力。“模型需要生成一致的环境地图,”他说,“并具备在这些环境中导航和互动的能力。”
世界模型能为具身智能提供技术基础
如果所有主要障碍都被克服,亚历克斯·马什拉博夫认为,世界模型可以“更稳定地”将AI与现实世界连接起来,不仅在虚拟世界生成方面,而且也在机器人技术和AI决策方面取得突破。
这也可能催生更强大的机器人。如今的机器人在功能上受到限制,因为它们缺乏对周围现实世界(或自身身体)的意识。世界模型可以为它们提供这种意识,至少在一定程度上可以。
“有了先进的世界模型,AI可以对其所处的任何情境形成自身的理解,”他说,“并开始推理出可能的解决方案。”
世界模型能够为人工智能提供理解真实的三维物理世界的能力,使人形机器人真正感知真实世界,对具身智能的实现具有重大意义。
10月31日,一台最大开挖直径达16.64米的超大直径盾构机在湖南长沙下线,将应用于目前世界最长公路水下盾构隧道——海太长江隧道施工。这是我国迄今自主研制的最大直径盾构机,标志着国产超大直径盾构机产业化取得新突破。
“江海号”将应用于海太长江隧道施工
这台盾构机取名为“江海号”,由中国铁建重工集团、中铁十四局集团联合打造,整机长约145米,总重量约5000吨。记者在现场了解到,“江海号”是以海太长江隧道工程跨越长江、毗邻大海两个意向融合命名,其刀盘涂装有向前进击的蔚蓝色巨浪,寓意着盾构机将聚力潜行、通达江海。
海太长江隧道位于江苏省长江入海口区域,北起南通海门区,南至苏州太仓市。工程线路全长39.07公里,过江隧道长11.185公里,采用双向六车道高速公路设计标准,设计速度为100公里每小时。其中盾构隧道段长9315米,最大开挖直径达16.64米,沿线需穿越淤泥质粉质黏土夹粉土与粉细砂复合地层等复杂地质带,最大埋深约75米,最高水压达7.5巴,具有超长距离、超大直径、超高水压、超大埋深、复杂工况等特点。
“江海号”将面临多项挑战
中铁十四局海太长江隧道项目高级工程师宋欢介绍,盾构机将在长江水下完成超长距离独头掘进,特别是在穿越长江及两岸大堤时,沉降要求控制在1厘米之内,施工难度大,且江中地质勘探覆盖的区域有限,不可控的未知区域多,犹如“摸石头过河”。超16.6米超大直径意味着盾构机刀盘开挖所需扭矩大,对主驱动轴承负载大;7.5巴超高水压对主驱动密封、盾尾密封等部件的承压能力要求高,在保持较高性能负载的前提下,如何保证整机在江底复杂环境中连续掘进9315米是研制团队面临的主要挑战和难题。
中国铁建重工集团掘进机研究设计院高级工程师范瑞强介绍,针对项目施工风险和难点,研制团队通过创新攻关,在刀盘刀具、主驱动等关键部件上采取针对性设计,配置具有常压换刀功能的软土刀盘和合金大、硬度高、覆盖广、耐磨强的切削刀具,主驱动配置伸缩功能,可感知刀盘整体受力,有效避免特殊情况下刀盘异常受力造成的主轴承过载,方便换刀作业、辅助刀盘脱困,并配置主驱动状态监测系统,对主驱动运行状态进行连续监控。同时,因地制宜设计盾体外形尺寸、结构厚度,增大油缸规格,优化泥浆环流系统和注浆系统等,强化整机性能,配置管片连接构件智能拼装系统,满足工程施工需求。
据介绍,研制团队还结合多年来在水下和大直径盾构隧道施工经验,通过加大盾构机刀盘开口率,配置高压力、大流量的中心冲刷系统及刀盘结泥饼预警系统,并搭配伸缩摄像装置,无需人员带压进舱即可观察刀盘工作区域情况,有效判别和降低刀盘结泥饼风险,提高底部排渣效率。同时还应用自主研发的第四代同步注双液浆技术,实现盾构隧道沉降的毫米级精度控制,保证施工安全及效率。
我国超大直径盾构机研制实现新跨越
据了解,业界通常把14米及以上直径盾构机称为超大直径盾构机。“江海号”是继直径16.07米“京华号”成功下线并应用后,我国企业自主研制的又一超大直径盾构机。“江海号”的成功下线,标志着我国企业在16米级超大直径盾构机研制和应用领域实现新跨越,已形成超大直径盾构机全产业链产业化发展能力。
海太长江隧道是《长江干线过江通道布局规划(2020-2035年)》和《江苏省长江经济带综合立体交通运输走廊规划》重点推动建设项目,也是江苏“十四五”重点推进的过江通道项目,计划于2028年基本建成。建成后,可以有效分流苏通长江大桥的流量,对落实长三角区域一体化发展和长江经济带发展国家战略,优化长江干线过江通道布局,推动沿江城市群跨江融合发展等具有重要意义。
10月30日,据路透社报道,OpenAI将进行硬件战略调整,旨在优化计算资源和降低成本。OpenAI将引入AMD的MI300系列芯片,同时继续使用英伟达(Nasdaq:NVDA)的GPU。此外,OpenAI还与博通(Broadcom Inc.)和台积电(TSMC)合作,计划于2026年开始生产自研的定制AI芯片。
路透社在报道中提及,OpenAI已组建了由约20名工程师组成的芯片开发团队,其中包括曾参与谷歌Tensor处理器项目的高级工程师。但是,按照OpenAI目前的时间表,定制芯片的真正生产预计要到2026年才能实现。
OpenAI此前主要依赖英伟达的GPU进行模型训练和推理。目前,英伟达的GPU占据超过80%的市场份额,但芯片短缺、英伟达AI算力卡供不应求、成本上升等问题导致OpenAI正寻求替代方案。
通过引入AMD的MI300系列芯片,OpenAI不仅能够确保高性能计算,还能分散供应风险。
除了引入AMD芯片,OpenAI 正在与博通合作开发新的定制芯片,旨在处理其用于AI推理的大型负载,并与台积电合作以确保具备芯片制造能力。
OpenAI原本计划建立一个芯片制造厂网络,但由于成本和时间限制,这项计划已暂时搁置。目前OpenAI将重点投入内部芯片设计,与博通和台积电等行业伙伴合作,以确保芯片供应的稳定性。
训练像ChatGPT这样的AI模型成本高昂。根据此前报道,OpenAI预计今年将亏损50亿美元,而收入为37亿美元。计算成本,即处理大规模数据集和开发模型所需的硬件、电力和云服务费用,是该公司最大的支出。
目前,英伟达的GPU占据了超过80%的硬件市场份额。由于芯片供应短缺和价格上升,促使OpenAI开始探索AI硬件的内部开发或外部替代方案。这一策略与亚马逊、Meta、谷歌和微软等科技巨头相似,即通过定制芯片降低成本并确保AI硬件的获取渠道。但是,谷歌、微软和亚马逊在这一领域的努力已经领先了几个阶段,OpenAI可能需要大量资金才能具备真正的竞争力。
今年10月,OpenAI刚完成66亿美元(约合人民币463亿元)新一轮融资,该轮融资由Thrive Capital领投,微软、英伟达、Altimeter Capital、富达基金、软银及阿布扎比国家支持的MGX投资公司参投,投后估值达1570亿美元。OpenAI希望利用这些资金加强算力资源,持续扩展其AI工具和技术研究的能力。
“发现,启迪,引领。”
9月9日上午,2024年度《麻省理工科技评论》“35岁以下科技创新35 人”(TR35)亚太区入选者名单在上海张江科学会堂发布。相关科技青年论坛同日举行。
该活动是2024浦江创新论坛的相关活动之一。
香港中文大学(深圳)助理教授钱琦、中国科学院动物研究所副研究员翟晶磊、香港大学助理教授赵琦等多位中国科学家入选。
2024年度《麻省理工科技评论》“35岁以下科技创新35 人”(TR35)亚太区入选者。
悖论?要求短时间内发表成果,而创新需要长时间的探索
35位新一届TR35亚太区入选者覆盖了“发明家”、“先锋者”、“创业家”、“人文关怀者”和“远见者”五大类别。他们被认为是亚太区乃至全球科技领域的新星。他们中的许多人可能会成为未来十年、二十年引领科技发展的关键人物。
2014年到2023年TR35亚太区入选者的研究领域统计分析结果显示,占比前三的领域分别是:纳米技术与材料科学、生物技术与医学、能源与可持续发展。
其中,纳米技术与材料科学占比为 27.6%。学科交叉促进材料的创新正在亚太地区加速,并在信息量子、生物医疗、能源环境等领域展开技术融合与应用。
生物技术与医学占比为 26.5%。面对人口压力,他们用创新追求生命的质量,
能源与可持续发展占比为 15.1%。他们关注亚太地区面临的挑战,探索能源替代与优化方案。
9月9日,论坛嘉宾、美国东北大学植物与人类界面研究所所长翁经科向澎湃科技表示,他认为,年轻科学家在创新道路上面临的最大挑战之一,是如何平衡学术压力与长期的创新需求。很多时候,他们需要在短时间内发表成果以获得科研资助和职业发展的机会,但真正的创新往往需要长时间的探索和积累。此外,随着科学技术的快速发展,他们还需要在技术迭代和多学科融合中保持前瞻性思维和创造力。
翁经科向澎湃科技表示,“我的建议是,首先,保持对科学的好奇心,敢于冒险探索未知领域。跨学科合作非常重要,因为从不同的视角思考问题往往能激发创新的灵感。”“此外,年轻科学家必须培养沟通技能,学会将自己的科研成果有效传达给外界,吸引更多人加入他们的愿景,与他们合作,并为他们提供资金支持。”
翁经科强调,能够清晰地传递科学理念,是确保科学家们在创新道路上可持续发展的关键因素。
他说,值得注意的是,像托马斯·爱迪生、史蒂夫·乔布斯和埃隆·马斯克这样的伟大创新者,他们不仅拥有深厚的技术背景,还擅长通过非凡的沟通能力吸引合作者和资源。总之,创新需要的不仅是科学能力,还需要广泛的合作与持续的资源支持。年轻科学家在这个过程中,不仅要专注于科研,还要积极向外界分享他们的愿景,吸引更多的合作机会和资源,以确保其创新事业的可持续发展。
室温超导材料能很快改变能源利用的现状?
嘉宾、中国科学院物理研究所研究员罗会仟在论坛上报告的主题是“室温超导的梦想与现实”。
他表示,自1911年发现第一个超导体以来,科学家们不断探索,目前已发现上万种超导材料,不断刷新超导体的临界温度,并希望最终能够实现临界温度在300K,也就是27℃以上的“室温超导体”的梦想。在超导研究的一百多年里,常有各种新型超导体甚至是“室温超导体”被报道,甚至有些是兼具零电阻和抗磁性两大判据,并且在学术期刊上正式发表了,但它们从未被确证,即无法被其他研究组独立重复实验结果。可以肯定地说,目前并没有任何靠谱的“室温超导体”!
中国科学院物理研究所研究员罗会仟。
如果我们找到能用的室温超导体,是不是很快就可以改变能源利用的现状呢?
罗会仟表示,答案是建议大家先冷静一下。以1986年就发现的铜氧化物高温超导材料为例,它们存在各种难以克服的应用难题,科学家们努力了近40年才勉强可用!即使室温超导材料被发现,且能用,到规模化应用,依旧需要很长的时间。
在圆桌讨论中,香港大学高级研究员、香港长寿医学中心主任、Quantum Life创始人兼首席执行官黄园,与浙江大学百人计划研究员李炫祯(Hyeon Jeong Lee)、(前)新加坡国立大学N.1健康研究所数字医疗创新负责人Agata Blasiak,以及同时担任杜克大学和昆山杜克大学研究员、BioPharmaTrend记者、长寿教育中心负责人的Dominika Wilczok,共同就“打破边界,推动亚太地区可持续发展”这一议题展开讨论。
此外,中国青年科学家代表——清华大学深圳国际研究生院助理教授董恺琛、清华大学副研究员唐城、远也科技创始人兼CEO丁也,以及厦门大学医学院教授、研究员王乐韵,也在圆桌讨论中围绕当前中国科技创新的机遇与人才发展等核心话题进行交流。
附2024 年度《麻省理工科技评论》“35 岁以下科技创新 35 人”亚太区入选者名单(以下排名不分先后):
1 Ady SUWARDI 香港中文大学助理教授
2 江欣莹 新加坡南洋理工大学李光耀博士后研究员
3 陈雨沛 中山大学肿瘤防治中心副主任医师/研究员
4 赵琦 香港大学助理教授
5 姜凯议 麻省理工学院生物工程系博士生
6 姜志亨 韩国首尔国立大学副教授
7 Akanksha Thawani 美国加州大学伯克利分校博士后研究员
8 牛思淼 美国罗格斯大学生物工程系助理教授
9 蒋琦 中国科学院半导体研究所研究员/教授
10 黎鹏举 美国芝加哥大学博士研究生
11 翟晶磊 中国科学院动物研究所副研究员
12 吴佳俊 美国斯坦福大学计算机系助理教授、心理系兼职助理教授
13 Prashant Kumar 新加坡南洋理工大学助理教授
14 宁子杨 宁德时代固态电池首席技术官
15 唐乙正 英国Isomorphic Labs科学家
16 夏波 哈佛大学哈佛学会青年学者;麻省理工学院-哈佛大学博德研究所基因调控独立学者及实验室负责人
17 Karan Ahuja 美国西北大学助理教授
18 朱迪 新加坡国立大学助理教授
19 邱晨光 北京大学助理教授
20 宋佳铭 美国Luma AI首席科学家
21 Alex Aliper 美国英矽智能公司(Insilico Medicine)联合创始人兼总裁
22 Ludwik Kranz 澳大利亚硅量子计算公司量子系统工程负责人
23 廖婉如 新加坡科技研究局首席科学家;新加坡南洋理工大学南洋助理教授
24 Neil Robinson 澳大利亚西澳大学研究员
25 Anurag Kumar 美国Meta Research科学家
26 商珞然 复旦大学研究员
27 朱毅斌 清华大学助理研究员
28 张海天 北京航空航天大学教授
29 韩庚沅 韩国首尔国立大学助理教授
30 Dmitrii USTIUGOV 新加坡南洋理工大学助理教授
31 朴志珉 韩国科学技术院助理教授
32 陈永谘 新加坡国立大学助理教授
33 赵安娜 澳大利亚悉尼大学讲师/助理教授
34 钱琦 香港中文大学(深圳)助理教授
35 Nako Nakatsuka 瑞士洛桑联邦理工学院助理教授
“激动、人工智能、未来”,9月6日,在结束了2024 Inclusion·外滩大会当天的演讲后,美国硅谷创业教父、创业孵化器Founders Space创始人史蒂夫·霍夫曼(Steve Hoffman,以下简称霍夫曼)用这三个词表达了他的感受。
自2016年第一次来到中国后,史蒂夫·霍夫曼近年频繁来到中国,参加中国许多大型经济论坛和创业相关的峰会,为中国创业者进行创业培训。在过去这些年里,他观察到中国的创业群体正在发生变化,当前中国的创投界出现了一批年轻创业者,这批创业者毕业于全球顶尖院校,他认为这批创业者代表着未来,“我称之为精英创业者,他们拥有全球视野、了解中国的内部政策以及中国的商业生态系统是如何运作的,所以,他们能够清楚地认知到未来巨大的商业机遇在哪里。”
他认为中国创业者拥有得天独厚的优势,即巨大的消费市场、强大的制造业以及工程师红利,中国企业可以利用这些优势进军全球市场,在移动互联网时代,中国企业创造了风靡全球的应用产品,在AI时代,中国企业仍然拥有巨大的机会。
以下是澎湃科技对话史蒂夫·霍夫曼:
澎湃科技:你最早是因为什么契机来到中国?
霍夫曼:我最早是2016年来中国,当时我在硅谷做完演讲,邀请人认为我表现得很好,所以请我来中国。2016年之前我对中国基本没有了解,也不懂得中国的文化和语言。过去这些年,我来过很多次中国,在中国与上千位的企业家合作过,也经常参加中国许多大型经济论坛和创业相关的峰会,为中国创业者提供培训。
2016年来到中国后,我对中国的看法完全改变了。我开始研究5000年的中国文化,我尝试了解中国人是如何思考的,这让我大开眼界。我认为中国有丰富的思想、文化,有非常独特的看待世界的方式,中国的企业家也非常渴望能创业成功。
澎湃科技:当时有考虑在中国投资孵化器吗?
霍夫曼:最初,我并未想在中国投资或者将孵化器落地,但我来了之后,当时正值创业风潮盛行,中国政府提供了许多创业基金和各种帮助,我看到了一个机会,让我在中国和硅谷之间建立一座桥梁。所以我和我的中国伙伴在中国成立了一个孵化器,而且我们配合得很默契,之后我们的孵化器陆续在很多城市落地。但后期因为疫情,我当时无法来到中国,最后只能暂停。
澎湃科技:2016年和现在相比,你觉得中国创业环境有变化吗?发生了哪些变化?
霍夫曼:我第一次来中国时,我觉得中国的创业者非常天真,他们并不真正了解如何建立好的企业,当时我在教他们一些最基础的创业的知识,譬如产品市场适合度、如何制订商业计划,设计商业模式,以及理解客户等,当时很多年轻的创业者不理解这些概念。
现在,我遇到的中国创业者,他们中许多人都有在国外学习的经历,了解新的技术,知道如何建立伟大的企业,因此我也不需要再去教基础的内容。现在我教的内容层次更高,比如如何利用人工智能技术改变你的公司业务,如何利用新技术在不同的垂直市场寻找机会,以及未来会出现什么样的技术,它们将如何改变我们的社会和我们的事业。
澎湃科技:在你的观察中,中国和海外的创业生态环境有什么不一样?
霍夫曼:我认为最大的区别在于,硅谷会为创业者提供教育帮助,花很多时间教育他们如何创业,而且会提供很多指导性业务。中国的孵化器更多的是给创业者提供空间,我们想要改变这种模式,目前我们在中国重点关注的就是创业者教育。
今年我们会有更多关于AI、电子教育、数码传播、创新策略传播等领域的创业培训项目。我们的课程不是免费的,是类似创业营这样的项目。
澎湃科技:将硅谷的孵化器模式引入中国,这个过程有哪些困难?
霍夫曼:最大的困难是费用和成本。因此我们除了会把一部分海外导师带到中国来,也会展开一些线上培训,同时也会在国内寻找一些资深且有资历的导师。
澎湃科技:如何看待中国人工智能领域的创业者?
霍夫曼:这些创业者有巨大的潜力,尤其是在海外顶尖大学接受过教育的这批创业者,他们知道硅谷现在发生了什么,他们了解世界上正在发生的事情。这批年轻创业者,可以把这些想法带回中国。
所以对我来说,这些创业者就是未来,我称他们为精英企业家。他们拥有全球视野、了解中国的政策以及中国的商业生态系统是如何运作的,所以,他们能够清楚地认知到未来巨大的商业机遇在哪里。
澎湃科技:在你看来,中国的大模型创业与美国和海外的大模型企业目前有何区别?
霍夫曼:美国的大语言模型有更多的数据和更强的处理能力,它们由最新的英伟达芯片驱动,资金雄厚,所以他们在大模型性能上领先于中国。我们看到中国正在迎头赶上,但是没有人能预测中国什么时候会追赶上,但我们知道,中国现在正非常努力地缩小中美大模型的差距,所以庞大的资本是最重要的。我想说的是,差距不一定在代码中,因为很多代码都是开源的,但差距主要是芯片技术。
澎湃科技:那中国大模型创业者的优势和机遇在哪里?
霍夫曼:中国企业家的优势在于中国拥有核心基础设施及供应链,有自己的生态系统,数据和政策,这些只有中国企业家才能真正利用。
中国企业可以利用这些从中国走向世界。我有一个很好的案例,我现在在中国和一个年轻的AI智能家电公司合作,这家公司创始人很年轻,她和丈夫一起开创了这份事业。她把供应链和工厂设在中国,但在美国开拓市场,如今她的产品在美国的细分市场销量占据第一。她很有创新精神,所以在中国从今天起建立一家全球化公司是完全可能的,但前提是你必须聪明。
澎湃科技:你认为在AI时代,最受欢迎的应用App会出现在中国吗?
霍夫曼:当然,中国一直有创新,这是世界第二大市场。中国会有更多的工程师和企业家,会以各种不同的方式创造出具有全球化的商业公司。
澎湃科技:请你对中国年轻一代的科技创业者给些建议
霍夫曼:如果你是今天中国的创业者,我建议你做一件事,先看看每个人都在往哪里走,所有其他企业家都在往哪里走,以及所有风险资本的去向,然后你要去另一个方向,不要做大家都在做的事情,你要寻找你自己的道路。你必须有独创性,不能照搬别人的做法。不要追逐金钱,追逐你的梦想,你就会成功。
9月9日,由科技部和上海市人民政府共同主办的2024浦江创新论坛——绿色低碳创新论坛在上海市虹口区举行。
举办6年以来,这一面向全球的绿色技术交流平台影响力持续攀升。
为推进落实科技部“一带一路”可持续发展技术专项合作计划,在科技部国际合作司支持下,上海科学技术交流中心于今年6月发布“低碳技术创新合作中国(上海)行交流计划”。
在9月9日举行的论坛上,上海市虹口区委常委、副区长关也彤,上海市科学技术委员会二级巡视员郑广宏,上海科学技术交流中心主任王震,云南省科学技术院副院长马敏象共同启动了“低碳技术创新合作中国(上海)行”活动:来自文莱、埃及、印度尼西亚等10余个国家的13位低碳合作伙伴,将围绕低碳重点技术领域开展为期6天的低碳中国行活动,与上海重点高校、院所、企业面对面,建立多方交流机制,推动国际经验和成果共享。
本届绿色低碳创新论坛以“科技创新塑造未来能源产业新格局”为主题,重点探讨未来能源发展路径,加快构建“科技-产业-金融”良性循环体系。
上海市虹口区委常委、副区长关也彤在致辞中表示,全球气候变暖导致的自然灾害频发、资源不可持续等问题,已经成为全人类共同面临的巨大挑战。中国开展以绿色低碳技术为核心的技术革命,既是对当前自然环境变化的有效应对,更是向全人类作出的庄严承诺。近年来,虹口区坚定不移推进碳达峰碳中和战略进程,积极推动经济社会发展全面绿色转型;集聚了一批功能性平台机构,汇聚了众多绿色低碳服务产业链上下游企业,构建了较为完整的绿色低碳服务产业新格局围绕绿色航运、绿色金融、绿色贸易、绿色技术以及碳资产交易五大重点领域,推进“科技-产业-金融”的良性循环发展。
上海市科学技术委员会二级巡视员郑广宏在致辞中表示,近年来,上海始终走在能源科技创新的前沿,聚焦清洁能源、智能电网、新型储能、氢能与燃料电池等热点领域,持续推进了一系列重大科技项目,取得了具有国际竞争力的显著成绩。面向未来,上海将进一步加大能源基础科学中前瞻性、颠覆性技术的研发, 共性和关键技术装备的布局和引领;深化产学研合作,实现能源科技从实验室走向市场,真正惠及经济社会发展;加强国际合作,共享能源创新成果,共同应对能源挑战。
在签约环节,安徽颍冕科技有限责任公司、绿色技术银行(上海)科技发展有限公司分别与上海海事大学签订“甲醇增程动力船舶关键技术开发与应用示范协议”“绿色低碳航运合作框架协议”,将合作开展产学研深度合作,持续推进长三角地区交通领域的甲醇燃料应用,为长三角航运绿色低碳一体化发展提供有力支撑。
此外,绿色技术银行(上海)科技发展有限公司与武汉双碳产业发展服务有限公司签订“双碳合作战略协议”,共同筹建“碳足迹服务公共平台”。该平台聚焦于碳足迹的精准计算,同时集ESG数字化管理,CBAM智能辅助填报等功能为一体,为企业提供一站式绿色转型解决方案,助力武汉与上海两地的全国碳市场中心和碳金融中心建设。
在主题报告环节,中国工程院院士,华东理工大学资源与环境工程学院党委副书记、院长汪华林,昆山协鑫光电材料有限公司董事长范斌等专家分别围绕《碳中和目标驱动绿色低碳设计创新》《钙钛矿叠层组件产业化进展报告》等主题进行分享。
昆山协鑫光电材料有限公司董事长范斌博士。
9月9日,2024浦江创新论坛——绿色低碳创新论坛在上海市虹口区举行。
作为论坛嘉宾,国际知名钙钛矿技术领跑企业、昆山协鑫光电材料有限公司董事长范斌博士作“钙钛矿叠层组件产业化进展报告”主题分享,并接受了澎湃科技的专访。
一束光照过来,它就能发电。钙钛矿是像晶体硅一样能够进行光电转换的材料,可以被用于光伏发电。不同的是,钙钛矿的光电转换等性能更佳。
“也许十年、二十年之后会有别的选择,但目前,有且仅有钙钛矿这一个材料可以实现(光电转换)效率的突破。” “其实光伏企业就像100年前的石油公司一样。”范斌说,这是一个巨大的市场,“光伏发电占国内发电量的占比,在我们刚入行的时候只有0.1%,几年过去,目前已经达到4%。我相信,将来可以占到70%以上。”
范斌表示,除了进一步提高钙钛矿光伏组件的光电转换效率和产品质量,目前他还想做的是,建尽可能多的示范电站,然后运行足够长的时间。他认为,只有这样,才能够让所有的用户相信钙钛矿可以跟晶体硅一样稳定、可靠。“毕竟实验室的模拟,不可能代表现实中的所有工况。”而建设和运行更多的示范电站,就需要相关政策的鼓励和政府相关部门的支持。
昆山协鑫光电材料有限公司成立于2019年,主要从事大面积钙钛矿光伏组件的研究、开发及量产,由协鑫、腾讯、淡马锡、红杉、IDG等共同投资。
非钙钛矿不可? 别无选择!
范斌表示,钙钛矿材料最大的价值在于光电转换效率高,“不是说‘一骑绝尘’,而是唯一的选择。”“目前,有且仅有钙钛矿这一个材料可以实现(光电转换)效率的突破。”“远远高于大自然光合作用的转换效率。”
范斌表示,目前钙钛矿/晶硅叠层电池的光电转换效率已经可以做到接近35%,而小麦田间光合作用的转换效率大约1%到2%;效率最高的是甘蔗,大约5%到6%。
钙钛矿既不是钙,也不是钛。它原本是一种由无机物钛酸钙组成的天然矿物的名字,目前被用作一类材料的统称。人们目前还在不断研发、合成新“配方”的钙钛矿材料。虽然它们的成分已不是钛酸钙,但它们都跟钛酸钙拥有相同的晶体结构。
1839年,柏林大学矿物学家古斯塔夫斯·罗斯(Gustavus Rose)在欧亚两洲的分界线乌拉尔山脉发现了天然的钙钛矿。
2024年SNEC上海光伏展协鑫光电展示的三块大尺寸钙钛矿组件产品,从左至右依次为钙钛矿BIPV组件、钙钛矿晶硅叠层组件(效率26.36%@1.71 平米)、钙钛矿单结组件(效率19.04%@2平米)。
据科技日报报道,钙钛矿是具备相同晶体结构的一类“陶瓷氧化物”的统称,分子式为ABX3。南开大学电子信息与光学工程学院教授罗景山介绍,根据材料的元素组成,可以将钙钛矿大致分为三类:复合金属氧化物钙钛矿、有机杂化钙钛矿、无机卤素钙钛矿。现在用于光伏的钙钛矿通常是后两种。
晶体硅和钙钛矿都能用作光伏材料,实现光电转换。
范斌介绍,“2016年的时候,晶体硅在实验室内的光电效率是26.8%,到今年它的实验室转换效率是27.3%。这么多年过去,平均每年提升不到0.1%,基本上到头了。”
“量产晶体硅的光电转换效率大概在22%到23%之间,而且明显上不去了,而我们量产钙钛矿的转换效率可以做到26%到27%。如果跟晶体硅叠在一起,做成双结的电池,我们相信可以实现35%以上的光电转换效率。”
协鑫光电是全球最早涉足钙钛矿领域的企业之一。
范斌表示,“在钙钛矿产业领域,协鑫光电目前是公认的全世界做得最好的企业,是第一梯队,有且仅有我们一家。”“从2013年就开始深耕大尺寸钙钛矿组件技术,在积累了十多年后,除了100兆瓦的产线投产,公司首条吉瓦级钙钛矿商用组件项目将于2024年底竣工。”“100兆瓦是指产线一年能够生产合计100兆瓦的光伏组件。”
最大的挑战
范斌介绍,晶体硅是从砂石等材料中提纯获得的材料,结构简单而稳定,而钙钛矿材料是人为设计、人工合成的晶体,包括成千上万种材料,“复杂而敏感”。
但范斌不认为“钙钛矿材料复杂而敏感”是一个很大问题。他举例说,铅酸电池很稳定,也很耐用,可以连续使用几年,但锂电逐渐被替代了。虽然锂电在碰撞中会起火、燃烧甚至爆炸。锂电的能量密度高,风险随之上升。用锂电,就必须要接受它的风险。钙钛矿材料复杂而敏感,需要更高水平的技术才能驾驭。
钙钛矿与晶硅电池叠层后,可以有效吸收不同波长的光,提升整体光电转换效率。
虽然目前钙钛矿材料还存在转换效率需要进一步提高、稳定性有待进一步提升等问题,但范斌认为,钙钛矿产业化最大的挑战是,没人做过这件事,“这个产业以前不存在” 。
他解释说,晶体硅相关的光伏技术大都是从国外引进,并进一步开发的,而钙钛矿在实验室里被用于太阳能电池是2009年。仅仅花了15年时间,人们就把一个实验室里的东西,逐渐地做到产线上能够使用、生产,然后开始有一些早期的商业应用,这完全是从无到有。
“大规模铺开、应用,还需要过一关,就是大家相信它可以用”,范斌说,所以需要建足够多的示范电站,运行足够长的时间,让更多人看到并产生信任。“我们现在的100兆瓦生产线是2021年跑通的,然后2021年就开始逐渐做示范验证,2023年我们去青海开始建示范电站。”
范斌表示,虽然现在光伏发电的成本已经比火电便宜大概20%,然而光伏发电有一个显著的问题,就是只能白天太阳出来的时候发电,阴雨天或晚上没办法发电。所以,光伏发电要想替代火电,需要搭配储能,把白天发的电“储存”起来。但这样的成本会不会比火电的成本更高?解决的办法是,进一步降低光伏的成本,进一步降低储能的成本。这就要求进一步提高光伏材料的光电转换效率。未来的钙钛矿光伏组件可以部署到海上,部署到沙漠里,也可以分布式地部署在屋顶上,或玻璃幕墙里。
协鑫光电吉瓦级钙钛矿商用组件项目规划图,项目将于2024年底竣工。
他表示,人们还有一个担心。晶体硅很稳定,一般可以用25年、30年。而相关的投资回报都是基于25年到30年的产品使用寿命来计算的。那么,对钙钛矿,大家关注的也是投资回报率:25年或30年里,它发的电,能不能每年都收回来?
范斌说,“我们不怕竞争。” 他对自己的研发团队和公司有信心。他认为,更多公司的参与,有助于整个技术生态的成熟。竞争带来的不仅是压力,还有产业链的完善和资本的汇聚。“做的人越多,配套的供应商也就会越多,调用的资本量也会越大,技术进步才会越快。”
斯坦福大学教授李飞飞的创业公司有了新进展。9月13日,其创立的空间智能初创公司World Labs正式宣布完成2.3亿美元的巨额融资,投资方包括硅谷知名投资机构a16z、NEA、加拿大风投公司Radical Ventures,以及英伟达公司的风险投资部门等。
据彭博社报道,众多AI领域的知名人士也参与了投资,包括谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)和前谷歌AI研究员杰弗里·辛顿(Geoffrey Hinton)。辛顿因推动机器学习领域的发展而闻名,被誉为AI教父。
李飞飞创立的空间智能初创公司World Labs成员
World Labs官网介绍,该公司旨在开发能够利用图像和其他数据对三维世界进行决策的软件,致力于构建“大型世界模型”。该公司计划生成虚拟的三维空间,用户可以控制其中的物理等变量,并允许人们创建自己的三维“世界”。李飞飞表示,这项技术对艺术家、设计师、开发者和工程师等职业群体都有重要意义。
World Labs指出,当前的生成式AI模型只能通过文本、音频和视频与世界互动。然而,人类则以三维空间的形式体验世界,其中的物理规则与时间的流逝息息相关。“为了超越当今模型的能力,我们需要具备空间智能的AI,能够在3D空间和时间中对物体、地点和交互进行建模和推理。”
李飞飞在社交平台X表示,“在AI领域中真正难以解决的问题是什么?我的答案是空间智能”,并称这项技术可以赋能并实现在创造、设计、学习、AR/VR、机器人等领域无数可能的用例。李飞飞在接受彭博社采访时也提到,“它具有广泛的应用场景,包括未来的机器人技术和制造业。”
李飞飞在社交平台X上官宣
另据《连线》杂志9月13日报道,World Labs计划于2025年推出首款产品,第一阶段将专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实(AR)技术和机器人技术等领域。
a16z合伙人Martin Casado表示,World Labs的产品可能面向游戏公司或电影制片厂。与ChatGPT类似,模型本身就可以作为产品,客户可以直接使用模型,或将其应用于其他程序。
World Labs于今年1月成立,由李飞飞和贾斯汀·约翰逊(Justin Johnson)、克里斯托夫·拉斯纳(Christoph Lassner)和本·米尔登霍尔(Ben Mildenhall)联合创立,三人均在AI领域拥有丰富的经验。其中贾斯汀·约翰逊是李飞飞的博士生,现为密歇根大学的助理教授;克里斯托夫·拉斯纳曾在亚马逊、Meta的Reality Labs和Epic Games工作,发明了基于球体的高效可微分渲染器Pulsar;本·米尔登霍尔是神经辐射场(NeRF)技术的发明者,该技术可以将2D图像转换为3D图形。World Labs目前总部位于旧金山,拥有20名员工。
李飞飞在接受彭博社采访时说道:“我相信空间智能是我接下来的北极星,它将改变AI的发展轨迹。”然而,《连线》杂志的记者指出,World Labs的愿景与此前迅速消退的热炒概念“元宇宙”有些相似。对此,World Labs的创始人则解释说,元宇宙之所以短暂,是因为当时的热潮基于一些有前景的硬件,但缺乏真正的互动内容,而他们认为,世界模型或能够填补这一空白。
30岁的诺兰·阿布(Noland Arbaugh)是埃隆·马斯克旗下脑机接口公司Neuralink的脑机接口芯片第一例植入者。8年前的一场事故让他从肩部以下瘫痪,今年手术后,他来到巴黎参加一场大型国际象棋锦标赛。日前,他向欧洲新闻电视台分享了脑机接口手术后的生活变化以及对未来的期望。
诺兰·阿布22岁时在宾夕法尼亚州的一个夏令营工作时发生了一次事故,他在湖里时被意外撞到,导致身体瘫痪。接下来的几年里,他不断进出医院,直到他申请参加了Neuralink的试验。但对于大脑手术,他确实感到担忧。
“作为一个四肢瘫痪者,我最宝贵的就是大脑。事故发生后,我非常感激自己仍然保有认知功能,这是我身份的重要部分。”阿布表示,“让别人对我的大脑进行手术不是一个轻易的决定,但我相信利大于弊。我知道,如果可能我可以帮助推动这个领域的进步。”
今年1月,阿布接受了Neuralink的大脑芯片植入。这项技术通过一个硬币大小的装置实现,外科手术将其植入头骨中。装置有超细的线连接到大脑,形成脑机接口。植入物可以检测大脑活动,通过蓝牙连接传输到电脑等设备。
但在植入仅一个月后,阿布发现效果不佳,因为许多连接大脑的细线从植入物中脱落,导致可测量大脑信号的电极数量急剧减少,“只有一个月的有效时间,感觉就像一个残酷的玩笑,那段时间真的很难熬。”几天后他重新振作起来,“我当时的想法是,即使发生了问题,我也知道这将有助于未来的改进。”
Neuralink的第二位患者在8月也接受了植入,Neuralink称,没有出现线回缩的迹象。现在Neuralink的脑机接口更关注电极组,过滤掉发送弱信号的电极组并只接收更强的信号。阿布表示,现在他的植入物再次运作良好。
今年3月,马斯克发布了一段阿布用意念控制鼠标光标下国际象棋的视频。在手术前,阿布需要使用口棒等辅助设备来移动鼠标。手术8个月后,他来到了巴黎,参加国际象棋锦标赛。“在拥有Neuralink之前,下棋对我来说非常困难,身体承受着巨大压力。我只能用特定姿势,持续时间也有限。”阿布在巴黎接受欧洲新闻电视台采访时表示,“现在如果我愿意,我可以躺在床上下几个小时棋。”
不仅如此,他还利用这项技术学习法语和日语。“很多人可能会觉得这像《黑客帝国》,可以直接将知识下载到大脑中。”但阿布表示,实际上“它帮助我更高效地与电脑互动,从而学习新知识”。在拥有脑芯片之前,他只能通过观看YouTube视频来学习,互动性差,还需要他人帮忙播放和暂停。现在,他可以自主写作、浏览报纸、播放有声读物等。
谈及未来,阿布希望继续深造。“我一直以来都想上法学院,这仍然在我的计划中,而且我相信是可能的。”他还表示,参与Neuralink的试验让他对神经科学产生了浓厚兴趣,因此未来的方向尚未完全确定。
对于脑机接口的未来,阿布充满希望。他相信有一天这些技术可以让瘫痪患者重新站起来,“我相信这是可能的,而且我认为会在我有生之年实现。”
据欧洲科技信息网站Tech.eu9月19日报道,英国量子计算初创公司Oxford Ionics联合创始人称,量子计算将在未来18个月至两年内迎来“ChatGPT时刻”。
Oxford Ionics成立于2019年,总部位于英国牛津郡,联合创始人克里斯·巴兰斯(Chris Ballance)和汤姆·哈蒂( Tom Harty)均毕业于牛津大学物理系。该公司致力于通过独特的离子阱技术构建精确可靠的量子系统。
在Tech.eu的播客节目中,Oxford Ionics联合创始人克里斯·巴兰斯和汤姆·哈蒂讨论了公司的进展和量子计算的未来。巴兰斯表示:“量子计算的ChatGPT时刻将在未来18个月到两年内到来,届时人们会突然意识到,这项技术真的已经来临,并能够访问量子计算机进行颠覆性的创新。”
Oxford Ionics 展示了世界上性能最高的量子芯片,可以在标准半导体制造厂大规模生产。
来源:Oxford Ionics
Oxford Ionics已开发出一款可量产的芯片。今年早些时候,Oxford Ionics赢得了一份价值600万英镑的政府合同,为英国国家量子计算中心(NQCC)交付一台量子计算机。量子计算机能够解决传统计算机无法处理的复杂问题,让快速执行复杂计算成为可能。
巴兰斯还提到,量子计算可以为金融机构带来帮助。“有许多银行非常认真投入其中,拥有20-30名拥有量子计算博士的团队研究如何最佳利用量子计算机在市场中获得竞争优势。”对于人才争夺战,他还表示Oxford Ionics正在与美国科技巨头展开角逐。巴兰斯补充道,“我们的任务就是要比谷歌、微软和亚马逊更具吸引力。”