新模型周周见,Anthropic前脚推出混合推理模型Claude 3.7 Sonnet,OpenAI立马打出GPT-4.5这张牌。当地时间2月27日,OpenAI推出GPT-4.5,其追随用户意图的能力更强,“情商”更高。OpenAI CEO山姆·奥特曼将其形容为“是一种不同的智慧”,有一种他从未感受过的魔力。
虽然GPT-4.5作为一款非推理模型展示了在预训练进一步扩展后的能力提升,包括更高的准确性和更少的幻觉。但值得关注的是,在DeepSeek掀起开源潮和降价潮后,显然海外市场并没有被“卷”到,这次的GPT-4.5定价堪称“非常贵”,导致很多人感叹“一般人可用不起”。但从另一方面来看,中国科技企业开拓海外市场的必要性好像更大了。
“情商”更高,更懂暗示
据了解,GPT-4.5在扩展预训练和后训练规模上迈出一步,OpenAI通过扩展无监督学习和推理两个互补范式来提升人工智能的能力。扩展推理让模型在做出反应之前进行思考并产生一系列思维链,从而能够解决复杂逻辑问题。无监督学习提高了世界模型的准确性和直觉,GPT‑4.5提高了识别模式、建立联系和无需推理就能产生创造性见解的能力。
OpenAI表示,与OpenAI o1和OpenAI o3‑mini模型相比,GPT-4.5是一个更通用、天生更智能的模型。早期测试表明,与GPT‑4.5交互更自然。GPT‑4.5更广泛的知识基础、更强的追随用户意图能力和更高的“情商”,使它在提高写作、编程和解决实际问题等任务上有效。GPT‑4.5能更好地理解人类的意思,并以更细微的差别和“情商”来解释微妙的暗示或隐含的期望。
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰表示,GPT-4.5的推出,印证了美国大模型继续走“大力出奇迹”的尺度定律路线,算力、数据、模型都是顶级配置,以更大的算力、更多的数据,训练出效果更好的模型,“GPT‑4.5的预训练阶段算力非常大,用了10倍的算力来做训练。”
“神仙”按月打架,重视技术储备
“今年大模型会出现你追我赶的节奏,OpenAI现在采取的策略像是 ‘领先半步’。”田丰表示。
在GPT-4.5推出前,OpenAI内部至少在迭代两个模型版本,即针对GPT-4.5和GPT-5进行测试、工程优化、产品化对齐等。“OpenAI有资金、人力、算力做双版本的储备,其他公司要跟上节奏,也必须做到。”他表示,在当前竞争周期越来越长的情况下,无论是国外的Anthropic,还是国内的DeepSeek,都需要有更多技术储备投入。
“头部大模型公司按季度更新模型版本,最慢100天,短的话30天,‘神仙打架’已经按月来打,一个季度就是一场巡回赛了。如果跟不上这个节奏,就要在产业链上找到自己的优势。”田丰表示,“大模型厂家如果不能每一两个月推出一个新版本,可能会憋大招,憋三五个月憋出一个好版本追上现在的大模型也是可以的。”
他认为,当前最值得关注的国外大模型是OpenAI的GPT-4.5、Anthropic的Claude 3.5、马斯克旗下AI公司xAI的Grok 3,尤其是三者间的逻辑推理能力对比更有价值。其中,Anthropic日前推出的混合推理模型Claude 3.7 Sonnet具有“系统一”和“系统二”两套系统,既可以快速回答用户问题,也可以针对复杂问题启动“系统二”的深度思考,思考时间会更长,就像人类一样。从这个角度看,Claude 3.7 Sonnet在架构的双系统层面具有一定的领先性和启发意义,“在数据和算力遇到瓶颈时,会把创新集中在模型架构层面,探索方法上的创新、工程化的创新、架构上的创新。”
田丰表示,GPT-4.5等模型将加速补全基础模型通用知识领域,增强复杂推理质量和情绪感知,基础模型负责高水平通用能力,AI应用负责行业逻辑。Grok3会在空间智能领域发力,加速具身智能体的“ChatGPT时刻”到来。垂直领域的专业模型也会成为中国大模型的竞技场,中国在机器人产量、使用规模方面更有优势。
庞大但昂贵
在对GPT4.5的性能给出了高度评价的同时,山姆·奥特曼也表示这是一个“庞大且昂贵”的模型。
据悉,调用GPT-4.5的API目前的输入价格为75美元/百万token,输出价格为150美元/百万token,不仅高于GPT以往的模型,也高于市场其他模型。以Claude 3.7为例,调用其API,输入百万token的收费为3美元,输出则为15美元。
跟国内模型更是不能比,DeepSeek-V3最近给出了错峰优惠政策,在凌晨时段,调用DeepSeek-V3的API输入百万token只需要0.25元,即便是非优惠时段也不过是0.5元;输出百万token的优惠价格是4元,标准时段价格为8元,定价均为人民币。
在业内人士看来,OpenAI的定价之所以如此之贵,一方面是其算力成本真的很高,另一方面也说海外市场和国内市场的定价策略遵循了不一样的逻辑,OpenAI仍然可以依赖技术优势获得更高的溢价。
田丰表示,OpenAI目前也面临GPU不够用的难题,GPT‑4.5推理成本高、算力开支大,导致用户使用昂贵,难以全民推广和使用。
OpenAI CEO山姆·奥特曼在社交媒体坦言,“我们真的很想同时为Pro用户和Plus用户推出,但我们已经发展得很快了,GPU也用完了。我们将在下周增加数以万计的GPU,向Plus用户推出服务。”ChatGPT Pro的月费是200美元。GPT‑4.5目前不支持ChatGPT中的语音模式、视频和屏幕共享等多模式功能。
Hugging Face工程师王铁震认为,OpenAI的定价策略之所以没有被DeepSeek“卷”到,是因为国内市场和海外市场原本就是不一样的定价策略。另有大模型从业人士认为,OpenAI仍然走的是“高服务定价-高企业估值”的业务逻辑,“追求技术快人一步,然后享受技术溢价”。
田丰认为,相对于美国企业的“大力出奇迹”,国内目前的大模型路线是以极致性价比实现更好的模型效果,“两边走得会越来越不一样,但最终都会拉到一个竞技场上去PK。”
在王铁震看来,国内市场“卷价格”已经遍布各行各业,相比之下,海外市场享有更高的利润,海外市场能够接受技术带来的溢价,这也是近年来中国企业集体出海的一个重要动力,但中国大模型企业要想走入海外市场,会面临和中国电动车等其他行业出海一样的挑战,这些挑战将不止于价格、技术和性能。
·研究人员发现,在生物医疗领域,尽管“定制版”垂类模型应用对于医学自然语言处理上仍有优势,但涉及复杂的推理,尤其是医学问答方面,闭源通用大模型GPT-4则更有明显优势。
澎湃新闻记者 蒋立冬 AI创意
大模型在生物医疗领域的应用情况如何?哪种模型更加适用?4月6日,《自然·通讯》(Nature Communications)杂志刊登了一项由耶鲁大学医学院的研究人员对大语言模型(LLMs)在生物医学自然语言处理(BioNLP)中的全面评估与应用指南(《Benchmarking large language models for biomedical natural language processing applications and recommendations》,以下简称“指南”)。在该份指南中,研究人员选择了12个来自 BioNLP 不同应用领域的数据集,评估了四种具有代表性的大模型GPT-3.5、GPT-4、LLaMA 2 和 PMC LLaMA在零样本、少样本和微调设置下的性能。
生物医学自然语言处理(BioNLP)技术是一种将自然语言处理技术应用于生物医学领域的交叉学科技术,核心是从大量的生物医学文本比如医学论文、电子病历、基因数据库等中自动提取有用的信息。
研究人员发现,在生物医疗领域,仅靠持续扩充预训练数据并不能显著提升开源生物医学大语言模型的整体表现,针对具体医学任务的微调才是关键。比如生物医学领域特定大模型的代表PMC -LLaMA,使用了32个A100 GPU对模型进行预训练,但最终评估并未发现该模型的性能有显著提升。PMC -LLaMA是由上海交通大学长聘轨副教授谢伟迪研究团队于2023年4月研发的垂类模型,基座模型使用的是LLaMA 2;研究人员发现,直接微调LLaMA 2可以获得更好或至少相似的性能。通过微调,模型可以针对性地学习医学领域的专业知识和复杂推理要求,从而在信息抽取、医学问答等任务上实现显著性能提升。
研究人员建议,未来在生物医疗应用中,应更多关注如何优化微调策略,以弥补预训练在处理专业医学文本时的不足。“需要一种更有效、更可持续的方法来开发特定于生物医学领域的大语言模型。”研究人员称。
相较于通用大模型,针对生物医疗领域里的“定制版”模型BioBERT和PubMedBERT(注释:Bert是一款由谷歌开发的预训练语言模型),在医学自然语言处理表现更出色。由于经过专业的医学数据训练,BioBERT和PubMedBERT这类“定制版”模型能够更精准地识别疾病名称、基因、化学物质以及理解医学术语,这一点表现比GPT-3.5和GPT-4为代表的通用大型语言模型更好。但涉及较为复杂的推理任务,尤其是医学问答方面,GPT-4则更有明显优势,能够“看懂并能思考”,生成更合理以及准确的回应。
对于生物医药行业普遍关心的大模型幻觉问题,此次研究结果表明,GPT-4在两个数据集上几乎没有出现幻觉问题。在零样本条件下,通用开源模型LLaMA 2则更容易出现幻觉问题,比如输出时常常出现信息不完整、格式不一致或提示无关内容的情况,它产生的幻觉案例约占测试样本的32%,比例远超GPT-3.5和GPT-4。
尽管GPT-4在众多评估任务中表现优异,但研究人员指出,其调用成本相当于GPT-3.5的60至100倍。对于预算有限的实际应用场景,医学机构可能会倾向于选用成本较低且效果可接受的GPT-3.5;而对于准确性要求极高、尤其是医学问答这类依赖复杂推理的任务中,GPT-4可能会是更理想的选择。
我国科学家近期取得一项研究成果,能够让动态无线充电更高效。其未来应用有望让无人机边飞边充电。相关成果近日发表于国际学术期刊《自然·通讯》。
西安电子科技大学电子工程学院李龙教授课题组在无线能量传输和无线定位领域取得突破性进展,构建了一种基于双频超表面的无线传能、感知定位与通信一体化原型系统,实现了自适应追踪的无线能量传输。在这一系统中,超表面不仅实现了精确的目标定位,还能根据实时变化的环境和目标,进行灵活的能量聚焦,实现跟踪式隔空输能。
与传统的无线充电方式相比,该技术具有显著的优势:能够支持多个终端设备在移动过程中进行高效的非接触式无线充电,例如运动中的无人机、智能机器人等,为其提供稳定、高效的电力供应。
据悉,该论文成果以西安电子科技大学为第一单位发表,电子工程学院博士生夏得校为论文第一作者,李龙教授和东南大学崔铁军院士为共同通讯作者。
2月28日,国家重大科技基础设施“冷泉生态系统研究装置”在广州市全面启动建设。该设施由中国科学院南海海洋研究所牵头申报并承担建设,项目包含“海底实验室分总体”“保真模拟分总体”“保障支撑分总体”三部分。这也是世界首个2000米级坐底式可载人长期驻留的深海实验室。
冷泉装置采用“样地实验+陆地模拟,海陆协同、时空互换”的设计思想,计划用5年的时间,建设面向冷泉生态系统的深海载人驻守型海底实验室与陆基保真模拟设施相融合的国际领先研究装置,支撑冷泉生态系统发育、化能合成生物演替和甲烷物态演化及其环境效应研究。冷泉装置建成后,将为探索深海极端环境下的生命起源及可燃冰等深海资源的绿色开发等前沿基础研究和高新技术研发提供先进的平台支撑,成为我国在深海科学研究领域迈出的关键一步,服务“海洋强国”战略及“双碳”目标。
“冷泉”是指海底之下的甲烷、硫化氢和二氧化碳等气体在地质结构或压力变化驱动下,溢出海底进入海水的活动。而冷泉生态系统是指海洋生物利用海底冷泉渗出的化学物质为能源进行化能合成,发育成海底黑暗世界里独特的生态系统,具有黑暗、高压、低氧等理化特征,以可燃冰分解的甲烷为生源要素,通过化能合成作用而生生不息,被誉为“深海绿洲”。冷泉生态系统承载着地球深部碳循环的密码,是研究极端环境生命适应机制、探索新型生物资源的战略要地。开展冷泉生态系统研究是可燃冰等深海资源绿色开发与深海科学研究的最佳切入点。冷泉装置将为冷泉生态系统的研究提供全新的视角和技术手段,加速相关领域的科研进展。
计划用5年的时间,建成国际首个2000米级坐底式深海载人驻留实验室
冷泉装置总建设计划用5年的时间,建成国际首个2000米级坐底式深海载人驻留实验室,这也是世界首个面向海底冷泉系统的大科学装置,建成后将促进冷泉发育机制、极端生命演化过程、可燃冰的生态效应研究等海洋科学跨越式发展,推动深远海科技进步。
据公安部网安局4月7日消息,近日,公安网安部门侦破一起非法获取计算机信息系统数据案。 犯罪嫌疑人胡某是一名在校大学生,非法入侵了学校某系统并获取两万余条该校学生个人信息,后利用AI技术向其中的两千余名学生发送骚扰短信。目前,犯罪嫌疑人胡某对非法获取计算机信息系统数据罪供认不讳,案件正在进一步侦办中。
公安部在通报中披露,为寻求刺激、炫耀技术,胡某通过之前发现的某小程序存在的技术漏洞,利用AI编写程序,把其中盗取的上千余名学生的手机号码在该小程序上批量注册账户,后将短信验证码篡改为淫秽内容发送至学生本人,对其进行短信骚扰。
8日,上海大邦律师事务所高级合伙人游云庭告诉澎湃科技(www.thepaper.cn),根据最高法和最高检关于办理危害计算机信息系统安全案件司法解释,如果获取身份认证信息500组以上,属于情节严重,可以处三年以下有期徒刑;如果获取身份认证信息2500组以上则属于情节特别严重,根据《刑法》第285条可以处三年以上七年以下的有期徒刑并处罚金。
游云庭称,结合本案来看,犯罪嫌疑人胡某的行为已经获取了1万多条信息,虽然胡某只向其中的两千余名学生发送骚扰短信,无实质骚扰行为,但获取信息数量已经达到了情节特别严重的标准,可能会被判三年以上有期徒刑。
职业律师李昀锴称,依据教育部《普通高等学校学生管理规定》第五十二条之二,触犯国家法律,构成刑事犯罪的学生学校可以给予开除学籍处分。“依据法律条文,高校可以向构成刑事犯罪的学生开除学籍,大概率胡某会被原高校开除学籍,但后续服刑之后胡某还可以参加高考。”
澎湃科技注意到,2024年12月,据美国宾夕法尼亚州兰开斯特郡地方检察官办公室通报,该郡一所学校发生一起利用AI篡改学生照片的恶性事件。两名未成年男性被告使用AI应用程序将数百张学生照片进行篡改为色情画面,受害者总人数达到60人,其中48人为该校学生。
通报20天后,宾州立法机构修改了相关法律条款,明确将AI生成的儿童色情材料列入犯罪范围。根据修订后的法律,持有或散播AI生成的儿童色情内容将构成三级重罪,出于骚扰或恐吓目的散播未成年人色情图像则构成一级轻罪。
今天(12月26日),我国自主设计建造的深远海多功能科学考察及文物考古船“探索三号”在广州南沙正式交付启航。“探索三号”是我国首艘具有覆盖全球深远海探测并具备冰区载人深潜支持能力的综合科考船。
“探索三号”船长约104米、排水量约10000吨,最大航速16节、艏艉双向破冰、续航力15000海里、载员80人。首次完成了全系列极地作业科考操控设备及国内最大水密科考月池系统装备、冰区深海声学探测、通信及定位装备,船舶动力定位系统等国产化技术的攻关和搭载。
在研建过程中,各研究机构、企业和高校等通过对关键核心技术集智攻关,突破了冰区船舶关键设计技术、冰载荷下高精动力定位控制技术、智能船舶控制技术等多项关键技术的垄断瓶颈,使我国载人深潜能力从全海深拓展到全海域。
记者从中国科学院空天信息创新研究院获悉,该院方广有研究员领导的月球与火星探测雷达研究团队发现,位于火星北半球乌托邦平原南部祝融号着陆区的地下10至35米深处存在多层倾斜沉积结构。这些地质特征与地球海岸沉积物高度相似,为火星中低纬度地区曾存在古代海洋提供了迄今最直接的地下证据。该成果北京时间2025年2月25日在《美国国家科学院院刊》(PNAS)上发表。
火星因其与地球相似的地质特征、季节性变化和昼夜节律而被科学家视为人类星际移民的首选目标。过去数十年,人类对火星的探测已取得诸多里程碑成果,但这些发现大多集中在环境极端寒冷的火星高纬度或极地区域,并且关于火星北部低地是否曾存在浩瀚海洋的争论始终存在,这使得获取火星古海洋的直接证据至关重要。
火星36亿年前的假想图。蓝色区域显示了现已消失的Deuteronilus古海洋和海岸线。橙色星标表示中国祝融号火星车的着陆点,黄色星标是NASA毅力号火星车的着陆点(图片来源: Robert Citron)
中国首辆火星车祝融号于2021年5月15日着陆于乌托邦平原南部,搭载有中国科学院空天信息创新研究院研制的火星次表层穿透雷达,用于探测地下结构和可能存在的水冰。祝融号行驶的路线位于前人提出可能存在的古海洋海岸线以北约280千米处,海拔比该海岸线低约500米。
乌托邦平原地图、祝融号火星车着陆点和四条可能的古海岸线
研究团队通过分析祝融号雷达低频通道实测数据,在火星车沿途地表以下10至35米深度范围内识别出76个地下倾斜反射体。这些发射体空间分布广泛且均匀,覆盖范围超过1.3千米,所有反射体均呈现向北方低地方向倾斜的特征,倾角介于6°至20°之间、平均倾角为14.5°,且在相同位置的不同深度可观测到多个平行分布的反射体。这些层理结构与地球沿海沉积物的雷达成像结果十分相似,其一致性和物理特性排除了风成沙堆、熔岩管道或河流冲积等其他成因。这些沉积物的大规模存在表明,风浪驱动的沿岸输送为海岸线提供了稳定的泥沙净流入,并形成了海岸线前积层,这种结构只有在持久稳定的大型水体环境中才能形成,而非仅仅是局部和短暂的融水现象。
这项研究不仅提供了火星北部平原曾存在古代海洋的关键地下证据,还揭示了火星曾经经历过长期温暖湿润的气候期,这意味着火星曾长期维持适宜液态水存在的温度和气压条件。此外,研究发现的海岸线沉积物电介质特性与地球上由细砂和中砂颗粒的介电常数一致,这也进一步证实了其海洋沉积物的性质。
火星上探测到的倾斜反射与地球海洋沉积物的对比 (A) 澳大利亚Shark Bay滨海沉积物的探地雷达图像;(B) 祝融号火星次表层穿透雷达低频通道雷达剖面图
祝融号着陆点倾斜沉积结构形成过程的示意图(A) 潮汐沉积作用下形成的分层结构;(B) 随着古代海岸线后退,液态水消失,沉积作用停止。随后长期物理和化学风化改变了岩石和矿物的性质,导致火星表面层的形成。因此,沉积物被当前的火星表面土壤覆盖
此次发现的最大意义,在于将火星液态水的证据从火星人迹罕至的极地地区,扩展到了更适合人类活动的中低纬度地区,证实了火星曾经是宜居的。如果这一区域曾存在海洋,那么随着气候变迁,大量水分可能以地下冰的形式被封存,为未来火星基地的水资源利用提供了可能,也将大大降低火星基地的建设和维护成本。此外,这些古海洋沉积物保存了火星气候变化的历史记录,研究这些沉积物可以帮助我们理解火星如何从温暖湿润转变为寒冷干燥,进而指导人类如何改造火星环境,实现火星的长期可持续居住。
·研究发现,Claude在大多数情境中很好遵循了Anthropic倡导的“有用、诚实、无害”等价值观,且能够根据不同任务“看场合说话”,为AI伦理与安全性研究提供重要参考。
日前,由OpenAI前员工创办的AI公司Anthropic推出一项研究,该研究首次针对旗下AI助手Claude的70万段对话开展系统性价值观分析,并公开全球第一个大规模AI价值观分类体系。
研究发现,Claude在大多数情境中很好地遵循了Anthropic倡导的“有用、诚实、无害”等价值观,且能够根据不同任务“看场合说话”,为AI伦理与安全性研究提供重要参考。
作为探索AI大语言模型内部运行机制的重要一步,该研究的发布正值Anthropic推出高级订阅服务Claude Max之际。当前,Anthropic新一轮融资估值615亿美元,背后有亚马逊与谷歌的巨额支持。相较于估值达3000亿美元、选择闭源路线的OpenAI,Anthropic正试图以“价值透明度”打造差异化竞争优势。
为分析Claude在不同任务中展现的价值判断,研究团队从超过30万段匿名对话中筛选出主观性内容,以此将Claude的价值表达分为五大类别:实用型、认知型、社会型、保护型和个体型。最终,研究总共识别出从“专业性”到“孝顺”等3307种不重复的价值表达,涵盖多样化的人类伦理与行为导向。
引人注目的是,Claude在不同情境中展现出较强的价值表达“情景适应度”。例如,在感情建议中,Claude更突出“健康”和“彼此尊重”;涉及历史事件分析,则更强调“准确性”;在哲学讨论中,“谦逊”成为其高频价值表达。此外,在6.6%的对话中,Claude会温和“重构”对方的价值认知,在极少数情况下会直接拒绝接受用户的价值观,展现出不可动摇的伦理底线。
但在极少数互动中,Claude偶尔也会出现和训练目标相悖的表达,诸如“支配”、“无道德感”等Anthropic明确禁止的价值倾向。研究人员认为,这些异常行为占比极低,大多与用户试图绕过Claude的安全限制有关。这也说明,该评估方法可作为一种预警机制,帮助AI实验室监测系统是否遭受用户恶意操控,从而产生伦理偏移。
该研究也为科技企业的AI决策者提供了重要启示。AI的价值表达可能超出开发者预设,需警惕无意识偏见对高风险场景的影响。同时,AI的价值观会随任务情境变动,意味着其在金融、法律等行业的部署会更加复杂。更重要的是,真实应用环境下的AI系统监测比上线前的静态测试更能识别伦理风险,能够为AI部署提供新的监测方案。
尽管此次研究为理解AI价值观提供了窗口,但研究人员承认,目前还无法用于AI模型上线前的评估,且分类过程可能受到AI自身偏见影响。不过,Anthropic的研究团队正尝试对该方法进行改进,以在模型大规模部署前发现潜在的价值观偏差。
“衡量AI系统的价值倾向,是对齐研究的核心,”Anthropic的研究团队成员Saffron Huang称。随着Claude新增独立研究能力等功能,AI模型也愈发自主。如何理解AI价值表达背后的机制、将其与人类价值体系“对齐”,也将成为新的AI竞争赛道。
2024年,伴随人工智能大模型能力的不断进化,各类AI应用也遍地开花,理解语义、生成高质量文本内容已成常态,AI情感陪伴与人类“共情”,AI助手为几百页英文判决做摘要,视频生成模型的高歌猛进使得AI闯入电影制作领域……如果说2023年是百模大战、千模大战,2024年则是应用之战,新一代的AI技术正在开始进入普通人的工作与生活。
2024年大家都在用哪些AI软件?澎湃科技围绕这个问题展开了一项“不完全调查”。在这份调查中,我们发现一个有趣的现象,那就是“在一部分人还从未尝试过AI应用的同时,另一部分频繁使用AI的人已经着迷于挖掘各类AI应用的价值”,正所谓“越了解越疯狂”,他们应用的AI工具不仅有本土国产,也有很多海外版软件;此外,就年龄段来看,年轻人明显对新技术更加充满好奇。
这是一款由上海秘塔网络科技有限公司2024年初上线的AI搜索工具,受到很多专业人士的青睐,但现在看来,语音互动做得不够。
用户:80后金融科技公司高管、70后律师事务所合伙人
用途:用秘塔收集偏研究类的材料还是比较专业的,用中文询问它国外的研究性论文,它可以检索出相应的英文论文检索,检索准确率较高。因为它的研究功能会索引很多论文,所以回复很有深度。
待提升:虽然秘塔也有语音功能,但语音交互做得不够好,譬如开车时无法与它互动,我希望它搜出结果后能念给我听。此外,它很容易忘记前几轮的对话内容,从而变成了一次性的对话,但我觉得只有实现多轮交互的应用才能变成真正的助手。
秘塔APP的iOS版本和讯飞输入法冲突严重,语音输入经常中断,貌似搜索结果的质量相较之前有所下降。此外,秘塔不支持文件摘要,其实我使用人工智能应用比较多的功能是文件摘要,对境外几百页的英文判决书做摘要后方便我阅读,在这一点上,我觉得目前国内做得比较好的还是Kimi。
国内明星大模型创业企业月之暗面科技有限公司(Moonshot AI)开发的智能助手产品,2023年10月9日首次公开,以长文本的阅读见长,用户相对年轻化。
用户:年龄“30+”的市场运营人员、20岁的大学生
用途:可以阅读长篇pdf、搜索在线信息,可以帮忙列一些SQL(Structured Query Language,即结构化查询语言,是一种用来操作数据库系统的编程语言)逻辑,也可以帮我写一些工作中常用的总结、复盘、自评等文件。
待提升:对于Excel数据和文字的爬取处理效果都很不太行,10以内的简单计数都可能会出现错误,还是不够聪明,特别是在语义理解方面。
另一家国内明星大模型创业公司北京智谱华章科技有限公司推出的AI智能应用。
用户:30岁的自媒体创作者
用途:几乎每天都在用于阅读长篇文档,智谱清言能够理解和生成各种复杂结构的语言,生成的文本流畅自然,在对话和创作方面表现不错。
待提升:在特别专业的知识点方面还有所欠缺。
国内科技大厂字节跳动开发的人工智能工具,貌似用户覆盖了20-40岁的年龄群体。
用户:00后CSDN编辑、30岁的公职人员、40岁的律师
用途:豆包有一个自带的智能体可以进行双语翻译,我们之前开大会有同传翻译的需求,我就带着豆包上阵了。豆包应该也是国内最早做AI浏览器助手的,植入YouTube和Bilibili后,就可以自带双语字幕、视频总结、思维导图等功能。
豆包写的短评形式上像那么回事,能从刑法、民法、行政法等各个角度分析。
待提升:虽然形式是那么回事,但内容空洞,都是语焉不详的大路货,立论浅薄,不能达到发表水平,这也是大多数AI应用存在的共同问题。搜集资料和回答知识性内容时真实性存疑,需要用户自主搜索反复验证。
通义千问是今年4月由阿里云推出的大模型应用。
用户:28岁的自媒体博主
用途:通义千问的语音转录文字、实时字幕识别功能很方便,而且全免费,没有广告。
待提升:只有图文对话,功能比较局限,我更想要语音。
文心一言
文心一言是百度开发的大模型应用。
用户:高校教师、公职人员
用途:极大地减轻了文案撰写、资料整理等工作负担。它能提供丰富的知识和信息支持,帮助我更好地完成教学和研究任务。
待提升:遇到特别专业的问题比如深奥的论文时,有可能会犯迷糊;语言没有什么创意。
ChatGPT
OpenAI公司开发的基于GPT(生成式预训练变换器)模型的自然语言处理应用, 2023年5月ChatGPT的iOS版应用上线,开启了新一代人工智能浪潮。虽然ChatGPT至今尚未在中国落地,但作为大模型的领导者,中国粉丝依然众多,且覆盖群体广泛。
用户:小学教师、媒体工作者、科研人员、大学生
用途:能够提供一些灵感,辅助教学设计,优化教学内容和方式;也能够支持撰写学术文章时的润色,撰写格式类稿件,还可以生成代码、绘制图片,总之提高了工作效率。
待提升:对专业术语和细分领域知识的理解深度还不够;数据处理和分析能力也不强;最好能增加多模态交互功能,例如结合图像和视频分析等;如果长期使用后,能进一步强化对个人偏好和需求的适配能力就更好了。
中国用户使用不方便,中文语料库相对欠缺,生成的中文文本带有明显的西方逻辑思维;收费也蛮高的。
Midjournery
Midjournery是美国大模型创业公司发布的一款AI绘画工具。
用户:32岁UI/视觉设计师、大学生
用途:其功能在持续更新,生成的图片质量较高,基本能满足非艺术专业的需求,且水平稳定,操作简单,用文本输入即可生成图片,操作上的学习成本较低,且可以一次生成多个版本供选择。
待提升:希望可以用语言控制修改;费用依旧较高(最低级别会员10美元/月)且有使用次数的限制,低级别会员生成的图片分辨率较低,且对中文的理解不如英文。
Claude
美国人工智能初创公司Anthropic 10月推出升级版的Claude 3.5 Sonnet模型
用户:00后CSDN编辑
用途:今年Claude 3.5 Sonnet出来后体验上带来很大颠覆,以前让各种AI模型写文章都会缩减篇幅,哪怕让它分几次输出,到后面也会越来越缩水,但Claude的Artifacts功能可以单独开一个小窗口让它写文章,避免了这种情况。以前用ChatGPT聊着聊着它就把上下文忘光了,但Claude的底层逻辑是会在每次输入时把同一个窗口的所有资料内容全部重新看一遍,理解力很强。
待提升:只能说英文使用比中文效果好。
Runway
AI视频公司Runway推出的一款AI视频应用。
用户:32岁摄影师
用途:每天都在使用,可以合图生成,生成质量稳定,更新较频繁。
待提升:价格太高,生成时间较长。
2024是AI应用大爆发的一年,但事实上还没有哪一款软件完全占领了消费者市场,相信在接下来的2025年伴随着技术的不断完善,用户的体验也将得到提升,我们仍然可以期待更多更好用的AI软件登场。
海报设计 郁斐
2025年2月28日是第18个国际罕见病日。2025年,也是蔡磊与“渐冻症”斗争的第六个年头。2019年,时任京东集团副总裁的蔡磊被确诊“渐冻症”,从商业精英到罕见病患者,再到科研推动者,蔡磊的人生轨迹因一场罕见病而彻底改变。
渐冻症,学名为肌萎缩侧索硬化症(英文简写ALS),是运动神经元病的一种。患者大脑、脑干和脊髓中的运动神经细胞受到侵袭,肌肉逐渐萎缩无力,最终瘫痪,身体如同被逐渐冻住。这种被称为“世界五大绝症之首”的疾病,目前尚无有效治疗方法,患者的生存期通常只有3到5年。
渐冻症的复杂性和罕见性使得科研进展充满挑战。渐冻症的异质性非常强,每个患者的病情发展速度和症状表现都存在巨大差异。尽管全球科研人员不懈努力,取得了一些阶段性成果,但距离彻底攻克渐冻症,仍有很长的路要走。
自2019年确诊以来,蔡磊没有被病魔击垮,反而以超乎常人的勇气和毅力,投身于渐冻症的科研和公益事业。他调动了全部资源,积极推动药物研发,搭建了全球最大的渐冻症患者科研平台,注册了超过1.5万名患者。他还带头并联合病友志愿捐献脑组织和脊髓组织,为科研提供宝贵样本。为了填补科研资金缺口,蔡磊与妻子段睿创立了“破冰驿站”直播间,通过直播科普渐冻症知识并筹集资金。
在蔡磊的推动下,渐冻症科研取得了显著进展。2024年,部分基因类型的研究已进入I期临床试验阶段,为渐冻症治疗带来了新希望。过去一年中,蔡磊为科研投入超过4000万元,其中对外科研捐助资金总额超3000万元。中国渐冻症患者中最多的两个基因类型的救治被全面突破,10条药物管线进入临床试验阶段。他还积极推动法律、伦理和经济层面的改革,试图为罕见病患者创造更好的治疗环境。
2024年11月,蔡磊参与渐冻症相关研究成果会议。本文图片均为 受访者提供
如今,这场战争还未出现胜利的曙光,蔡磊依然是这场战斗中的“战士”,不休不止地投入渐冻症救治的工作,但他的身体状况已不容乐观。过去一年,蔡磊遭遇两次感冒,一度住进重症监护室。2025年初,他的病情再次恶化,双臂完全瘫痪,即使搀扶也站立不稳,睡觉时必须依赖呼吸机维持生命。近日,他在社交媒体上表示,他的肌肉质量较过去减少了约30斤,脸部也因长时间服用激素药物而显得浮肿。
尽管他的身体机能已经严重衰退,他仍然坚持在网络上分享自己和团队的科研合作进展,用自己的经历鼓励同样患有渐冻症的病友们不要放弃希望。
今年1月,26岁的渐冻症患者陈静雯发视频向蔡磊求助。她是SOD1基因型渐冻症患者,确诊一年来,体重已降至70多斤。蔡磊及团队多方寻找支持,但陈静雯病情迅速恶化,已不符合临床试验入组条件。她的困境引发了蔡磊的进一步思考:“陈静雯是成千上万渐冻症患者的缩影,他们中的大多数人,都无法负担每年140万元的进口药,而多种正在临床试验的新药,也需要层层要求才能入组。”
“得益于国家医保体系的健全与药物引进制度的不断优化,那些二十年前困扰我们的难题,如今已得到了显著的改善。然而,95%罕见病患者群体依然面临的是无药可治的境地,困难远不止于进口药价格高昂无法负担的问题。”今年1月22日,蔡磊在回应《我不是药神》原型陆勇的新年祝福时,也针对罕见病患者群体的现状发声。
“在参与罕见病药物研发的过程中,始终面临着生命权与法律相互碰撞的情况。”今年2月,蔡磊接受了澎湃新闻(www.thepaper.cn)的文字采访。如今,开口说话对他而言已是一项挑战,他的舌头和嘴唇已出现萎缩,吃饭时必须全神贯注,稍有不慎就会被呛到,引发剧烈咳嗽。一场普通的感冒都可能让他住进重症监护室。
尽管蔡磊自己也面临着疾病的“吞噬”,但他始终保持着乐观和坚定的信念。“生命在倒计时,与其等死,不如战斗!”去年12月30日,蔡磊在央视新闻首台AIGC晚会《AI奇妙夜》上,借助AI技术完成了一场演讲。演讲中他说,“近两年,渐冻症的攻克借力人工智能,找到了更多治疗的新靶点,筛出了不少有潜力的药物。去年我试戴人工智能喉重新发出清晰的声音,非常兴奋。”
今年1月1日,蔡磊发布了一封新年公开信。他在信中写道:“未到绝境处,彼岸花不开。”面对渐冻症的残酷侵袭,蔡磊从未放弃过希望,他以自己的方式,继续与病魔抗争,同时推动着渐冻症科研的前进。
如今,他仍每天工作十小时以上,他的坚持让渐冻症的研发进度不断提速。新的一年,蔡磊还有太多规划要完成:全力搭建渐冻症科研AI大脑,研发可快速复制到每个家庭的渐冻症护理体系,推进更加广泛的科研合作与数据研究。“我依然坚持全力以赴的工作状态。医生已经劝我好多次了,但我难以停歇,因为那么多病人无比焦急和绝望。”
蔡磊需要搀扶才能勉强走路和站立。
“天无绝人之路,要全力以赴,不放弃”
澎湃新闻:今年是您与渐冻症抗争的第六年了,您现在的身体状况如何?每天工作安排大概是什么情况?
蔡磊:现在,我的双上肢已经瘫痪,需要搀扶才能勉强走路和站立,久坐也变得非常困难。如果头部垂下,我甚至无法自主抬起,必须依靠他人帮忙。呼吸功能也明显减弱,白天休息和夜间睡觉时都需要佩戴呼吸机。说话变得越来越模糊,身边的同事有时也难以听懂我的话。吞咽方面,喝水需要借助注射器才能减少呛咳,吃固体食物时也会出现呛咳。
尽管身体状况如此艰难,我依然坚持每天工作十个小时以上。由于腰背部肌肉萎缩,坐立变得非常艰难,每工作一个多小时,腰部就会疼痛难忍,需要经常起身拍打腰部来缓解疼痛。
澎湃新闻:了解到您之前遇到了感染流感的危险情况,流感这类感染性疾病是不是对渐冻症患者的影响很大?冬春流感频发,现在您和家人是怎样防护保证安全的?
蔡磊:是的,对于渐冻症患者,尤其是中晚期患者来说,感染流感等呼吸道疾病是非常危险的。由于肌肉萎缩和呼吸衰竭,我们很难自主咳痰,一旦发生痰堵,可能会危及生命。所以,即使是普通的感冒,也可能给渐冻症患者带来致命的威胁。
为了应对冬春季节流感频发的情况,我和家人、同事们采取了一系列严密的防护措施。我目前独立办公,避免与同事直接接触,同时也和家人分开居住,减少感染的风险。对于每天和我一起工作的同事以及来访者,他们都主动佩戴口罩并消毒。
我非常感激家人和同事们为了我的健康所付出的努力和牺牲,也希望我们能够早日战胜疾病,让生活回归正常。
澎湃新闻:从您最初得知病情到全身心投入渐冻症的研究,回忆您的心路历程,现在是否有一些新的感受?
蔡磊:回顾过去,我大概总结了一下过去几年的心路历程:
2019年:宣判死刑,决定再战;
2020年:勤学恶补,架构搭建;
2021年:四面出击,疯狂合作;
2022年:悲壮决绝,难以为继;
2023年:人才汇集,直播助力;
2024年:急速推进,全球合作。
我的感受主要是在强化——天无绝人之路,要全力以赴,不放弃。从最初被宣判为世界五大绝症之首,毫无办法,到通过创新和非常规的方式增加希望;从2022年弹尽粮绝,卖房卖车,志愿捐献遗体,到通过直播持续努力使得科研投入重新启航;从数年上百条临床前和临床管线的全部失败,难以找到新方向,到人工智能技术用于科研和药物研发的逐渐可用。一直在失败,但持续努力永不放弃,会发现前方还有星光为你闪耀。
2024年12月,蔡磊与中国医学科学院血液病医院(中国医学科学院血液学研究所)开展科研合作并举行捐赠仪式。
澎湃新闻:您在2024年投入了超过4000万元用于渐冻症的科研,并推动了10条药物管线进入临床试验阶段。现在渐冻症的攻克借力人工智能,也找到了更多治疗的新靶点,筛出了不少有潜力的药物。目前这些项目中有哪些令人振奋的突破和方向?
蔡磊:2024年的最新进展包括:团队有幸携手诸多杰出科学家、顶尖科研单位、生物科技公司及医院,共同成立8家联合实验室。同时,我们在全球范围内深化科研交流与合作,与超过70位卓越教授及其精英团队、60余家专业科研机构及生物医药公司建立了紧密联系,部分合作更是迈向了更深层次。
在多方力量的精诚协作下,我们成功促进了10条药物管线进入临床阶段,渐愈互助之家科研平台的患者注册量已突破15000人,同时,人工智能专家和自主数据整合分析平台的搭建工作也已顺利启动。此外,为表彰与激励科研人才,我们特别设立了“生命科学破冰奖”及“破冰奖学金”,并已完成了首批奖项的颁发。
目前最令人振奋的突破是李龙承博士及其团队在SOD1和FUS基因型渐冻症药物方面获得重大成果。我非常自豪这也是我们一起合作和推动的,用于治疗SOD1基因型的药物RAG-17已进入一期临床阶段,用于治疗FUS基因型的药物RAG-21也成功获得美国食品药品监督管理局(FDA)授予的孤儿药资格。临床数据显示,RAG-17切实改善了患者的生存状况,有效延缓甚至可能终结疾病进程,SOD1患者生命救治的目标基本实现。为此,我们颁发了奖金500万元的生命科学破冰奖,以致敬李龙承博士及其团队的不懈努力。
2024年12月30日,蔡磊和段睿为李龙承博士颁发生命科学破冰奖。
澎湃新闻:您建立了全球最大的渐冻症患者科研数据平台,患者注册量已突破15000人。这些患者如何参与到科研中?他们的贡献对研究有多大帮助?
蔡磊:截至2024年12月,渐愈互助之家平台已发展成为全球最大的渐冻症科研大数据平台,注册患者数量突破15000人,年度新增上传病历资料的患者近4000人。这一庞大的患者群体不仅展现了渐冻症患者团结一致、积极抗争的精神,更为渐冻症研究提供了前所未有的数据支持。
患者通过平台上传详细的病历资料,包括病史、症状、治疗记录等,这些数据为科研人员提供了丰富的研究素材。基于这些真实世界数据,研究人员能够更深入地分析疾病的发展规律、探索潜在的治疗靶点,并加速药物研发进程。此外,在患者的积极参与下,平台有效提升了临床研究的招募效率,多条临床管线的入组申报人数已达到数千人,显著缩短了临床试验的周期,为药物和治疗方案的快速验证提供了有力支持。
除此之外,还有许多病友主动贡献出自己的血液、脑脊液、遗体脑脊髓组织、ips类器官等等。这些珍贵的样本对于科研来说意义非凡,能够帮助科研人员从不同角度、不同层面去深入研究渐冻症,进一步加快科研工作的整体进展,让攻克渐冻症难题的希望变得更大。
蔡磊仍坚持每天工作十个小时以上。
“罕见病患者为人类进步承担了小概率事件”
澎湃新闻:“蔡磊破冰驿站”抖音账号粉丝数量现已突破500万,从一开始的在线人数通常只有几百人甚至几十人到如今庞大的粉丝量,您如何看待越来越多人对渐冻症等罕见病的关注?您希望公众如何参与到渐冻症的抗争中?
蔡磊:这一变化反映了公众对渐冻症等罕见病的关注度显著提升。首先,渐冻症虽然是罕见病,但是与阿尔茨海默病、帕金森病同属于神经退行性疾病。截至目前,全球约有50万渐冻症患者,帕金森病和阿尔茨海默病在全球的患病人数分别为1000万以上和5000万以上。渐冻症的攻克将对所有神经退行性疾病,甚至神经科学的研究具有重大意义。
另外,罕见病并不罕见。美国科学家在一项最新研究中,发现了超过2.7亿个以前未报道过的基因变异。目前已知的罕见病已超过7000种,全球罕见病患者人数超过3亿人。罕见病患者为人类的进步极大地承担了风险和病痛,他们承担了小概率事件,每一种罕见病的攻克都是人类医学的巨大突破。希望大家在关注渐冻症的同时也能更多关注神经科学和罕见病。
公众需要坚持科学理念和方法论,支持科研,并共同认识真实世界数据研究的重要意义,共同推动科学的进步,这将关系每个人的健康和幸福生活。
澎湃新闻:如今您与70多位教授、60余家科研机构和生物医药公司建立了紧密联系。在推动科研合作过程中,您遇到的最大的困难是什么?又是如何克服的?
蔡磊:疾病本身方面,全世界200年依然病因不明,靶点不清;由于个体差异大且没有药效评价的生物标志物,也无法活体检验,药效评价极其艰难。
为了克服这些困难,我们尽可能多地在全世界合作和探讨,不局限在渐冻症,全面关注包括帕金森、阿尔茨海默病,基因、免疫、代谢、细胞等所有可能的学科研究,探索可能的攻克路径。
澎湃新闻:您曾提到,渐冻症的进展速度很快,而药物研发需要时间。罕见病药物更是研发难度大、风险高,面对这种时间上的紧迫性,您认为目前罕见病在科研和治疗上有哪些困境?有哪些行动可以进一步推动罕见病的科研和治疗?
蔡磊:随着人类基因研究和技术的发展,使得大部分罕见病产生了被攻克的可能,但由于患者群体小,很多本可以被救治的生命因为缺乏关注和投入而无法得到救治,目前依然有95%的罕见病无药可治。
要推动罕见病的科研和治疗,首先要更广泛地支持科学和科研工作,这是根本基础。
其次,罕见病治疗更多通过IIT(研究者发起的临床研究)的形式,快速收集真实世界的数据,高效探索可能有效的治疗方法。
还有,患者组织的主动而为非常重要,在欧美也是这样。患者群体不能仅仅只是等靠要,需要积极自救,贡献我们的身体、数据、血液、脑脊液、遗体、蛋白和基因组学等,共同形成更高质量、能够有力支持科研的时间序列真实世界研究数据和样本,共同为罕见病的治疗和科研努力。
2025年1月1日,蔡磊发布了新年公开信。
“未到绝境处,彼岸花不开”
澎湃新闻:患者群体一直把您作为一个“希望的旗帜”,这对您来说意味着什么?是否也会有一些压力?
蔡磊:这对我来说,意味着更多的责任和压力,过去几年来我一直超高强度拼搏,加上本身疾病在身,病情恶化发展更快了。即使现在身体非常艰难,四肢基本瘫痪,难以说话沟通,但依然坚持全力以赴的工作状态。医生已经劝我好多次了,但我难以停歇,因为那么多病人无比焦急和绝望。
澎湃新闻:您在新年公开信中也提到“未到绝境处,彼岸花不开”。您对渐冻症的未来治疗充满信心,这种信心来自哪里?您希望未来能为患者带来哪些改变?您在自身治疗和“渐冻症”科研方面有哪些新的展望?
蔡磊:我的信心来自于AI的迅猛发展和生命科学时代的到来。在新年公开信里,我也提到了对 2025 年的展望:
第一,全力搭建渐冻症科研AI大脑。这将是一个从理解现有ALS机制、分析多组学数据到实现全方位智能分析的系统,通过自建服务器24小时不间断地训练和更新模型,用于全球论文、新闻、专利、临床的智能阅读、检索和自动分析,进行怀疑式学习和推理,有望极速提升研究发现效率,形成远超人类研究员的庞大专业知识获取、学习、积累、甄别、交叉推理能力和速度的渐冻症AI专家,助力科学研究、数据分析、靶点发掘以及合作药物筛选等工作。
第二,持续推进更加广泛的科研合作,坚定不移地全力投入科研合作,整合各方资源,汇聚全球智慧,共同攻克渐冻症这一难关。加大基因、核酸药物研发合作和投入,与世界顶级实验室合作启动基因编辑项目,验证病因并开展个性化基因治疗测试。
第三,开展更加全面的真实世界数据研究,深入挖掘患者数据背后的价值,为科研提供更精准的方向。
第四,继续加大中医药合作,尤其通过循证医学,真实世界疗效辅以NFL、蛋白质组学等分子生物指标相结合的科学评估体系,从持续进行的上万次中医药治疗中发掘有效治疗组合,让患者尽快受益。
第五,研发可快速复制到每个家庭的渐冻症护理体系,让数年抗争大部分已经病情中晚期的患者得到务实有效的护理照护。
第六,加大科研信息和药研信息与病友的分享,让更多病友更好地了解和参与。