“世界模型”能否超越大语言模型?
2026-03-14
据法国《回声报》网站3月10日报道,自聊天生成预训练转换器(ChatGPT)引发冲击以来,大语言模型便在全球科技领域占据主导地位。但是面对能耗瓶颈和认知局限,各大科研实验室已着手筹备人工智能的下一场革命。
法国人杨立昆坚信:“如果我们希望大语言模型达到人类的智能水平,那就是死路一条。”他认为,支撑“双子座”人工智能模型(Gemini)、ChatGPT或“克劳德”模型(Claude)等聊天机器人的大语言模型,严格来说永远算不上真正的“智能”。
他新成立的实验室先进机器智能公司(AMI)刚刚完成了10亿美元融资,正专注于一项全新架构的基础研究——“世界模型”。在科技界,当投资者们为人工智能的潜力趋之若鹜时,并非只有他一人在探索其他技术路径。
自2022年底ChatGPT横空出世后,大语言模型在全球科技领域遍地开花。开放人工智能研究中心(OpenAI)这款聊天机器人基于Transformer技术架构,该架构由谷歌公司研究人员于2017年提出。
此后,整个人工智能生态系统都投身于大语言模型竞赛。谷歌的“双子座”人工智能模型、Anthropic公司的“克劳德”模型、元宇宙平台公司的Llama大型语言模型、法国米斯特拉尔人工智能公司的Le Chat,均基于这一概率统计路径:此算法通过学习海量数据,预测下一个词汇。
尽管这些模型在文本相关应用(代码、写作、摘要、翻译)中表现惊艳,但仍存在诸多缺陷。
人工智能博士、初创公司Quant AI Lab创始人贝特朗·哈桑尼解释说:“大语言模型存在机械性局限:其内置参数量不断增加,且获取高质量数据存在限制。此外,它们对硬件和能源的需求永无止境,因此资金投入十分巨大。”
例如,OpenAI计划未来五年投入超过1万亿美元用于基础设施建设,以训练其大模型。该公司及其竞争对手能否最终收回如此巨额的成本,目前还很难说。
尽管大语言模型的能力不断提升,但多项研究表明,其发展已经达到极限。资金和性能的双重瓶颈,促使实验室探索其他方案。
在企业中,越来越多的团队开始研发小语言模型。这类模型规模更小,仅需较少算力即可在专属数据上训练,可靠性更高。
初创公司Dragon LLM正在尝试将Transformer架构与算力消耗更低的Ma
2026-03-14
据法国《回声报》网站3月10日报道,自聊天生成预训练转换器(ChatGPT)引发冲击以来,大语言模型便在全球科技领域占据主导地位。但是面对能耗瓶颈和认知局限,各大科研实验室已着手筹备人工智能的下一场革命。
法国人杨立昆坚信:“如果我们希望大语言模型达到人类的智能水平,那就是死路一条。”他认为,支撑“双子座”人工智能模型(Gemini)、ChatGPT或“克劳德”模型(Claude)等聊天机器人的大语言模型,严格来说永远算不上真正的“智能”。
他新成立的实验室先进机器智能公司(AMI)刚刚完成了10亿美元融资,正专注于一项全新架构的基础研究——“世界模型”。在科技界,当投资者们为人工智能的潜力趋之若鹜时,并非只有他一人在探索其他技术路径。
自2022年底ChatGPT横空出世后,大语言模型在全球科技领域遍地开花。开放人工智能研究中心(OpenAI)这款聊天机器人基于Transformer技术架构,该架构由谷歌公司研究人员于2017年提出。
此后,整个人工智能生态系统都投身于大语言模型竞赛。谷歌的“双子座”人工智能模型、Anthropic公司的“克劳德”模型、元宇宙平台公司的Llama大型语言模型、法国米斯特拉尔人工智能公司的Le Chat,均基于这一概率统计路径:此算法通过学习海量数据,预测下一个词汇。
尽管这些模型在文本相关应用(代码、写作、摘要、翻译)中表现惊艳,但仍存在诸多缺陷。
人工智能博士、初创公司Quant AI Lab创始人贝特朗·哈桑尼解释说:“大语言模型存在机械性局限:其内置参数量不断增加,且获取高质量数据存在限制。此外,它们对硬件和能源的需求永无止境,因此资金投入十分巨大。”
例如,OpenAI计划未来五年投入超过1万亿美元用于基础设施建设,以训练其大模型。该公司及其竞争对手能否最终收回如此巨额的成本,目前还很难说。
尽管大语言模型的能力不断提升,但多项研究表明,其发展已经达到极限。资金和性能的双重瓶颈,促使实验室探索其他方案。
在企业中,越来越多的团队开始研发小语言模型。这类模型规模更小,仅需较少算力即可在专属数据上训练,可靠性更高。
初创公司Dragon LLM正在尝试将Transformer架构与算力消耗更低的Ma
