机器之心原创
(资料图片仅供参考)
作者:Panda W最近一段时间,以 GPT 为代表的大型语言模型(LLM)成就非凡,应用丛生,还被很多人视为实现通用人工智能(AGI)的重大里程碑,也由此带来了一些「大规模失业论」甚至「AI 末日论」的悲观论调。尽管如此,也有一些业内人士认为 LLM 的价值和意义被过分夸大了,LLM 也不是实现 AGI 的道路;他们相信创造 AGI 还需要新的方法论。
被公认为「卷积神经网络之父」的 Yann LeCun(杨立昆)就是 LLM 的「怀疑者」之一。他已经不止一次公开表达了对 LLM 热潮的批评,比如他曾在一场辩论中毫不客气地说:「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」他也曾多次说过:「自回归生成模型弱爆了!(Auto-Regressive Generative Models suck!)」。他口中的自回归模型就是 GPT 系列模型所依赖的学习范式。而在 6 月 12 日他在回复 Geoffrey Hinton 和吴恩达的推文中也批评说:「LLM 对世界的理解非常肤浅。」
顺带一提,Yann LeCun 也不赞同「通用人工智能」这一说法,他认为根本就不存在所谓的「通用」智能,人类智能也不是通用智能,只是擅长某一些任务,人类的目标应当是创造出人类水平的(human-level) AI。
当然,身为全球知名的 AI 研究学者,Yann LeCun 自然不是一位全然的批评家,对于实现真正有用的人类水平 AI 这一宏伟目标,他也有着自己的方法论 —— 他称之为「世界模型」(World Model)。他在 2022 年 6 月曾经公布了一篇长达 62 页的 position paper(立场论文)《A Path Towards Autonomous Machine Intelligence》来详细论述自己的观点。该论文一开篇,他便提出了三个未来可能相当长时间内都难以真正解答的问题:
1. 机器如何像人类和动物一样高效地学习?
2. 机器如何学会推理和规划?
3. 机器如何在多个抽象层级上学习感知和行动规划的表征,从而让它们有能力在多个时间范围内执行推理、预测和规划?
他认为 LLM 不是这三个问题的答案。
LeCun 对 LLM 的批评
Yann LeCun 并不否认当前 AI 的能力,他认为它们在训练数据对应的特定领域任务上依然非常有用,比如翻译和图像识别等。而对于以 GPT 和 BERT 为代表的大型语言模型,LeCun 认为它们本质上只是自回归文本生成模型。
大致来说,自回归生成模型的工作方式是先预测一个序列的下一个 token,然后将预测出的 token 加入到序列,继续预测下一个 token。这些 token 可以是文本,也可以是图块、语音片段等。
LeCun 认为,由于现如今的 LLM 都只是在文本上训练的,因此只能非常粗浅地理解世界。即使 LLM 凭借大量参数和海量训练数据能展现出非常流畅的文本理解能力,但它们本质上捕获地依然只是文本的统计规律,并不真正理解文本在现实世界中所代表的含义。
这种对底层现实知识的缺乏会导致 LLM 犯错,有时候这些错误还非常愚蠢。举个例子,在某用户分享的使用 Claude 续写小说的案例中,续写情节中出现了角色失去心脏依然正常生活的情节。LLM 的错误有时候过于离奇可笑,甚至能成为新闻报道的主题 —— 有 GitHub 用户甚至特地建了一个 LLM 失败档案来收集这些新闻报道,比如下面的例子中 ChatGPT 通过计算认为 9 位女性用 1 个月时间就能生一个孩子,参阅:https://github.com/giuven95/chatgpt-failures
LeCun 认为,如果模型能使用更多感官信号(比如视觉)学习世界的运作模式,那么就能更加深刻地理解现实。可以相信这也是他更关注图像和音频等多模态数据研究的原因。
此外,他还指出了自回归 LLM 的其它一些缺点,比如幻觉问题、信息滞后、可能出现不合适的表现、推理和规划能力有限、难以使用工具。
ChatGPT 的信息滞后问题,其知识范围受限于训练数据集,难以获取新知识
LeCun 不认为 LLM 的方法是实现 AI 之路,他曾在接受采访时批评说:「我们将一切都 token 化,然后训练一个超大模型来做离散的预测,然后期望 AI 会以某种方式从中显现。」他写道:如果不能从视频等感官输入学习世界模型,没有能够推理和规划的架构,我们就不可能创造出人类水平的 AI,甚至都不能造出猫水平的 AI。
LeCun 的世界模型
Yann LeCun 并不认为这些问题无法解决,他在上述的论文中提出了一种模型架构,其中最核心的部分是「世界模型」。
为了理解什么是世界模型,下面我们将从心智模型谈起,然后介绍被引入 AI 领域的世界模型概念,之后我们会更为详细地介绍 Yann LeCun 的世界模型以及构建其上的自动机器智能。
心智模型
-
大模型不是未来?你需要学习下图灵奖得主Yann LeCun选择的「世界模型」机器之心原创作者:PandaW最近一段时间,以GPT为代表的大型语言模型(L
-
今年可能是全球有记录最热的一年 跟这个科学现象有关?|天天新动态 时快讯近日,高温天气在全国各地席卷,高温黄色预警成为家常便饭,北京40度高
-
莫让“挤一挤”挤走安全-观热点据媒体报道,近日,江苏省南通市南通交警高速一大队在沪陕高速陈桥收费
-
听·见丨录取通知书“花式比美”,比“颜值”更重要的是啥_世界热点你的声音,我们愿意听见;你的关切,我们一同看见。新江苏评论员文心衣
-
阿方索-戴维斯社媒晒照,和穆西亚拉坐游艇出海度假-世界今日讯直播吧6月26日讯阿方索-戴维斯今天在社交媒体晒照,与穆西亚拉一同度假
-
外卖骑手当心!有人想利用你们干这种严重违法的事日前广州市中级人民法院公布一起贩卖毒品案件:跑腿骑手被抓所送“饮料
-
感应起电的原因_感应起电怎么回事_焦点关注1、感应起电的实质是在带电体上电荷的作用下,导体上的正负电荷发生了
-
国家市场监管总局到九江市调研特殊食品注册管理工作6月6日,国家市场监管总局特殊食品安全监管司司长周石平到九江市调研指
-
当前焦点!1864只“大熊猫”等你来!北京韩美林艺术馆明起重新开放北京日报客户端|记者陈强您见过1864只“大熊猫”汇聚一堂的场面吗?经
-
全球短讯!福建端午假期接待游客621万人次中新网福州6月25日电(叶秋云)记者25日从福建省文化和旅游厅获悉,根据
-
每日热议!成武县:时不我待、只争朝夕,向着全市高质量发展第一方阵奋勇前进00:32大众网记者王文博见习记者杨以锋成武报道6月24日,成武县召开2022
-
苏州12宗地块今日出让,总起始价约115亿元新京报讯(记者袁秀丽)6月25日,苏州第三批次12宗地块正式开拍,总出
-
青岛中院深入上合示范区走访调研(来源:青岛中院)信网6月25日讯(通讯员王晓琼张蕾)为深入落实青岛市
-
甘肃省政府国资委“三抓三促”行动督查组调研督查甘肃公交建集团6月21日上午,省政府国资委,省三抓三促行动领导小组第七督查组对甘肃
-
世界要闻:打响智能出行先锋,比亚迪宋PLUS冠军版上市智能出行技术无疑成为宋PLUS冠军版的一大亮点,创新的科技为消费者加持
-
【快播报】2023年9月贵州计算机等级考试报名时间及报名网址入口2023年9月贵州计算机等级考试报名时间及报名网址入口由计算机等级考试
-
教育部举行教育强国建设战略咨询委员会成立大会暨第一次全体会议 集思广益汇集众智 有力有序推动教育强国建设战略任务落实落地 速看料本报北京6月21日讯(记者高毅哲)今天,教育部在京举行教育强国建设战
-
世界看热讯:百叶窗帘如何清洗百叶窗帘是很多办公室常用的窗帘,不过也有不少家庭也会选择,那么安装
-
宁县小香包“绣”出致富大产业每日甘肃网讯(新甘肃·每日甘肃网通讯员李建强)随着端午节日益临近,
-
新股消息 | 童装品牌运营商永兴东润递表港交所 2022年营利双降 全球聚看点据港交所6月23日披露,永兴东润国际控股有限公司向港交所主板提交上市
-
唐山移动闻“汛”而动筑牢通信安全堤|每日精选日前,河北省已正式进入汛期。面对持续增压的防汛“大会战”,唐山移动
-
扶突《灵枢·本输》师承笔记【操作】直刺0 5~0 8寸。避开颈动脉,不可深刺。一般不使用电针,以
-
明知贾跃亭卖车是骗局,王思聪还往火坑里跳 天天时讯谈人|文 邱林沉寂多时的万达集团董事长王健林之子王思聪近日又浮出水面
-
百事通!湘西:专题授课助推学前教育优质发展红网时刻新闻6月23日讯(通讯员侯春梅谢琴)6月19日—20日,“国培计划
-
给老师的元旦祝福语句简短唯美_给老师的元旦祝福1、老师,大家都说您培养着祖国的栋梁我却要说,您就是祖国的栋梁。正
-
迷药网络灰色销售链调查 商家宣称网上下单“听话水”送货上门迷药网络灰色销售链调查(副题)法治日报记者韩丹东张守坤法治日报实习
-
ftp服务器怎么用http访问(ftp服务器怎么用)_环球热头条来为大家解答以上问题,ftp服务器怎么用http访问,ftp服务器怎么用很多
-
焦点短讯!【港股异动】基石药业-B(02616.HK)跌10.85%【财华社讯】中国生物制药(01177 HK)截至11:36下跌5 85%,现报3 38港元
-
全球资讯:去韩国办签证需要什么材料?去韩国旅游,首先要办理签证准备材料如下:1.签证申请表(包含护照,
-
宋教仁与中国民主宪政1、《宋教仁与中国民主宪政》是2008年湖南师大出版社出版的图书。2、作