0
本文作者:贵着 | 2025-07-04 08:12:38 |
。笑地 【科学漫笔·我见AI】 。乱语
最近 ,笑地四岁的乱语女儿向我“报告”幼儿园日子时,有板有眼地描绘她与一只霸王龙交朋友的笑地故事:她们一同抓小恐龙 ,由于跷跷板闹翻 ,乱语又交流零食和洽……逻辑紧密 ,笑地细节丰厚——虽然她的乱语幼儿园里连只仓鼠都没有 。细究之下才知 ,笑地这孩子本来把绘本、乱语动画和实际糅合在一同 ,笑地用童言童语编织出一个“合理”的乱语故事 。
此情此景,笑地也让我想到当下人工智能(AI)的乱语“错觉”现象:它能将虚拟与实在无缝拼接 ,生成看似谨慎实则荒谬的笑地答案 ,似乎一个捧着百科全书满嘴跑火车的天才儿童。
从前年爆火的ChatGPT到最近出圈的DeepSeek,AI正以肉眼可见的速度重塑日子。它既能帮中学生秒解几许题,也能替小说家生成纠缠的剧情。而若抛出一些不着边际的问题,比方“从化学视角解析孙悟空火眼金睛是怎样炼成的” ,它也能像模像样地编造出一大篇学术剖析 ,乃至煞有介事地标示出参考文献 。更令人啼笑皆非的是 ,当遭到质疑时 ,它会臆造更多论据来无懈可击。这种真假难辨的“常识错觉”一如沙上楼阁,看似气势如虹,实则千疮百孔。而在AI狂飙突进的当下,相似的“错觉”还在被大批量出产出来 。
要了解AI为何大话连篇,得从它的学习方法说起。今日的AI遍及根据大言语模型(LLM)。在它面世之前,传统AI就像安分守己的优等生,全赖死记硬背语法规矩来答题解疑;而大言语模型更像炼丹术士 ,将巨大的语料放入“丹鼎”以期炼得“金丹” 。哲学家维特根斯坦曾说,言语的含义不在预设的实质中,而在于日常的运用——就像孩子学说话 ,没人教“主谓宾” ,全赖调查大人如安在饭桌上说“吃”,在踢足球时喊“跑”——维特根斯坦称之为“言语游戏” 。大言语模型正是对这种游戏的算法化 :它被抛入一个虚拟的语料国际中 ,吞下海量的文本资料,没有人告知它该怎样出去,它只能自己从中探索出一条路途来 。
终究,涅槃重生的AI开口说话了——一面是夸夸其谈,一举成名;另一面却是信口雌黄 ,“鬼话”连篇。
人们不惜赞许着AI的横空出世,却也正费尽心机要给胡言乱语的AI“看病” 。比方,为了避免AI错觉众多 ,工程师们加装了“常识导航”(检索增强技能RAG)来引导它查验实际,铺设了“轨迹护栏”(提示词束缚)以避免答案跑偏 ,乃至请人类教师当“监考”(人类反应强化学习RLHF)给胡诌打红叉。但即便如此严加管教 ,AI仍会冷不丁变成“脱缰野马”。就像班上总有几个聪明又狡猾的学生,能把考场作文写成科幻史诗——你明知道他在编,却还得敬服其梦想的不羁 。
但或许问题不止于技能层面:究其实质 ,言语便是真伪交错的游戏。远古人类围着篝火编神话,中世纪的吟游诗人即兴歌唱