人工智能是否真正掌握了语言的含义?

本文最初发表于广达杂志社。 一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基...

本文最初发表于广达杂志社。

一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基础,并且通过它们,人工智能的许多现代应用都是如此。

每个法学硕士都有自己的答案。在meta的开源Llama 3模型中,单词被分成由4096个数字表示的令牌;GPT-3的一个版本是12288。单独来看,这些长长的数字列表——被称为“嵌入”——只是难以理解的数字链。但同时,它们对单词之间的数学关系进行编码,这些关系看起来出奇地像意思。

单词嵌入背后的基本思想已经有几十年的历史了。要在计算机上模拟语言,首先从字典中取出每个单词,并列出它的基本特征——有多少由你决定,只要每个单词都是相同的。“你几乎可以把它想象成一个20问游戏,”在布朗大学和谷歌DeepMind研究语言模型的计算机科学家埃莉·帕夫利克(Ellie Pavlick)说。“动物、蔬菜、物体——这些特征可以是人们认为对区分概念有用的任何东西。”然后为列表中的每个特征分配一个数值。例如,dog这个词在“毛茸茸的”上得分很高,但在“金属的”上得分很低。结果将把每个单词的语义关联及其与其他单词的关系嵌入到一个唯一的数字串中。

研究人员曾经手工指定这些嵌入,但现在它们是自动生成的。例如,神经网络可以被训练成根据网络自己定义的特征对单词(或者,技术上讲,被称为“标记”的文本片段)进行分组。帕夫利克说:“也许有一种特征能很好地区分名词和动词,而另一种特征则能区分在句号后出现的单词和在句号后不出现的单词。”

这些机器学习嵌入的缺点是,与20个问题的游戏不同,每个数字列表中编码的许多描述是人类无法解释的。帕夫利克说:“这似乎是一个大杂烩。”“神经网络可以以任何有用的方式组成特征。”

但是,当一个神经网络被训练在一个叫做语言建模的特殊任务上时——这里涉及到预测序列中的下一个单词——它学到的嵌入绝不是任意的。就像铁屑在磁场下排列一样,这些值的设置方式使得具有相似关联的单词在数学上具有相似的嵌入。例如,狗和猫的嵌入将比狗和椅子的嵌入更相似。

这种现象使嵌入看起来很神秘,甚至很神奇:神经网络以某种方式将原始数字转化为语言意义,“就像把稻草纺成金子一样,”帕夫利克说。“文字算术”的著名例子——国王减去男人加上女人大致等于女王——只会增强嵌入的光环。它们似乎是LLM“知道”的丰富而灵活的知识库。

但这些所谓的知识与我们在字典中找到的东西完全不同。相反,它更像是一张地图。如果您将每个嵌入想象为由其他嵌入共享的高维地图上的一组坐标,您将看到某些模式弹出。某些词会聚集在一起,就像郊区拥抱大城市一样。同样,狗和猫的坐标会比狗和椅子更相似。

但与地图上的点不同的是,这些坐标只指向彼此,而不指向任何潜在的领土,就像纬度和经度数字表示地球上的特定地点一样。相反,狗或猫的嵌入更像是星际空间中的坐标:除了它们碰巧离其他已知点有多近之外,没有任何意义。

那么,为什么狗和猫的嵌入如此相似呢?这是因为他们利用了语言学家几十年前就知道的东西:在相似的语境中使用的单词往往具有相似的意思。在“我雇了一个宠物保姆来喂我的____”这个序列中,下一个单词可能是狗或猫,但可能不是椅子。你不需要字典来判断,只需要统计数据。

嵌入——基于这些统计数据的上下文坐标——是LLM如何找到一个好的起点来进行下一个单词的预测,而不依赖于定义。

某些词在特定的语境中比其他词更合适,有时精确到没有其他词可以代替。(想象一下,当你完成“法国现任总统的名字是____”这句话的时候)根据许多语言学家的说法,人类之所以能很好地辨别这种契合感,很大程度上是因为我们不只是把单词和单词联系起来——我们实际上知道它们指的是什么,就像地图上的领土一样。语言模型不会,因为嵌入不是那样工作的。

然而,作为语义的代理,嵌入被证明是非常有效的。这也是大型语言模型迅速上升到人工智能前沿的原因之一。当这些数学对象以一种与我们的期望相吻合的方式组合在一起时,感觉就像智慧;当他们不这样做时,我们称之为“幻觉”。然而,对于法学硕士来说,没有什么不同。它们只是一串数字,在空间里消失了。

本文来自作者[灵枫]投稿,不代表ibkak号立场,如若转载,请注明出处:https://m.ibkak.cn/jyfx/202508-1735.html

(1)

文章推荐

  • SQ2 ASX:尼克·莫尔纳力挺Block重塑美国银行业的提案

    Afterpay联合创始人尼克·莫尔纳(NickMolnar)在美国支付巨头Block内部发起了一项有目标的行动,目的是在Block的现金应用中嵌入先买后付的技术,这是Block董事长杰克·多西(JackDorsey)威胁要颠覆一代美国人的银行模式的一部分。上

    2025年07月12日
    1
  • 庆祝泰埃建交70周年:开罗举办泰拳课程盛典

    泰国内政部的目标是通过泰拳独特的武术,促进对泰国文化和价值观的理解和欣赏,比如尊重对手和自律。为庆祝泰埃建交70周年,泰国外交部将于2024年9月24日至10月1日在埃及开罗举办一系列活动,推广泰拳。这些活动由该部与泰国驻开罗皇家大使馆、国际泰拳协会联合会(IFMA

    2025年07月15日
    2
  • 法院判决后,蒂珀雷里一女子被限制养狗以参与灰狗赛事

      一名蒂珀雷里女子在法院被禁止养狗10年后,仍继续养狗并参加赛狗。2022年5月,内纳地方法院判处内纳本地人米歇尔·康诺利10年内不得拥有、饲养或繁殖狗,但她随后在爱尔兰赛道上参加了灰狗比赛,并与英国灰狗冠军驯兽师马克·沃利斯和她的伴侣迈克·戴维斯组成了新的比

    2025年07月20日
    2
  • 旧金山地方检察官Jovan Thomas因发送明确回复邮件而提起诉讼

      旧金山地区检察官办公室的一名前雇员起诉他的工作单位非法解雇——大约六个月前,他因为在电子邮件中向同事发送了一条奇怪而直白的信息而被解雇。约文·托马斯(JovanThomas)曾是地方检察官办公室的一名受害者辩护律师,今年1月,他被解雇了,原因是他点击了“回复

    2025年07月22日
    2
  • 基辅遭导弹袭击,简易爆炸装置致俄罗斯货车出轨

      当地官员星期六说,俄罗斯军队把乌克兰首都基辅作为夜间轰炸的一部分。俄罗斯官员指责乌克兰军方的无人机袭击了莫斯科周边地区和斯摩棱斯克地区。基辅市军事管理局局长谢尔盖·波普科(SerhiiPopko)说,一枚弹道导弹在接近乌克兰首都时被击落。他说没有人受伤。

    2025年07月26日
    2
  • 瑞银(UBS)解读:投资者应对地缘政治风险的新策略

      地缘政治风险最近一直在上升,给试图驾驭当前环境的投资者带来越来越多的挑战。瑞银(UBS)策略师在最近的一份报告中表示,最近的事态发展,比如英国和法国大选中边缘政党的胜利,“突显出政治结果正变得越来越难以预测”。此外,正在进行的加沙冲突和旷日持久的俄乌战争也增加了不确定性。尽管面临

    2025年07月27日
    1
  • 新罕布什尔州选民青睐他的三大理由

      新罕布什尔州德里——“投票,解决你的问题。”这是美国前总统唐纳德·特朗普(DonaldTrump)在一张纪念海报上写下的口号。他申请参加新罕布什尔州共和党全国初选的首轮投票,加入其他六名已报名的共和党候选人。特朗普定于几小时后在新罕布什尔州

    2025年08月06日
    2
  • 彼得·加布里埃尔《不要放弃》的创作启示

      艺术最迷人的一个方面是如何跨越空间和时间的元素可以在想象中聚集在一起,产生一个新的想法。彼得·加布里埃尔(PeterGabriel)在创作热门二重唱《不要放弃》(Don'tGiveUp)时,经常谈到自己的遭遇。1986年接受《Spin》杂志采访时,加布里埃尔描述了自己在玛格丽

    2025年08月12日
    2
  • 尼日利亚洪灾致179人遇难,约20万人无家可归

      2012年,尼日利亚有210多万人因洪水而流离失所。(表征)拉各斯,尼日利亚:尼日利亚一名紧急事务官员周四表示,经过“几周”的强降雨,尼日利亚部分地区的洪水已造成至少179人死亡,约20万人流离失所。到目前为止,大部分严重的洪水发生在尼日利亚北部。日本国家紧急事务管理局(NE

    2025年08月14日
    2
  • 给大家通报一下“微乐如何开挂打麻将游戏”分享装挂详细步骤

    网上科普有关微乐如何开挂打麻将游戏”话题很是火热,小编也是针对微乐麻将的技术支持和安全性寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。您好,微乐如何开挂打麻将游戏这款游戏可以开挂的,确实是有挂的,通过微信【游戏

    2025年08月16日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • 灵枫
    灵枫 2025年08月10日

    我是ibkak号的签约作者“灵枫”!

  • 灵枫
    灵枫 2025年08月10日

    希望本篇文章《人工智能是否真正掌握了语言的含义?》能对你有所帮助!

  • 灵枫
    灵枫 2025年08月10日

    本站[ibkak号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 灵枫
    灵枫 2025年08月10日

    本文概览:本文最初发表于广达杂志社。 一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基...

    联系我们

    邮件:ibkak号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们