AI模型预先部署的可靠性检测

基础模型是大量的深度学习模型,这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务,比如生成图像或回答客户问题。 但是,作...

基础模型是大量的深度学习模型,这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务,比如生成图像或回答客户问题。

但是,作为ChatGPT和DALL-E等强大人工智能工具的支柱,这些模型可能会提供不正确或误导性的信息。在安全关键的情况下,比如行人接近自动驾驶汽车,这些错误可能会造成严重后果。

为了防止此类错误,麻省理工学院和麻省理工学院- ibm沃森人工智能实验室的研究人员开发了一种技术,可以在将基础模型部署到特定任务之前评估其可靠性。

他们通过训练一组彼此略有不同的基础模型来做到这一点。然后,他们使用他们的算法来评估每个模型对相同测试数据点学习的表示的一致性。如果表示是一致的,就意味着模型是可靠的。

当他们将他们的技术与最先进的基线方法进行比较时,它在捕获各种分类任务的基础模型的可靠性方面表现得更好。

有人可以使用这种技术来决定一个模型是否应该应用于特定的环境,而不需要在现实世界的数据集上进行测试。当数据集可能由于隐私问题而无法访问时,例如在医疗保健环境中,这可能特别有用。此外,该技术可用于基于可靠性分数对模型进行排序,使用户能够为其任务选择最佳模型。

“所有模型都可能出错,但知道自己什么时候出错的模型更有用。对于这些基础模型来说,量化不确定性或可靠性的问题变得更加困难,因为它们的抽象表示难以比较。我们的方法可以让你量化表示模型对于任何给定输入数据的可靠性,”资深作者Navid Azizan说,他是麻省理工学院机械工程系和数据、系统和社会研究所(IDSS)的Esther和Harold E. Edgerton助理教授,也是信息和决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park (LIDS研究生)一起撰写了一篇关于这项工作的论文;麻省理工学院- ibm沃森人工智能实验室的研究科学家王浩;以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将在人工智能不确定性会议上发表。

统计共识

传统的机器学习模型被训练来执行特定的任务。这些模型通常根据输入做出具体的预测。例如,模型可能会告诉你某张图片中是猫还是狗。在这种情况下,评估可靠性可能只是查看最终预测,看看模型是否正确。

但基金会的模式是不同的。该模型使用一般数据进行预训练,其创建者并不知道该模型将应用于的所有下游任务。用户在训练完成后就可以让它适应自己的特定任务。

与传统的机器学习模型不同,基础模型不会给出像“猫”或“狗”标签这样的具体输出。相反,它们基于输入数据点生成抽象表示。

为了评估基础模型的可靠性,研究人员使用了一种集成方法,通过训练几个模型,这些模型具有许多相同的特性,但彼此之间略有不同。

“我们的想法就像计算共识。如果所有这些基础模型对我们数据集中的任何数据都给出了一致的表示,那么我们可以说这个模型是可靠的,”Park说。

但他们遇到了一个问题:他们如何比较抽象的表示?

他补充说:“这些模型只是输出一个矢量,由一些数字组成,所以我们不能轻易地比较它们。”

他们用一种叫做邻域一致性的想法解决了这个问题。

对于他们的方法,研究人员准备了一组可靠的参考点来测试模型的集合。然后,对于每个模型,他们调查位于该模型表示的测试点附近的参考点。

通过观察相邻点的一致性,他们可以估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以把这个空间看成一个球体。每个模型都将相似的数据点映射到其球体的同一部分,因此猫的图像放在一个地方,狗的图像放在另一个地方。

但是每个模型会在自己的领域内绘制不同的动物地图,所以当猫可能被分组在一个球体的南极附近时,另一个模型可以在北半球的某个地方绘制猫的地图。

研究人员使用像锚一样的邻近点来对齐这些球体,这样它们就可以使表征具有可比性。如果一个数据点的邻居在多个表示中是一致的,那么应该对该点的模型输出的可靠性有信心。

当他们在大范围的分类任务中测试这种方法时,他们发现它比基线更加一致。另外,它不会因为挑战测试点而导致其他方法失败。

此外,他们的方法可用于评估任何输入数据的可靠性,因此人们可以评估模型对特定类型的个体(例如具有某些特征的患者)的效果如何。

王说:“即使所有型号的整体性能都是平均水平,从个人的角度来看,你也会更喜欢最适合自己的型号。”

然而,一个限制来自于它们必须训练一个大型基础模型的集合,这在计算上是昂贵的。在未来,他们计划找到更有效的方法来建立多个模型,也许是通过使用单个模型的小扰动。

这项工作部分由麻省理工学院- ibm沃森人工智能实验室、MathWorks和亚马逊资助。

本文来自作者[幼柳]投稿,不代表ibkak号立场,如若转载,请注明出处:https://m.ibkak.cn/jyfx/202508-2034.html

(3)

文章推荐

  • 男子遭石头砸击身亡,离奇案件引发恐慌

    (预示着DB)7月31日,全南丽水附近高速公路上停放的一辆汽车内,发现一名男子死亡,另一名男子重伤,警方于上周末展开了调查。两名死者的大腿上都有严重伤口,显然是由外部物体造成的。警方的尸检显示,这名男子死于大出血和败血症,死因是被石头砸伤。

    2025年07月09日
    1
  • 秘鲁考古发现:1300年前莫切女王的宏伟王座室

    秘鲁考古学家发现了一间有着1300年历史的正殿,上面画着一位莫切女性统治者的壁画,尽管他们还没有找到女王的遗骸。考古学家在一份声明中说,在Pañamarca考古遗址发现的这个王座室可以追溯到公元7世纪,当时莫切人在该地区蓬勃发展。大约在公元350年到850年间,莫切

    2025年07月12日
    2
  • 普莱斯透露:公投日父母向他们扔鸡蛋,家中遭遇袭击

    就在普莱斯披露这些事件的同一天早上,国家党领袖大卫·利特普劳德(DavidLittleproud)赞扬了这位澳大利亚土著女发言人对“反对”运动的领导,但回避了她可能接替他职位的建议。利特尔普劳德发表上述言论之前,报头报报道说,几名国家党成员认为,普莱斯有一天可以

    2025年07月15日
    1
  • 流媒体崛起:有线电视的衰退与未来的挑战

    如果你是付费收看有线电视或卫星电视服务的人数越来越少的人之一,你的账单可能会继续上涨,因为产品越来越差。周一宣布的一项合并将创建该国最大的电视公司,这可能使情况更加糟糕。或者,如果你沉迷于Netflix这样的流媒体电视服务,你的账单也可能会继续上涨,因为这个产品越来越

    2025年07月17日
    1
  • 摩苏尔节庆重现古代音乐,展现城市复兴的力量

      摩苏尔的居民在一个曾经用于训练战士和招募儿童的公园里庆祝新节日,纪念从ISIS手中获得的自由,以及他们悠久的伊拉克音乐遗产。该社区还参与了新的学习机会,作为一个研究项目的一部分,旨在保护充满活力的伊拉克maqam音乐,并为后代传承。多年的政治动

    2025年07月20日
    0
  • 雷丁悲剧:4岁女孩遭小巴撞击不幸身亡

    一名四岁女孩在雷丁被一辆小巴撞死。事故发生在周二早上,地点是伯克郡镇戈德斯米德路和罗素街的交界处。这名女孩后来在医院死亡。司机仍在现场,没有人被逮捕。警方呼吁目击者挺身而出。泰晤士河谷警方侦探探长贾斯汀·托马斯

    2025年07月20日
    2
  • 88008:西班牙El Gordo彩票的幸运符号

    在西班牙,号码为88008的彩票持有者正在庆祝,因为他们赢得了西班牙圣诞彩票的头奖。非常受欢迎的ElGordo——“胖子”——今年总共发放了26亿欧元(22亿英镑)的奖金,其中大部分是相对较小的金额。持有20欧元(17英镑)的头奖彩票的人将获得

    2025年07月21日
    2
  • 奥巴马在亚利桑那州回应质疑,痛批有害政治现象:“大家都在叫嚷”

    前总统巴拉克•奥巴马(BarackObama)在亚利桑那州的竞选活动中被人群中的一名质问者叫住,并迅速将其转化为一个更广泛的传递信息的机会,表明美国日益有毒的政治环境。这是在民主党参议员马克·凯利和凯蒂·霍布斯的巡回演讲中出现的,他们将分别在下周的中期选举中与布

    2025年07月23日
    1
  • 山姆·班克曼-弗里德向麻省理工学院的朋友揭示:80亿美元的缺口暴露金融交易系统的脆弱性

      (彭博社)——FTX联合创始人王润表示,他和山姆·班克曼-弗里德利用客户资金犯下了数十亿美元的欺诈行为,导致加密货币交易所倒闭。此前不久,他就对曾经的数学夏令营伙伴和麻省理工学院的室友提出了反对意见。周四下午,身穿灰色西装、系着红色领带的王在作为政府证人进入

    2025年08月09日
    1
  • 内幕揭晓“拼三张挂免费”的确是有挂

    家好,今天小编来为大家解答拼三张挂免费有没有挂这个问题咨询软件客服可以免费测试,拼三张挂免费的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、拼三张挂免费记牌器怎么全显示你需要获得记牌器才能全部显示,否则只显示前面几张牌的数据。如下图所示:获

    2025年08月16日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • 幼柳
    幼柳 2025年08月16日

    我是ibkak号的签约作者“幼柳”!

  • 幼柳
    幼柳 2025年08月16日

    希望本篇文章《AI模型预先部署的可靠性检测》能对你有所帮助!

  • 幼柳
    幼柳 2025年08月16日

    本站[ibkak号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 幼柳
    幼柳 2025年08月16日

    本文概览:基础模型是大量的深度学习模型,这些模型已经在大量通用的、未标记的数据上进行了预训练。它们可以应用于各种任务,比如生成图像或回答客户问题。 但是,作...

    联系我们

    邮件:ibkak号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们