评估预部署AI模型的可靠性

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。

然而,作为ChatGPT和DALL-E等强大人工智能工具的核心,这些模型有时可能会提供错误或误导性的信息。在一些安全至关重要的场景中,比如行人接近自动驾驶汽车时,这些错误可能会导致严重后果。

为了避免此类错误,麻省理工学院及其IBM沃森人工智能实验室的研究人员开发了一种技术,能够在将基础模型应用于特定任务之前评估其可靠性。

他们通过训练一组略有不同的基础模型来实现这一目标。接着,他们利用算法评估每个模型在相同测试数据点上的学习表示的一致性。如果表示一致,便意味着该模型是可靠的。

在与最先进的基线方法进行比较时,他们的技术在捕捉各种分类任务中基础模型的可靠性方面表现更佳。

这种技术可以帮助用户判断一个模型是否适合特定环境,而无需在现实世界的数据集上进行测试。这在某些情况下尤其有用,例如医疗保健环境中,由于隐私问题可能无法访问数据集。此外,该技术还可以根据可靠性分数对模型进行排序,帮助用户选择最适合其任务的模型。

“所有模型都有可能出错,但能够识别出何时出错的模型更具实用性。对于这些基础模型而言,量化不确定性或可靠性变得更加复杂,因为它们的抽象表示难以进行比较。我们的方法可以帮助量化模型在特定输入数据下的可靠性,”资深作者Navid Azizan表示,他是麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)的助理教授,同时也是信息与决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park(LIDS研究生)共同撰写了关于这项工作的论文,参与者还包括麻省理工学院-IBM沃森人工智能实验室的研究科学家王浩,以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将于人工智能不确定性会议上发表。

统计共识

传统的机器学习模型通常被训练来执行特定任务,通常会根据输入做出具体预测。例如,模型可能会判断某张图片中是猫还是狗。在这种情况下,评估可靠性可能仅需查看最终预测结果,判断模型是否正确。

然而,基础模型的工作方式有所不同。它们使用通用数据进行预训练,创建者并不清楚模型将应用于哪些具体下游任务。用户在训练完成后可以让模型适应自己的特定需求。

与传统机器学习模型不同,基础模型不会给出“猫”或“狗”这样的具体标签,而是基于输入数据生成抽象表示。

为了评估基础模型的可靠性,研究人员采用了一种集成方法,训练多个具有相似特征但略有不同的模型。

“我们的思路类似于计算共识。如果所有基础模型对数据集中的任何数据都给出一致的表示,那么我们可以认为该模型是可靠的,”Park表示。

但他们面临一个挑战:如何比较这些抽象表示?

他补充道:“这些模型输出的是一个由数字组成的向量,因此我们无法轻易比较它们。”

他们通过一种称为邻域一致性的概念来解决这个问题。

在他们的方法中,研究人员准备了一组可靠的参考点来测试模型集合。然后,他们对每个模型在其表示的测试点附近的参考点进行调查。

通过观察相邻点的一致性,他们能够估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以将这个空间视为一个球体。每个模型将相似的数据点映射到其球体的同一区域,因此猫的图像会集中在一个地方,而狗的图像则在另一个地方。

然而,每个模型在其领域内绘制的动物地图可能不同,因此当猫可能被分组在一个球体的南极时,另一个模型可能在北半球的某个位置绘制猫的地图。

研究人员使用邻近点作为锚来对齐这些球体,从而使表示具有可比性。如果一个数据点的邻居在多个表示中一致,那么我们可以对该点的模型输出的可靠性充满信心。

在对广泛的分类任务进行测试时,他们发现这种方法比基线方法更具一致性。此外,它不会因为挑战测试点而导致其他方法失效。

此外,他们的方法可以用于评估任何输入数据的可靠性,因此可以评估模型对特定类型个体(例如具有某些特征的患者)的效果。

王表示:“即使所有模型的整体性能处于平均水平,从个体的角度来看,你也会更倾向于选择最适合自己的模型。”

然而,一个限制在于他们必须训练一个大型基础模型的集合,这在计算上是昂贵的。未来,他们计划寻找更高效的方法来构建多个模型,或许可以通过对单个模型进行小扰动来实现。

本文来自作者[svs]投稿,不代表立场,如若转载,请注明出处:http://liyuanfurniture.cn/post/5398.html

(145)

文章推荐

  • 2023款宝马3系最新价格及配置详解

      宝马3系2023新款价格  前言:(图片来源网络,侵删)宝马3系一直以来都是豪华车市场的热门车型之一,备受消费者的喜爱。而2023年的新款宝马3系也备受期待。本文将为大家介绍宝马3系2023新款的价格以及一些相关信息。  主题:宝马3系2023新款价格及特点  宝马3系2023新

    2024年08月31日
    771
  • 为什么无法在音乐平台找到陈升的歌?

      为什么找不到陈升的歌  在这个数字化时代,我们可以轻松地通过各种音乐平台找到我们喜爱的歌手的歌曲,但是有时候却找不到某些歌手的歌曲,比如陈升。那么为什么找不到陈升的歌呢?让我们一起来探讨一下。(图片来源网络,侵删)为什么找不到陈升的歌  主题:陈升的歌曲在某些音乐平台上无法找到的原

    2024年09月10日
    714
  • 火灾后环线为何频繁中断?

      新加坡:在周三(9月18日),由于火灾的发生,环线服务在短短两天内再次中断。  交通运营商SMRT在周三晚上通过Facebook发布消息称,约在晚上8点,金川车站的一个电力系统隔间发生了火灾。这一事件导致电力中断,进而影响了环线的电力供应。  SMRT表示:“这导致部分列车停运,车内

    2024年09月30日
    741
  • 怀孕期间可以做亲子鉴定吗 孕期是否可以进行亲子鉴定?

    怀孕期间可以做亲子鉴定吗?  在怀孕期间,亲子鉴定是可以进行的。通常有两种方法:无创产前亲子鉴定和有创产前亲子鉴定。无创产前亲子鉴定是通过抽取孕妇的血液,分析胎儿的DNA,安全性高且不会对胎儿造成伤害。而有创产前亲子鉴定则需要通过羊水穿刺或绒毛取样,这种方法虽然准确,但存在一定的风险。因此,选择

    2024年11月10日
    246
  • 法官裁决:Skyline必须离开水地

      /周一,普罗维登斯州地方法院的法官下达了驱逐令,针对的是自2016年起租用市中心著名私人活动和婚礼场地的租户——WaterplaceLLC的Skyline。自今年4月起,市检察官对Skyline进行了为期7天的驱逐程序,理由包括未付账单、垃圾和废物问题

    2024年11月14日
    273
  • 印度国务部长与三星高管会晤,商讨解决罢工问题

      路透社斯里伯伦布都尔10月8日报道——印度南部泰米尔纳德邦的劳工部长将在周四与三星电子的高层进行会谈,旨在解决导致该公司消费电子工厂停工四天的罢工问题。这家工厂位于金奈附近的斯里珀伦布杜尔,数百名工人因要求加薪而停止工作,此次事件被认为是近年来印度最大的工业

    2024年11月24日
    145
  • 珊瑚白化的危机与经济影响

      关于大堡礁健康状况的最新官方报告令人感到心痛。大堡礁海洋公园管理局上周五发布了第四份五年一次的《展望报告》,指出大堡礁美好未来的机会正在“迅速消失”。尽管在截至2023年12月的五年内,珊瑚礁栖息地的整体状况从“非常差”改善为“差”,但在报告期结束后的2024年初,大规模的珊瑚

    2024年12月01日
    132
  • 魅力计数器使用指南

      在他年轻的大部分时间里,布莱恩想成为一名天体物理学家。他痴迷于哈勃望远镜,他卧室的天花板上点缀着塑料的夜光星星。当学术书展来到他的图书馆时,他会乞求父母给他钱买NASA的摄影集。对他来说,太空科学似乎是创新、兴奋和存在主义的巅峰。本文仅对BusinessI

    2024年12月02日
    115
  • Keir Starmer在激烈的P&O游轮投资争吵中把顶级盟友扔到了巴士下面

      基尔•斯塔默爵士(SirKeirStarmer)在其一位重要盟友的争议性言论引发重大投资危机后,公开对她进行了指责。英国交通大臣路易丝•黑格对邮轮和渡轮公司P&O提出了严厉的指控,称其为“流氓”和“牛仔经营者”,因为该公司解雇了800名员工,转而雇

    2024年12月07日
    47
  • RG卡尔惨败:初级医生继续“停止工作”

      印度尼西亚,9月19日(IANS):西孟加拉邦初级医生论坛(WBJDF)是领导医生抗议一名初级医生在R.G.卡尔医学院和医院被强奸和谋杀的伞式组织,周三与首席秘书ManojPant的重要会议失败后,将继续“停止工作”示威,据报道后者拒绝对会议记录进行正式记录。

    2024年12月10日
    15

发表回复

本站作者后才能评论

评论列表(4条)

  • svs
    svs 2024年12月01日

    我是的签约作者“svs”!

  • svs
    svs 2024年12月01日

    希望本篇文章《评估预部署AI模型的可靠性》能对你有所帮助!

  • svs
    svs 2024年12月01日

    本站[]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • svs
    svs 2024年12月01日

    本文概览:基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

    联系我们

    邮件:@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们