研究:人工智能模型难以识别废话

     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

  Study: AI models struggle to identify nonsense

  在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。

  来自美国哥伦比亚大学的研究团队指出,他们的研究揭示了当前人工智能模型的局限性,并警告在法律或医疗领域使用这些模型仍为时尚早。

  研究人员对9种人工智能模型进行了测试,向它们提供了数百对句子,并询问哪些句子可能在日常交流中出现。

  此外,他们还让100名参与者对几对句子进行相同的判断,例如:“一个买家也可以拥有正品/一个精通高中圆周的人我漫步。”

  这项研究发表在《自然机器智能》期刊上,研究团队将人工智能的判断与人类的判断进行了比较,发现了显著的差异。

  像GPT-2这样的复杂模型,作为病毒式聊天机器人ChatGPT的早期版本,通常能与人类的回答相匹配。

  然而,其他一些较简单的模型表现则不尽如人意。

  研究人员强调,所有模型都存在错误。

  该报告的作者之一、心理学教授克里斯托弗·巴尔达萨诺(Christopher Baldassano)表示:“每个模型都显示出盲点,将一些人类参与者认为是无意义的句子标记为有意义的。”

  他补充道:“这应该促使我们深思,人工智能系统在多大程度上能够做出重要决策,至少在目前是这样。”

  论文的另一位作者塔尔·戈兰告诉法新社,这些模型是一项“令人兴奋的技术,可以极大地增强人类的生产力”。

  然而,他认为,“让这些模型在法律、医学或学生评估等领域取代人类决策可能为时尚早”。

  他说,潜在的陷阱之一是,人们可能会故意利用模型的盲点进行操控。

  随着ChatGPT的发布,人工智能模型在去年突然进入公众视野。自那时起,ChatGPT通过了各种考试,并被誉为医生、律师及其他专业人士的潜在助手。(法新社)

本文来自作者[admin]投稿,不代表xfqse号立场,如若转载,请注明出处:https://www.xfqse.cn/cskp/202506-429.html

(14)

文章推荐

  • 邦迪爸爸赢得了巨额乐透大奖:不能吃鸡肉

    一位班达伯格的父亲在拿到父亲节门票后,可能会失望地看到他最喜欢的NRL球队在布里斯班输掉比赛,但这并没有阻止他赢得一场不可思议的胜利——周六乐透奖金1000万美元中的一大笔。这位昆士兰州中部居民持有周六金乐透抽奖4501的四个一级彩票之一,于2024年9月7日星期六

    2025年06月18日
    10
  • 超级政治行动委员会在哈里斯的广告上押了7亿美元

    美国政坛最大的超级政治行动委员会正掀起一场空前的支出狂潮,在2024年大选的最后几周,它在电视广告上投入的资金比唐纳德·特朗普(DonaldTrump)和卡玛拉·哈里斯(KamalaHarris)竞选活动的总和还要多。这个名为“未来前进”(FutureForwa

    2025年06月28日
    9
  • 移民局在兰卡威机场拒绝29名巴基斯坦公民入境

      29名巴基斯坦公民被驱逐出境,声称参加体育赛事却引起怀疑。吉打州移民局局长莫哈德·里兹赞·莫哈德·扎因表示,这群人被怀疑后被拒绝入境并驱逐。这些人声称是为了参加“图巴越野跑”,但穿着运动服却没有相关装备。移民官员怀疑他们的真实动机,指出他们的行为不符合正常游客行为。

    2025年07月04日
    13
  • 随着对经济衰退的担忧消退,华尔街迎来了今年最好的一周

    路透纽约5月10日电---美国股市周五收高,延续今年最大单周百分比涨幅,因对经济下滑的担忧缓解,且投资者关注下周的JacksonHole经济研讨会。标准普尔500指数和纳斯达克指数连续第七个交易日上涨,股市从两周前的暴跌中收复失地。疲弱的经济数据和衰退担忧加

    2025年07月10日
    12
  • 哈马斯的袭击对以色列的情报和安全部队来说是一次惊人的失败

    以色列的情报和安全部门因未能预料到巴勒斯坦激进组织哈马斯星期六发动的大规模袭击而受到质疑。在一些报道之后,大约1000名武装分子在以色列境内枪杀了平民和军事目标,这是一次规模空前的袭击。据以色列媒体报道,至少有700名以色列人死亡,2100多

    2025年07月13日
    15
  • 巴林顿的一处房产以225万美元的价格成交,这是阿尔弗雷德·德罗恩有记录以来最大的房地产交易

      /巴林顿——最近,一处位于巴林顿的4200平方英尺住宅以225万美元成交,成为该镇阿尔弗雷德·德罗恩社区历史上最昂贵的房产交易,数据来源于罗德岛州的多房挂牌服务公司Compass网站。据代表卖方的ResidentialPropertiesLtd.介绍

    2025年07月15日
    11
  • 国内制药企业合作激增以应对资金挑战

    由于韩国制药公司难以独自筹集资金和出口技术,它们越来越多地与以前的竞争对手合作,分担药物开发的负担,提高盈利能力。虽然联合销售或生产现有产品在制药工业中很常见,但合作已显著增加,特别是在药物开发方面。今年4月,日东制药的新药开发子公司日东生命科学吸引了东

    2025年07月30日
    13
  • 老妇人试图调解争执时遭刺杀

      在PekanDarat的一所房子里,一名老妇人在试图制止母子之间的争吵时被一把剪刀刺伤了头部。这名80多岁的妇女被送往雪州惹亚医院(HSJ)接受治疗,但死亡。嫌疑人的母亲,70多岁,在KepalaBatas医院接受治疗。事发时,受害人与男嫌疑人、40多岁的侄子、嫌疑人的

    2025年07月30日
    12
  • 必看科普“哪里能买到桂林字牌开挂神器”详细分享开挂步骤

    哪里能买到桂林字牌开挂神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以

    2025年07月31日
    9
  • 重磅揭秘“多乐辅助器怎么作弊”分享真的有挂给你

    多乐辅助器怎么作弊是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出手

    2025年07月31日
    9

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月16日

    我是xfqse号的签约作者“admin”!

  • admin
    admin 2025年06月16日

    希望本篇文章《研究:人工智能模型难以识别废话》能对你有所帮助!

  • admin
    admin 2025年06月16日

    本站[xfqse号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年06月16日

    本文概览:     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

    联系我们

    邮件:xfqse号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们