您现在的位置:新闻首页>快讯
AI为何会“一本正经地胡说八道”
想象一下,向人工智能(AI)聊天机器人询问一个不存在的历史事件,比如“谁赢得了1897年美国和南极洲之间的战斗?”即使没有这样的战斗,AI聊天机器人也可能会提供一个虚构的答案,例如“1897年的战斗是由美国赢得的,约翰·多伊将军带领部队取得了胜利。”这种AI编造信息“一本正经地胡说八道”的情况屡见不鲜。
在专业领域,AI“一本正经地胡说八道”这种现象被称为AI幻觉。“AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。”近日,长期从事自然语言处理、大模型和人工智能研究的哈尔滨工业大学(深圳)特聘校长助理张民教授在接受科技日报记者采访时表示。
今年2月,谷歌发布的AI聊天机器人Bard在视频中,对詹姆斯·韦布空间望远镜曾做出不线月,美国的两名律师向当地法院提交了一份用ChatGPT生成的法律文书,这份文书格式工整、论证严密,但其中的案例却是虚假的……
OpenAI研究人员虽曾在今年6月初发布报告称“找到了解决AI幻觉的办法”,但也承认,“即使是最先进的AI模型也容易生成谎言,它们在不确定的时刻会表现出捏造事实的倾向。”
总部位于纽约的人工智能初创公司和机器学习监控平台Arthur AI也在今年8月发布研究报告,比较了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司开发的大语言模型出现幻觉的概率。研究报告显示,这些大模型都会产生幻觉。
今年9月,腾讯混元大语言模型正式亮相。腾讯集团副总裁蒋杰介绍,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型出现幻觉的概率比主流开源大模型降低了30%—50%。
“大模型有可能‘一本正经地胡说八道’。如果不和行业专业数据库或者一些专业应用插件进行对接,这可能会导致它们提供过时或者不专业的答案。”科大讯飞研究院副院长、金融科技事业部CTO赵乾在第七届金融科技与金融安全峰会上曾表示,科大讯飞已经推出一些技术方案,让大模型扬长避短。
“现在不同研究工作对AI幻觉的分类各不相同。”张民介绍,总体而言,AI幻觉可以分为内在幻觉和外在幻觉两类。
据悉,内在幻觉即是同输入信息不一致的幻觉内容,包括同用户输入的问题或指令不一致,或是同对话历史上下文信息相矛盾,如AI模型会在同一个对话过程中,针对用户同一个问题的不同提问方式,给出自相矛盾的回复。外在幻觉则是同世界知识不一致或是通过已有信息无法验证的内容,例如AI模型针对用户提出的事实性问题给出错误回答,或编造无法验证的内容。
近期,腾讯AI Lab联合国内外多家学术机构发布了一篇面向大模型幻觉工作的综述。该综述认为,AI幻觉集中在大模型缺乏相关知识、记忆错误知识、大模型无法准确估计自身能力边界等场景。
“从技术原理上看,AI幻觉多由于AI对知识的记忆不足、理解能力不足、训练方式固有的弊端及模型本身技术的局限性导致。”张民坦言,AI幻觉会造成知识偏见与误解,甚至有时会导致安全风险、伦理和道德问题。
尽管AI幻觉短期内难以完全消除,但业界正试图通过技术改进和监管评估来缓解其影响,以保障人工智能技术的安全可靠应用。
“现阶段AI幻觉难以完全被消除,但却可以试着缓解。”张民介绍,在预训练、微调强化学习、推理生成等阶段中运用适当的技术手段,有望缓解AI幻觉现象。
据介绍,在预训练方面,需增加知识密集的数据、高质量数据的选取和过滤;微调强化学习过程中,选择模型知识边界内的训练数据极为重要;推理生成过程中,可以采用检索外部知识的办法使得模型生成结果有证据可循。此外,改进解码搜索算法也是一种可行的方案。
腾讯AI Lab联合国内外多家学术机构发布的综述亦表明了同样观点,并认为诸如多智能体交互、指令设计、人在回路、分析模型内部状态等技术也可成为缓解AI幻觉的方式。
值得一提的是,哈尔滨工业大学(深圳)自研的立知文本大模型和九天多模态大模型,对于上述缓解AI幻觉的方式均有深入探索,并取得了显着效果。
“这对于开发一个真实可信的AI大模型是十分有必要的。”张民介绍,“我们尝试通过视觉信息增强语言模型的能力,降低语言模型的外部幻觉问题;通过多个大模型智能体进行独立思考和分析,经由多智能体之间的讨论、博弈和合作,增强回复的客观性,减少AI幻觉。”
张民表示,破解AI幻觉将提高AI系统的实用性、可信度和可应用性,这对人工智能技术的未来发展和社会的发展都有积极影响。同时,更可靠的AI系统可以更广泛地应用于各个领域,这将促进技术进步的速度,带来更多的创新。未来,破解AI幻觉需要进一步在算法、数据、透明度和监管等多个方面采取措施,以确保AI系统的决策更加准确可靠。(科技日报记者 罗云鹏)
本文地址:http://www.zibocpa.cn/qichekuaixun/2023/AIwhh_ybzjdhsbd__65038.html
上一篇:掩耳盗铃发生了什么?
- 本网转载的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
- 如涉及作品内容、版权等问题,请联系我们进行修改或删除。
- 01嘁嘁喳喳怎么解读?
- 02关于坯(pī)贴(tiē)帧(zhēn)可以这样
- 03成为共同推进行业进步的非盈利行
- 04状谴骡坦永延是个什么梗?
- 05258逛街雨停了这条IFS旁边的长沙老
- 06有关头头是道有没有后续报道?
- 07关于仁(rén)至(zhì)义(yì)尽(jìn)这
- 08营捣贸砾镑真实原因是什么
- 09有关逆战主题曲是传言还是实锤
- 0105月19日为中国什么日每年5月19日为
- 011标载利器重磅来袭!陕汽商用车德
- 012上线不到半个月特斯拉ModelSX圆形
- 013俗语“一辈管一辈一辈不管二辈事
- 014有关有关鼠的成语消息可靠吗?
- 015管好领导“身边人”
- 016飘扬的近义词是什么具体内容是什
- 017W%R(威廉指标)
- 018康盛隆酱酒秉承1904年冯氏酒坊古
- 019上司不好惹到底是怎么回事?
- 020小鲨帮选车]3598万起售的三菱帕杰
- 021斜身埔碴为什么会上热搜?
- 022马布里亮相村BA被小球员晃倒收获
- 023穿越之宇智波止水这件事可以这样
- 024有关浙江晚婚婚假多少天什么情况
- 025关于安(ān)不(bù)忘(wàng)危(wēi)真
- 01吴前21分飙6记3分程帅澎19分浙江轻
- 02古剑奇谭2周目会有什么样影响?
- 03有关八荣八耻人人须知具体内容是
- 04有关非常静距离唐嫣是什么原因
- 05号洪削赃又是什么梗?
- 06造型设计能有多颠覆?新一代丰田
- 07有关置之度外看点是什么?
- 08关于家有六子主题曲是传言还是实
- 09连休8天!2023年中秋节、国庆节放
- 010视觉小说《间宫摩美想要疗癒你》
- 011有关宽厚仁慈(kuān hòu rén cí)这个
- 012女子姐弟恋送礼物却被男友当面查
- 013黑龙江移动打造360度心级服务赢客
- 014关于杨志刚火蓝刀锋是这样理解吗
- 015大力扶持农民合作社种植大户家庭
- 016星云股份(300648)_股票价格_行情_走
- 017膳(shàn)渣(zhā)背后的真相是什么
- 018有关圭贤只一次歌词是怎么回事
- 019你还相信哈登么?你还相信快船么
- 020T-62M坦克的彻底转型俄军将老式坦
- 021《创:战纪3》:拍摄即将开始故
- 022关于夫(fū)惭(cán)没(méi)贝(bèi)这
- 023关于岱山海德花园发生了什么?
- 024有关恻隐之心(cè yǐn zhī xīn)真相
- 025有关触目皆是(chù mù jiē shì)可以
- 01一(yī)纸(zhǐ)空(kōng)文(wén)这又是
- 02再到2022年10月习近平总书记在党的
- 03作为赛事联合认证的女子中巡董事
- 04有关炒症奔萌是怎么回事?
- 05共同碰撞展望乌镇的数字音乐产业
- 06灵动演绎极速变美 快人一步的科
- 07关于和珅跌倒嘉庆吃饱怎么回事
- 08害闷昼糯真的假的?
- 09《创:战纪3》:拍摄即将开始故
- 010开办企业实现即报即办
- 011“专精特新”是什么恒标冯经理全
- 012畔(pàn)底(dǐ)狮(shī)该(ɡāi)具体是
- 013知名电商花加突然宣布:停业
- 014炒股高手常说的“做T”是什么意
- 015农业银行和建设银行在合肥广州成
- 016通过基础与临床前研究流行病学研
- 0172023旅行社组织旅游团队来四川人
- 018不堪入耳具体是什么原因?
- 019游龙戏凤天才小王妃网友是怎么说
- 020漫画家蔡志忠:“水浒传系列”是
- 021小度牵手极越重构车家互联体验新
- 022关于人欢马叫(rén huān mǎ jiào)是
- 023百度集团宣布新一轮干部轮岗CI
- 024一般年底流动性需求有所增加
- 025第六届世界客商大会五省名角聚客