magic_sex5 AI软件“幻听”严重，为何病院皆在用？

发布日期：2024-10-31 14:06 点击次数：128

Whisper是科技巨头OpenAI新发布的一个自动语音识别系统，OpenAI公司称其具有接近“东谈主类水平的可靠性和准确性”。

关联词据多名软件工程师、设立东谈主员和学术不竭东谈主员反映，Whisper也有一个紧要残障——它或然会编造出一大段笔墨以致是整句。巨匠示意，这些被AI编造出来的笔墨（在业内也被称作幻听），有可能包含种族主义和暴力言论，以致是凭梦联想出来的医学疗法。

巨匠示意，AI的这种“幻听”可不是一个小问题，因为Whisper也曾被天下各地的许多行业用于翻译和转录对话，为一些流行的消耗工夫生成文本，以及为视频创建字幕等等。

更令东谈主担忧的是，一些病院以致诳骗了基于Whisper设立的器具，来纪录医患之间的对话。尽管OpenAI也曾劝诫称，Whisper并不应该被用在“高风险界限”。

要想精确判断这个问题的严重进程，并非一件容易的事。不外据不竭东谈主员和工程师称，他们时时会在责任中遭受Whisper“幻听”的情况。比如，密歇根大学又名不竭东谈主员开展了一项针对公开会议的不竭，他发现他仔细查察过的10个音频转录文本中，有8个皆出现了“幻听”的情况。

一位机器学习工程师也示意，在他分析的100多个小时的Whisper转录文本中，他发现存一半皆存在“幻听”。一位第三方设立者示意，在他用Whisper编写的2.6万份文本中，每乎每一份皆在“幻听”问题。

即使在那些录制细腻的短音频样本中，问题也仍然存在。有计较机科学家在最近的一项不竭中查察了13000多份明晰音频片断的转录文本，限度发现了187处“幻听”。

不竭东谈主员示意，若是是这么的话，那么在几百万份语音转录文本中，至少会出现几万份转录失实。

拜登政府的前白宫科技战略办公室主任阿隆德拉·尼尔森指出，这种失实可能会导致“很是严重的效果”，终点是在医疗场景中。

尼尔森目下是新泽西州的普林斯顿高等不竭所的又名素质。他示意：“莫得东谈主但愿我方被误诊，在这方面应该有更高的圭臬。”

Whisper还被用于为聋哑东谈主和听障东谈主士制作字幕。加劳德大学工夫取得技俩厚爱东谈主克里斯蒂安·沃格勒指出，若是这些字幕转录失实的话，对聋东谈主和听障东谈主士的影响显明是愈加严重的，因为他们根底无法识别“避讳在整个这些笔墨中的演叨履行。” 沃格勒我方等于又名聋东谈主。

各方敦促OpenAI尽快处置问题

由于AI“幻听”的问题非往往见，不少巨匠以致包括前OpenAI公司的职工皆在号令联邦政府商酌制定干系监管战略。至少也得让OpenAI处置这个残障。

“若是OpenAI公司酣畅青睐这个问题，它是有办法处置的。”旧金山的不竭工程师威廉·桑德斯本年2月刚刚从OpenAI离职，原因是他对OpenAI的发展见地感到担忧。“若是你把它放在哪里不论，那就有问题了，因为东谈主们太折服它的功能了，而且还把它集成到了整个其他系统上。”

OpenAI的一位发言东谈主示意，该公司一直在不竭若何减少“幻听”表象，并对雄伟不竭东谈主员的发现示意了歌颂。该发言东谈主还示意，OpenAI也曾在模子更新中加入了反映功能。

诚然大大批设立东谈主员皆以为。四肢一种语音转录器具，它出现拼写失实大约其他失实皆属往时，关联词也有工程师和不竭东谈主员示意，他们从未见过其他哪款AI转录器具的“幻听”像Whisper同样多。

Whisper的“幻听”

目下，该器具也曾被集成到ChatGPT的某些版块中，况且被内置于甲骨文和微软云计较平台中，这些平台劳动着各人千千万万的企业。它也会被用来转录和翻译其他语言。

只是是上个月，最新版块的Whisper就在开源AI平台HuggingFace上被下载了420多万次。

该平台的一位名叫桑吉特·甘地的机器学习工程师示意，Whisper是目下最受接待的开源语音识别模子，它也曾被集成到了从招呼中心到语音助理的各式时势中。

康奈尔大学的埃莉森·克内克素质和弗吉尼亚大学的莫娜·斯洛安妮素质开展了一项查验，他们查察了来自卡耐基梅隆大学的TalkBank不竭存储库的数千个音视频片断，限度发现，近40%的“幻听”是无益的，大约是值得眷注的，因为话语者的意念念很可能会被歪曲或歪曲。

比如在一段音频中，话语者说的是：“他，阿谁男孩，他要……我不太细则，可能是要拿雨伞。”

telegram 偷拍

关联词Whisper给出的转录文本却是：“他拿了一个大十字架，一小块……我不太细则，他莫得一把恐怖的刀，是以他杀了许多东谈主。”

还有另一段灌音，话语者刻画了“另外两个女孩和一位女士”。Whisper却“脑补”出了突出的种族主义评价：“……另外两个女孩和一位女士，嗯，她们是黑东谈主。”

在另一段灌音中，Whisper发明了一种不存在的药物，名叫“过度激活抗生素”。

不竭东谈主员也不细则为什么Whisper和近似的一些AI器具会产生“幻听”，但软件设立东谈主员示意，这种“幻听”往往发生在停顿、有布景音大约有音乐的时候。

OpenAI公司对此给出的官方提出是，“不要在决议环境中使用Whisper，因为它在准确性上的残障，有可能导致限度出现彰着残障”。

纪录大夫的预约

诚然OpenAI公司发布了干系劝诫，但如故有不少病院仍在使用包括Whisper在内的语音转笔墨器具，来纪录大夫调治患者时说的话，以减少医护东谈主员记条记或写讲明所破耗的时代。

目下，好意思国有逾越3万名临床大夫和40多家病院，皆在使用Nabla公司设立的基于Whisper的器具，包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院。Nabla公司在法国和好意思国皆设有办公室。

Nabla的首席工夫官马丁·雷森示意，他们设立的版块是基于医学语言的专科版，以转录和追想大夫与患者之间的相易。

该公司的厚爱东谈主示意，他们也曾意志到了Whisper会产生“幻听”，况且正在想方设法处置这个问题。

雷森示意，Nabla无法将AI生成的文本与原始灌音进行比拟，因为Nabla的器具出于“数据安全原因”会删撤除原始音频。

Nabla公司示意，该公司设立的器具也曾纪录了约莫700万次问诊。

前OpenAI公司工程师桑德斯指出，若是文本莫得历程双重查察，大约临床大夫无法查察灌音以考证文本的正确性，那么删掉原始音频是一种令东谈主担忧的作念法。“若是你把原话皆删了，你就找不到失实了。”

Nabla公司则示意，莫得一个模子是无缺的，目下他们的模子条目大夫对文本限度进行快速裁剪和审核，关联词以后这种作念法也可能会有变化。

心事担忧

医患对话属于心事信息，但咱们目下还很难知谈，AI生成的文本对患者的个东谈主隐独到何影响。

加利福尼亚州议员丽贝卡·鲍尔·卡汉示意，本年早些时候，她带着一个孩子去看大夫，限度病院给了她一张表格要她署名，履行是让她承诺向几家公司共享问诊的音频。这几家公司中就包括微软Azure，也等于OpenAI背后的最大投资者运营的云计较平台。她示意，她不但愿这种心事信息被科技公司掌抓。

鲍尔·卡汉是又名民主党东谈主，她在州议会中代表着旧金山郊区的部分地区。她示意：“那份表格很明确地确认了，谋利性公司有权使用这些音频。关联词我说：‘十足不可。’”

约翰缪尔健康中心的发言东谈主本·德鲁指出，该病院一向顺从联邦和该州的干系心事法律。（钞票汉文网）

译者：朴成奎magic_sex5

上一篇：插插插综合网黄圣依难忍杨子冷暴力？网友：往常炫富多高调，如今矫强就多好笑
下一篇：twitter 自慰格林童话故事全集（多篇）