magic_sex5 AI软件“幻听”严重,为何病院皆在用?
Whisper是科技巨头OpenAI新发布的一个自动语音识别系统,OpenAI公司称其具有接近“东谈主类水平的可靠性和准确性”。
关联词据多名软件工程师、设立东谈主员和学术不竭东谈主员反映,Whisper也有一个紧要残障——它或然会编造出一大段笔墨以致是整句。巨匠示意,这些被AI编造出来的笔墨(在业内也被称作幻听),有可能包含种族主义和暴力言论,以致是凭梦联想出来的医学疗法。
巨匠示意,AI的这种“幻听”可不是一个小问题,因为Whisper也曾被天下各地的许多行业用于翻译和转录对话,为一些流行的消耗工夫生成文本,以及为视频创建字幕等等。
更令东谈主担忧的是,一些病院以致诳骗了基于Whisper设立的器具,来纪录医患之间的对话。尽管OpenAI也曾劝诫称,Whisper并不应该被用在“高风险界限”。
要想精确判断这个问题的严重进程,并非一件容易的事。不外据不竭东谈主员和工程师称,他们时时会在责任中遭受Whisper“幻听”的情况。比如,密歇根大学又名不竭东谈主员开展了一项针对公开会议的不竭,他发现他仔细查察过的10个音频转录文本中,有8个皆出现了“幻听”的情况。
一位机器学习工程师也示意,在他分析的100多个小时的Whisper转录文本中,他发现存一半皆存在“幻听”。一位第三方设立者示意,在他用Whisper编写的2.6万份文本中,每乎每一份皆在“幻听”问题。
即使在那些录制细腻的短音频样本中,问题也仍然存在。有计较机科学家在最近的一项不竭中查察了13000多份明晰音频片断的转录文本,限度发现了187处“幻听”。
不竭东谈主员示意,若是是这么的话,那么在几百万份语音转录文本中,至少会出现几万份转录失实。
拜登政府的前白宫科技战略办公室主任阿隆德拉·尼尔森指出,这种失实可能会导致“很是严重的效果”,终点是在医疗场景中。
尼尔森目下是新泽西州的普林斯顿高等不竭所的又名素质。他示意:“莫得东谈主但愿我方被误诊,在这方面应该有更高的圭臬。”
Whisper还被用于为聋哑东谈主和听障东谈主士制作字幕。加劳德大学工夫取得技俩厚爱东谈主克里斯蒂安·沃格勒指出,若是这些字幕转录失实的话,对聋东谈主和听障东谈主士的影响显明是愈加严重的,因为他们根底无法识别“避讳在整个这些笔墨中的演叨履行。” 沃格勒我方等于又名聋东谈主。
各方敦促OpenAI尽快处置问题
由于AI“幻听”的问题非往往见,不少巨匠以致包括前OpenAI公司的职工皆在号令联邦政府商酌制定干系监管战略。至少也得让OpenAI处置这个残障。
“若是OpenAI公司酣畅青睐这个问题,它是有办法处置的。”旧金山的不竭工程师威廉·桑德斯本年2月刚刚从OpenAI离职,原因是他对OpenAI的发展见地感到担忧。“若是你把它放在哪里不论,那就有问题了,因为东谈主们太折服它的功能了,而且还把它集成到了整个其他系统上。”
OpenAI的一位发言东谈主示意,该公司一直在不竭若何减少“幻听”表象,并对雄伟不竭东谈主员的发现示意了歌颂。该发言东谈主还示意,OpenAI也曾在模子更新中加入了反映功能。
诚然大大批设立东谈主员皆以为。四肢一种语音转录器具,它出现拼写失实大约其他失实皆属往时,关联词也有工程师和不竭东谈主员示意,他们从未见过其他哪款AI转录器具的“幻听”像Whisper同样多。
Whisper的“幻听”
目下,该器具也曾被集成到ChatGPT的某些版块中,况且被内置于甲骨文和微软云计较平台中,这些平台劳动着各人千千万万的企业。它也会被用来转录和翻译其他语言。
只是是上个月,最新版块的Whisper就在开源AI平台HuggingFace上被下载了420多万次。
该平台的一位名叫桑吉特·甘地的机器学习工程师示意,Whisper是目下最受接待的开源语音识别模子,它也曾被集成到了从招呼中心到语音助理的各式时势中。
康奈尔大学的埃莉森·克内克素质和弗吉尼亚大学的莫娜·斯洛安妮素质开展了一项查验,他们查察了来自卡耐基梅隆大学的TalkBank不竭存储库的数千个音视频片断,限度发现,近40%的“幻听”是无益的,大约是值得眷注的,因为话语者的意念念很可能会被歪曲或歪曲。
比如在一段音频中,话语者说的是:“他,阿谁男孩,他要……我不太细则,可能是要拿雨伞。”
telegram 偷拍关联词Whisper给出的转录文本却是:“他拿了一个大十字架,一小块……我不太细则,他莫得一把恐怖的刀,是以他杀了许多东谈主。”
还有另一段灌音,话语者刻画了“另外两个女孩和一位女士”。Whisper却“脑补”出了突出的种族主义评价:“……另外两个女孩和一位女士,嗯,她们是黑东谈主。”
在另一段灌音中,Whisper发明了一种不存在的药物,名叫“过度激活抗生素”。
不竭东谈主员也不细则为什么Whisper和近似的一些AI器具会产生“幻听”,但软件设立东谈主员示意,这种“幻听”往往发生在停顿、有布景音大约有音乐的时候。
OpenAI公司对此给出的官方提出是,“不要在决议环境中使用Whisper,因为它在准确性上的残障,有可能导致限度出现彰着残障”。
纪录大夫的预约
诚然OpenAI公司发布了干系劝诫,但如故有不少病院仍在使用包括Whisper在内的语音转笔墨器具,来纪录大夫调治患者时说的话,以减少医护东谈主员记条记或写讲明所破耗的时代。
目下,好意思国有逾越3万名临床大夫和40多家病院,皆在使用Nabla公司设立的基于Whisper的器具,包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院。Nabla公司在法国和好意思国皆设有办公室。
Nabla的首席工夫官马丁·雷森示意,他们设立的版块是基于医学语言的专科版,以转录和追想大夫与患者之间的相易。
该公司的厚爱东谈主示意,他们也曾意志到了Whisper会产生“幻听”,况且正在想方设法处置这个问题。
雷森示意,Nabla无法将AI生成的文本与原始灌音进行比拟,因为Nabla的器具出于“数据安全原因”会删撤除原始音频。
Nabla公司示意,该公司设立的器具也曾纪录了约莫700万次问诊。
前OpenAI公司工程师桑德斯指出,若是文本莫得历程双重查察,大约临床大夫无法查察灌音以考证文本的正确性,那么删掉原始音频是一种令东谈主担忧的作念法。“若是你把原话皆删了,你就找不到失实了。”
Nabla公司则示意,莫得一个模子是无缺的,目下他们的模子条目大夫对文本限度进行快速裁剪和审核,关联词以后这种作念法也可能会有变化。
心事担忧
医患对话属于心事信息,但咱们目下还很难知谈,AI生成的文本对患者的个东谈主隐独到何影响。
加利福尼亚州议员丽贝卡·鲍尔·卡汉示意,本年早些时候,她带着一个孩子去看大夫,限度病院给了她一张表格要她署名,履行是让她承诺向几家公司共享问诊的音频。这几家公司中就包括微软Azure,也等于OpenAI背后的最大投资者运营的云计较平台。她示意,她不但愿这种心事信息被科技公司掌抓。
鲍尔·卡汉是又名民主党东谈主,她在州议会中代表着旧金山郊区的部分地区。她示意:“那份表格很明确地确认了,谋利性公司有权使用这些音频。关联词我说:‘十足不可。’”
约翰缪尔健康中心的发言东谈主本·德鲁指出,该病院一向顺从联邦和该州的干系心事法律。(钞票汉文网)
译者:朴成奎magic_sex5