国产情色 AI软件“幻听”严重,为何病院皆在用?
国产情色
Whisper是科技巨头OpenAI新发布的一个自动语音识别系统,OpenAI公司称其具有接近“东说念主类水平的可靠性和准确性”。
关联词据多名软件工程师、设立东说念主员和学术照管东说念主员反应,Whisper也有一个枢纽颓势——它恐怕会编造出一大段翰墨致使是整句。众人示意,这些被AI虚构出来的翰墨(在业内也被称作幻听),有可能包含种族见识和暴力言论,致使是虚拟思象出来的医学疗法。
众人示意,AI的这种“幻听”可不是一个小问题,因为Whisper照旧被天下各地的许多行业用于翻译和转录对话,为一些流行的破钞时代生成文本,以及为视频创建字幕等等。
更令东说念主担忧的是,一些病院致使愚弄了基于Whisper设立的器具,来记载医患之间的对话。尽管OpenAI照旧劝诫称,Whisper并不应该被用在“高风险规模”。
要思精确判断这个问题的严重进程,并非一件容易的事。不外据照管东说念主员和工程师称,他们频频会在职责中碰到Whisper“幻听”的情况。比如,密歇根大学别称照管东说念主员开展了一项针对公开会议的照管,他发现他仔细稽查过的10个音频转录文本中,有8个皆出现了“幻听”的情况。
一位机器学习工程师也示意,在他分析的100多个小时的Whisper转录文本中,他发现存一半皆存在“幻听”。一位第三方设立者示意,在他用Whisper编写的2.6万份文本中,每乎每一份皆在“幻听”问题。
即使在那些录制精良的短音频样本中,问题也仍然存在。有贪图机科学家在最近的一项照管中稽查了13000多份廓清音频片断的转录文本,规矩发现了187处“幻听”。
照管东说念主员示意,淌若是这么的话,那么在几百万份语音转录文本中,至少会出现几万份转录诞妄。
拜登政府的前白宫科技战略办公室主任阿隆德拉·尼尔森指出,这种诞妄可能会导致“止境严重的恶果”,特等是在医疗场景中。
尼尔森当今是新泽西州的普林斯顿高等照管所的别称素养。他示意:“莫得东说念主但愿我方被误诊,在这方面应该有更高的圭臬。”
Whisper还被用于为聋哑东说念主和听障东说念主士制作字幕。加劳德大学时代获得名堂肃肃东说念主克里斯蒂安·沃格勒指出,淌若这些字幕转录诞妄的话,对聋东说念主和听障东说念主士的影响显著是愈加严重的,因为他们根底无法识别“瞒哄在系数这些翰墨中的作假践诺。” 沃格勒我方即是别称聋东说念主。
各方敦促OpenAI尽快惩处问题
由于AI“幻听”的问题非频频见,不少众人致使包括前OpenAI公司的职工皆在敕令联邦政府议论制定相干监管战略。至少也得让OpenAI惩处这个颓势。
“淌若OpenAI公司欢快嗜好这个问题,它是有办法惩处的。”旧金山的照管工程师威廉·桑德斯本年2月刚刚从OpenAI去职,原因是他对OpenAI的发展场合感到担忧。“淌若你把它放在何处无论,那就有问题了,因为东说念主们太确信它的功能了,而且还把它集成到了系数其他系统上。”
OpenAI的一位发言东说念主示意,该公司一直在照管若何减少“幻听”惬心,并对巨大照管东说念主员的发现示意了赞誉。该发言东说念主还示意,OpenAI照旧在模子更新中加入了反应功能。
天然大大皆设立东说念主员皆合计。看成一种语音转录器具,它出现拼写诞妄好像其他诞妄皆属平日,关联词也有工程师和照管东说念主员示意,他们从未见过其他哪款AI转录器具的“幻听”像Whisper同样多。
Whisper的“幻听”
咫尺,该器具照旧被集成到ChatGPT的某些版块中,况且被内置于甲骨文和微软云贪图平台中,这些平台工作着大众千千万万的企业。它也会被用来转录和翻译其他语言。
只是是上个月,最新版块的Whisper就在开源AI平台HuggingFace上被下载了420多万次。
该平台的一位名叫桑吉特·甘地的机器学习工程师示意,Whisper是咫尺最受见谅的开源语音识别模子,它照旧被集成到了从招呼中心到语音助理的多样措施中。
康奈尔大学的埃莉森·克内克素养和弗吉尼亚大学的莫娜·斯洛安妮素养开展了一项稽查,他们稽查了来自卡耐基梅隆大学的TalkBank照管存储库的数千个音视频片断,规矩发现,近40%的“幻听”是无益的,好像是值得眷注的,因为话语者的真谛很可能会被诬蔑或歪曲。
比如在一段音频中,话语者说的是:“他,阿谁男孩,他要……我不太笃定,可能是要拿雨伞。”
关联词Whisper给出的转录文本却是:“他拿了一个大十字架,一小块……我不太笃定,他莫得一把恐怖的刀,是以他杀了许多东说念主。”
还有另一段灌音,话语者描述了“另外两个女孩和一位女士”。Whisper却“脑补”出了特地的种族见识评价:“……另外两个女孩和一位女士,嗯,她们是黑东说念主。”
在另一段灌音中,Whisper发明了一种不存在的药物,名叫“过度激活抗生素”。
照管东说念主员也不笃定为什么Whisper和近似的一些AI器具会产生“幻听”,但软件设立东说念主员示意,这种“幻听”时时发生在停顿、有配景音好像有音乐的时候。
OpenAI公司对此给出的官方提出是,“不要在方案环境中使用Whisper,因为它在准确性上的颓势,有可能导致规矩出现显著颓势”。
记载大夫的预约
天然OpenAI公司发布了相干劝诫,但照旧有不少病院仍在使用包括Whisper在内的语音转翰墨器具,来记载大夫援手患者时说的话,以减少医护东说念主员记条记或写文告所破耗的时候。
咫尺,好意思国有突出3万名临床大夫和40多家病院,皆在使用Nabla公司设立的基于Whisper的器具,包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院。Nabla公司在法国和好意思国皆设有办公室。
Nabla的首席时代官马丁·雷森示意,他们设立的版块是基于医学语言的专科版,以转录和追溯大夫与患者之间的沟通。
该公司的肃肃东说念主示意,他们照旧顽强到了Whisper会产生“幻听”,况且正在思方设法惩处这个问题。
雷森示意,Nabla无法将AI生成的文本与原始灌音进行比拟,因为Nabla的器具出于“数据安全原因”会删撤退原始音频。
Nabla公司示意,该公司设立的器具照旧记载了圣洁700万次问诊。
前OpenAI公司工程师桑德斯指出,淌若文本莫得流程双重稽查,好像临床大夫无法稽查灌音以考据文本的正确性,那么删掉原始音频是一种令东说念主担忧的作念法。“淌若你把原话皆删了,你就找不到诞妄了。”
telegram 文爱Nabla公司则示意,莫得一个模子是完好的,咫尺他们的模子条目大夫对文本规矩进行快速裁剪和审核,关联词以后这种作念法也可能会有变化。
狡饰担忧
医患对话属于狡饰信息,但咱们咫尺还很难知说念,AI生成的文本对患者的个东说念主隐特有何影响。
加利福尼亚州议员丽贝卡·鲍尔·卡汉示意,本年早些时候,她带着一个孩子去看大夫,规矩病院给了她一张表格要她署名,践诺是让她容许向几家公司共享问诊的音频。这几家公司中就包括微软Azure,也即是OpenAI背后的最大投资者运营的云贪图平台。她示意,她不但愿这种狡饰信息被科技公司掌合手。
鲍尔·卡汉是别称民主党东说念主,她在州议会中代表着旧金山郊区的部分地区。她示意:“那份表格很明确地讲明了,渔利性公司有权使用这些音频。关联词我说:‘全皆不可。’”
约翰缪尔健康中心的发言东说念主本·德鲁指出,该病院一向遵照联邦和该州的相干狡饰法律。(钞票汉文网)
译者:朴成奎国产情色