Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見

2022-08-19 02:15:21 編輯：皇甫馨群來源：

導(dǎo)讀小編發(fā)現(xiàn)不少朋友對(duì)于Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見這方面的信息都比較感興趣，小編就針對(duì) Siri與...

小編發(fā)現(xiàn)不少朋友對(duì)于Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見這方面的信息都比較感興趣，小編就針對(duì) Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見整理了一些相關(guān)方面的信息在這里分享給大家。

一項(xiàng)新的研究發(fā)現(xiàn)，來自大型科??技公司的語音識(shí)別系統(tǒng)很難理解黑人所說的單詞，而很難理解。

這些類型的系統(tǒng)通常用于數(shù)字助理(如Siri)以及諸如隱藏式字幕和免提控件之類的工具。但是，與任何機(jī)器學(xué)習(xí)系統(tǒng)一樣，其準(zhǔn)確性僅與數(shù)據(jù)集一樣好。

斯坦福大學(xué)在《科學(xué)院院刊》上發(fā)表的一項(xiàng)研究顯示，由蘋果，谷歌和Facebook等公司開發(fā)的自動(dòng)語音識(shí)別(ASR)系統(tǒng)在抄錄非裔人的語音時(shí)，出錯(cuò)率往往高于。

研究人員進(jìn)行了115次人工轉(zhuǎn)錄訪談，并將其與語音識(shí)別工具進(jìn)行的訪談進(jìn)行了比較。在這些對(duì)話中，有73次與黑人演講者進(jìn)行對(duì)話，而42次與演講者進(jìn)行對(duì)話。

研究小組發(fā)現(xiàn)，ASR系統(tǒng)轉(zhuǎn)錄黑色語音時(shí)，“平均單詞錯(cuò)誤率”幾乎翻了一番(35%)，而轉(zhuǎn)錄白色語音時(shí)為19%。

為了排除詞匯和方言的差異，研究人員還按性別和年齡匹配了語音，并讓講者說出相同的單詞。即使這樣，他們發(fā)現(xiàn)黑色揚(yáng)聲器的錯(cuò)誤率幾乎是白色揚(yáng)聲器的兩倍。

“鑒于短語本身具有相同的文本，這些結(jié)果表明，ASR表現(xiàn)中的種族差異與和黑人講話者的發(fā)音和韻律差異有關(guān)，包括節(jié)奏，音調(diào)，音節(jié)重音，元音持續(xù)時(shí)間和韻律差異。”研究讀。

盡管男性和女性之間存在相似的差異，但非裔人男性的錯(cuò)誤率往往高于女性。對(duì)于大量使用非裔白話英語(AAVE)的演講者來說，準(zhǔn)確性是最差的。

當(dāng)然，機(jī)器學(xué)習(xí)系統(tǒng)不能像人們一樣受到偏見。但是，如果他們所訓(xùn)練的數(shù)據(jù)缺乏多樣性，那么它們的準(zhǔn)確性和性能將得到體現(xiàn)。該研究得出的結(jié)論是，主要問題似乎是在訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)缺少來自黑揚(yáng)聲器的音頻數(shù)據(jù)。

值得注意的是，研究人員使用了這是一款利用Apple免費(fèi)語音識(shí)別技術(shù)定制設(shè)計(jì)的iOS應(yīng)用，尚不清楚Siri是否使用該精確的機(jī)器學(xué)習(xí)模型。該測試也在去年春季進(jìn)行，因此此后該模型可能已更改。

雖然研究專門針對(duì)黑白揚(yáng)聲器，但數(shù)字助理也很難理解其他口音。《華盛頓郵報(bào)》

(The Washington Post) 在 2018年發(fā)表的一篇報(bào)道發(fā)現(xiàn)，像Alexa或Google Assistant這樣的數(shù)字助理很難理解具有各種口音的人。通常，對(duì)大多數(shù)科技巨頭所在的西海岸的演講者最了解。

而且在2019年，聯(lián)邦研究人員還發(fā)現(xiàn)了種族偏見的廣泛證據(jù) 在將近200種面部識(shí)別算法中，缺乏數(shù)據(jù)集的多樣性會(huì)在所有類型的機(jī)器學(xué)習(xí)平臺(tái)中引起類似的問題。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！