您的位置: 首頁 >商業(yè) >

谷歌使其語音到文本和文本到語音的服務(wù)更加準(zhǔn)確和可訪問

2020-04-05 14:53:43 編輯: 來源:
導(dǎo)讀 谷歌有限責(zé)任公司(GoogleLLC)正努力推動(dòng)其流行的云語音到文本和文本到語音機(jī)器學(xué)習(xí)服務(wù),為兩者增加了新的功能,并使前者更容易為大型企業(yè)所利用。 谷歌云語音到文本本質(zhì)上是一種先進(jìn)的轉(zhuǎn)錄服務(wù),它依賴于機(jī)器學(xué)習(xí)和其他人工智能技術(shù)來提高其準(zhǔn)確性。 這種對(duì)人工智能的依賴是很重要的,因?yàn)槿魏蔚陀?00%的準(zhǔn)確性都會(huì)導(dǎo)致嚴(yán)重的錯(cuò)誤,這使得很難進(jìn)行有用的對(duì)話,谷歌產(chǎn)品經(jīng)理丹·阿哈龍?jiān)诮裉斓牟┛臀恼轮姓f。 但

谷歌有限責(zé)任公司(GoogleLLC)正努力推動(dòng)其流行的云語音到文本和文本到語音機(jī)器學(xué)習(xí)服務(wù),為兩者增加了新的功能,并使前者更容易為大型企業(yè)所利用。

谷歌云語音到文本本質(zhì)上是一種先進(jìn)的轉(zhuǎn)錄服務(wù),它依賴于機(jī)器學(xué)習(xí)和其他人工智能技術(shù)來提高其準(zhǔn)確性。 這種對(duì)人工智能的依賴是很重要的,因?yàn)槿魏蔚陀?00%的準(zhǔn)確性都會(huì)導(dǎo)致嚴(yán)重的錯(cuò)誤,這使得很難進(jìn)行有用的對(duì)話,谷歌產(chǎn)品經(jīng)理丹·阿哈龍?jiān)诮裉斓牟┛臀恼轮姓f。

但谷歌自由承認(rèn),它的語音對(duì)文本并不總是完全準(zhǔn)確的,因?yàn)樵S多使用它的應(yīng)用程序運(yùn)行在“嘈雜”的電話線上,這可能使人們難以準(zhǔn)確解釋他們所說的話。

“在創(chuàng)建智能語音應(yīng)用程序時(shí),語音識(shí)別的準(zhǔn)確性至關(guān)重要,”亞倫說。 “你可以從下面的插圖中看到,即使準(zhǔn)確率達(dá)到90%,也很難有一個(gè)有用的對(duì)話。

為了解釋這一點(diǎn),谷歌去年在beta版推出了一個(gè)高級(jí)版本的語音到文本,供選擇共享使用數(shù)據(jù)的客戶使用,這樣它就可以幫助改進(jìn)其算法。 它們包括一個(gè)增強(qiáng)的電話模型,它產(chǎn)生的轉(zhuǎn)錄錯(cuò)誤比常規(guī)模型少62%,以及一個(gè)對(duì)多個(gè)揚(yáng)聲器的電話會(huì)議有用的視頻模型。

今天,谷歌正在使其高級(jí)模型通??晒┧锌蛻羰褂?,包括那些不想選擇其數(shù)據(jù)記錄程序的客戶。 然而,不選擇加入該項(xiàng)目是有代價(jià)的,因?yàn)槟切┻x擇加入的人將支付33%的服務(wù)。

阿哈龍說:“我們還將優(yōu)質(zhì)視頻模型的定價(jià)下調(diào)了25%,目前選擇數(shù)據(jù)記錄的視頻模型客戶的總節(jié)省了50%。

谷歌還在語音到文本中添加了一個(gè)新功能,稱為“多渠道識(shí)別”,可以更好地區(qū)分對(duì)話中的不同人。

語音到文本的高級(jí)模型已經(jīng)被許多企業(yè)采用,包括LogMe InInc.,該公司使用該服務(wù)在其流行的GoToMe會(huì)議應(yīng)用程序上創(chuàng)建會(huì)議記錄。

谷歌也在更新Text-to-Speech,這正是它的姐妹服務(wù)的對(duì)立面,將書面文本轉(zhuǎn)化為現(xiàn)實(shí)的人類聲音中的人工語音。 這項(xiàng)服務(wù)正在獲得更多由谷歌浪潮網(wǎng)絡(luò)技術(shù)驅(qū)動(dòng)的人工聲音,并以更多的語言提供?!坝捎诠雀柙芓 PU(Tensor Processing UnitAI芯片)提供的浪潮網(wǎng)絡(luò)技術(shù)的獨(dú)特接入,我們可以比行業(yè)中典型的更快、更容易地構(gòu)建新的聲音和語言。

今天采用測(cè)試版的新語言包括丹麥語、挪威語、葡萄牙語、俄語、波蘭語、斯洛伐克語和烏克蘭語。 這意味著文本到語音現(xiàn)在總共支持21種語言。 谷歌還在該服務(wù)中添加了31個(gè)新的人工波網(wǎng)聲音,加上24個(gè)“標(biāo)準(zhǔn)”聲音。

最后,谷歌正在向文本到語音技術(shù)添加一個(gè)新的設(shè)備配置功能,它能夠優(yōu)化不同硬件上的音頻回放?!袄纾恍┚哂泻艚兄行膽?yīng)用程序的客戶優(yōu)化交互式語音響應(yīng),而另一些客戶則專注于耳機(jī)的內(nèi)容和媒體優(yōu)化,”Aharon說。 “在任何情況下,音頻效果都是為硬件定制的。

星座研究公司(Constellation ResearchInc.)分析師霍爾格·穆勒(Holger Mueller)表示,這些更新令人信服,因?yàn)檎Z音作為新的用戶界面迅速出現(xiàn),因此提高準(zhǔn)確性和支持更多語言應(yīng)該受到企業(yè)的歡迎。

穆勒說:“谷歌不斷提供和改進(jìn),現(xiàn)在也為更好的消費(fèi)能力提供了支持。 “正在構(gòu)建語音相關(guān)應(yīng)用程序的CXOs只需將谷歌列入其授權(quán)提供商的入圍名單。

顯示您對(duì)我們的任務(wù)的支持,我們的一鍵訂閱我們的優(yōu)管頻道(下面)。 我們擁有的用戶越多,你就越能向你推薦相關(guān)的企業(yè)和新興技術(shù)內(nèi)容。 謝謝!

支持我們的使命:>;>;>;SUBS CRIBE NOW>;>;>;到我們的優(yōu)管頻道。

我們還想告訴你我們的使命,以及你如何幫助我們完成它。 硅谷媒體公司的商業(yè)模式是基于內(nèi)容的內(nèi)在價(jià)值,而不是廣告。 與許多在線出版物不同,我們沒有付費(fèi)墻或經(jīng)營(yíng)橫幅廣告,因?yàn)槲覀兿M3治覀兊男侣勯_放,沒有影響或需要追逐流量。 硅谷的新聞、報(bào)道和評(píng)論-以及我們硅谷工作室的現(xiàn)場(chǎng)、未經(jīng)剪輯的視頻和CUBE的環(huán)球視頻團(tuán)隊(duì)-需要大量的艱苦工作、時(shí)間和金錢。 保持高質(zhì)量需要贊助商的支持,他們與我們的無廣告新聞內(nèi)容的愿景一致。

如果您喜歡這里的報(bào)道,視頻采訪和其他無廣告內(nèi)容,請(qǐng)花點(diǎn)時(shí)間查看我們的贊助商支持的視頻內(nèi)容樣本,推特您的支持,并繼續(xù)回到硅安格爾。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。