您的位置: 首頁(yè) >科技 >

谷歌的新語(yǔ)音識(shí)別系統(tǒng)可以即時(shí)離線工作

2020-01-04 11:05:41 編輯: 來(lái)源:
導(dǎo)讀 如今,語(yǔ)音識(shí)別是智能手機(jī)包的標(biāo)準(zhǔn)部分,相應(yīng)的一部分是在等待Siri、Alexa或Google返回查詢時(shí)的延遲,要么正確解釋?zhuān)磭?yán)重?fù)p壞。谷歌最新的語(yǔ)音識(shí)別功能完全離線,完全消除了這種

如今,語(yǔ)音識(shí)別是智能手機(jī)包的標(biāo)準(zhǔn)部分,相應(yīng)的一部分是在等待Siri、Alexa或Google返回查詢時(shí)的延遲,要么正確解釋?zhuān)磭?yán)重?fù)p壞。谷歌最新的語(yǔ)音識(shí)別功能完全離線,完全消除了這種延遲——當(dāng)然,糾纏仍然是一種選擇。

延遲的發(fā)生是因?yàn)槟愕穆曇?,或者從它?dǎo)出的一些數(shù)據(jù),必須從你的手機(jī)到任何操作服務(wù)的人的服務(wù)器,在那里它被分析并在很短的時(shí)間后發(fā)送回來(lái)。這可以從一小撮毫秒到多個(gè)整秒的任何地方(真是個(gè)噩夢(mèng)?。?,或者更長(zhǎng)的時(shí)間,如果你的數(shù)據(jù)包在乙醚中丟失了。

為什么不只是在設(shè)備上進(jìn)行語(yǔ)音識(shí)別呢?沒(méi)有什么比這些公司更想要的了,但是將語(yǔ)音轉(zhuǎn)換成毫秒級(jí)的文本需要相當(dāng)大的計(jì)算能力。這不僅僅是聽(tīng)到聲音和寫(xiě)一個(gè)詞-理解一個(gè)人一字一句地說(shuō)什么-涉及到關(guān)于語(yǔ)言和意圖的大量上下文。

你的手機(jī)可以做到,當(dāng)然,但它不會(huì)比發(fā)送到云的速度快得多,它會(huì)耗盡你的電池。但這一領(lǐng)域的穩(wěn)步發(fā)展使得這樣做似乎有道理,谷歌的最新產(chǎn)品讓任何擁有Pixel的人都可以使用。

谷歌在這個(gè)話題上的工作,在這里的一篇論文中記錄了下來(lái),它建立在以前的進(jìn)步的基礎(chǔ)上,創(chuàng)建了一個(gè)小而高效的模型,足以適應(yīng)一部手機(jī)(如果你好奇的話,它是80兆),但能夠聽(tīng)到和轉(zhuǎn)錄你說(shuō)的話。不需要等到你完成了一個(gè)句子才去思考你的意思是“他們的”還是“那里的”-它在飛快地發(fā)現(xiàn)了這一點(diǎn)。

那有什么可抓的?嗯,它只在谷歌的鍵盤(pán)應(yīng)用Gboard中工作,它只在像素上工作,而且它只在美式英語(yǔ)中工作。所以在某種程度上,這只是對(duì)真實(shí)事物的一種壓力測(cè)試。

“鑒于這個(gè)行業(yè)的趨勢(shì),隨著專(zhuān)業(yè)硬件和算法改進(jìn)的融合,我們希望這里介紹的技術(shù)很快能夠以更多的語(yǔ)言和跨更廣泛的應(yīng)用領(lǐng)域采用,”谷歌寫(xiě)道,仿佛這是需要做好本地化努力的趨勢(shì)。

使語(yǔ)音識(shí)別更具響應(yīng)性,并使其離線工作,是一個(gè)很好的發(fā)展。但考慮到谷歌的其他產(chǎn)品幾乎沒(méi)有離線工作,這有點(diǎn)好笑。當(dāng)您脫機(jī)時(shí),您是否要口述到共享文檔中?寫(xiě)封郵件?求升與杯之間的換算??你需要一個(gè)連接!當(dāng)然,這也會(huì)更好的緩慢和斑點(diǎn)的聯(lián)系,但你必須承認(rèn)這是有點(diǎn)諷刺。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。