2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。
隨著我們消費內(nèi)容的方式的增加和變化,媒體創(chuàng)作者很難適應他們的方法來利用。短片音頻和視頻新聞是一個不斷增長但勞動密集型的新興市場 - 而Agolo旨在幫助實現(xiàn)流程自動化,將AP作為客戶和微軟拉入其中, 谷歌和Tensility作為投資者。Agolo是一家專注于自然語言處理的AI創(chuàng)業(yè)公司; 具體來說,如何拍攝一篇很長的文章,比如這篇文章,并將其歸結(jié)為最重要的部分(假設有任何部分)。摘要是流程的名稱,就像您或我這樣做時,其他機器人和服務也是如此。Agolo的主張是能夠快速準確地總結(jié),產(chǎn)生一些質(zhì)量值得廣播或官方文檔的東西。它與AP的交易提供了一個有趣的例子,說明了它是如何工作的,以及為什么它不像選擇一些有代表性的句子那么簡單。
Agolo當然,AP是一個巨大的新聞組織,也是一個快速發(fā)展的組織。但是,它的故事雖然通常是備用的,但很少簡潔,當用戶問“今天早上有什么重大新聞?”時,虛擬助手會大聲朗讀這些故事。因此,AP編輯和作家手動匯總了幾十或幾百個每天故事的簡短版本專門用于音頻消費和其他短片環(huán)境。
因為這不是必然需要創(chuàng)造性輸入的情況,并且必須快速和系統(tǒng)地完成,所以它非常適合受自然語言訓練的AI代理。Agolo聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sage Wohns解釋說,盡管如此,它并不像聽起來那么容易。
“我們有東西讀給我們的方式與我們閱讀它們的方式不同。因此,理解和重現(xiàn)它的算法很重要,“他說。而且這并沒有考慮到AP的著名風格指南。
“這是我們與他們合作的最重要的一點,”Wohns說。“AP有他們的風格圣經(jīng),它是一塊磚。我們有一個混合模型,其中包含針對每個規(guī)則的算法。我們從不想改變語言,但我們可以縮短句子。“
Agolo聽力1
當然,這是算法總結(jié)的風險:在“總結(jié)”一個句子中,你改變了它的含義。這在新聞中非常重要,其中簡單的事實陳述與嚴重錯誤之間的區(qū)別很容易在一個單詞或短語中。所以系統(tǒng)要小心保留意義,如果不一定是準確的措辭。
雖然AP可能不像我一樣給予圓周文件,但轉(zhuǎn)移一些東西可能仍然是有益的。Agolo與新聞機構(gòu)密切合作,找出什么是可以接受的,什么是不可接受的。一個簡單的例子將改變類似“聲明說,”源至該人士稱“聲明”。這不保存任何空間,但你的想法:語言基本上無損壓縮。
如果AP團隊可以信任該算法以產(chǎn)生遵循其規(guī)則并且僅由編輯快速修改的措辭良好的摘要,則他們可以服務甚至增加對短格式內(nèi)容的需求。“我們的目標是讓他們能夠創(chuàng)造出比之前人類更多的內(nèi)容,”Wohns說。
來自Google的投資和合作 雖然不像激光一樣專注于將新聞故事轉(zhuǎn)化為聲音,但它們也沿著這些方向發(fā)展。
“我們與他們合作的是讓網(wǎng)絡可以聽,”Wohns說。“現(xiàn)在你可以向谷歌提出一個問題,但它通常沒有答案可以回復給你。”
它主要是為了擴展公司的助理產(chǎn)品,因為它繼續(xù)與Alexa和Siri的戰(zhàn)斗,但也可能具有非常理想的副作用,使盲人用戶可以更容易地訪問Google索引數(shù)據(jù)。
谷歌數(shù)據(jù)的范圍(Agolo現(xiàn)在可能正在獲得谷歌新聞的全面消息)意味著所使用的AI模型必須輕巧,快速。即使總結(jié)每篇文章只需要10秒鐘,但在全世界排序和顯示新聞的復雜工作中,這會成倍增加數(shù)倍。因此,Agolo一直致力于提高其模型的性能,直到他們能夠快速扭轉(zhuǎn)局面并實現(xiàn)基本上實時的摘要服務。
Agolo研究應用
這在大型企業(yè)和公司中具有二次應用程序,其中存在大量積壓的數(shù)據(jù),如文檔和分析。微軟就是一個很好的例子:經(jīng)過數(shù)十年的巨大軟件和服務帝國的運營,支持文檔,研究,方法等的數(shù)量可能會使其內(nèi)部網(wǎng)絡窒息,搜索在這樣的語料庫中可能會有效,也可能不會有效。
基于NLP的代理對于匯總很有用,但在某種程度上,該過程的一部分是理解內(nèi)容。所以代理人應該能夠生成一個較短版本的東西,但也告訴你它是由這個人(對歸因有用); 這是關于這個話題; 它來自這個日期范圍; 它適用于這些版本號; 其主要發(fā)現(xiàn)是這些; 等等等等。
當然,并非所有這些信息在所有情況下都有用,但肯定的是,如果您想要消化30年的內(nèi)部文檔并能夠有效地搜索和排序。這就是微軟在內(nèi)部使用它,毫無疑問它打算將它作為未來產(chǎn)品或合作伙伴關系的一部分應用。(語義學者對期刊和學術論文采用了類似的方法。)
例如,投資銀行分析師或其他研究人員也可以使用Agolo的時間表按順序匯編所有相關文檔,按作者或主題分組,其中顯著的信息表面和可瀏覽。其中一張圖片對Google新聞有用,也可用于瀏覽特定事件或開發(fā)故事的報道。
新的(未披露的)資金有微軟(特別是M12)返回,谷歌(特別是助理投資集團)和Tensility Venture Partners首次加入?,F(xiàn)金將用于一個不斷增長的創(chuàng)業(yè)公司的預期方式:追逐銷售和一些關鍵雇員。
“這是關于建立進入市場的一面,以及團隊的核心NLP能力,特別是在紐約和開羅,”Wohns說。“現(xiàn)在我們約有90%的技術團隊,所以我們需要建立銷售方面。”
對于許多應用程序來說,Agolo的服務似乎是一個有用的工具 - 您必須將大量書面內(nèi)容減少到較小的數(shù)量。當然這已經(jīng)足夠了 - 但是Agolo需要證明它能夠以非破壞性和準確的方式證明這一點,因為它聲稱具有各種各樣的數(shù)據(jù)集,并且這個過程比經(jīng)過時間考驗的方法更有助于實現(xiàn)底線。雇用另一名實習生或研究生來執(zhí)行苦差事。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權歸原作者所有。