2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
研究人員在訓(xùn)練計算機(jī)時遇到的一個令人頭疼的問題是試圖理解當(dāng)人使用諷刺和諷刺時人類真正意味著什么。(太棒了,火車卡住。令人震驚的消息,我們的女兒遲到了??赡艹霈F(xiàn)什么問題。高峰時段交通,有趣,有趣。)
一個項目可能會有一個良好的開端。8月3日,麻省理工學(xué)院媒體實驗室發(fā)布了一段名為DeepMoji的視頻。這是一個模型,使用數(shù)百萬條推文來學(xué)習(xí)文本中的情感概念,如諷刺和諷刺。
人們在寫作時真正的意思是什么?簡單的問題,研究人員更了解; 訓(xùn)練計算機(jī)時這是一個難題。DeepMoji的研究人員正在轉(zhuǎn)向使用表情符號圖標(biāo)來理解諷刺。怎么樣?使用最先進(jìn)的算法 - 以及數(shù)百萬條消息。
DeepMoji項目頁面指出“我們要求機(jī)器從實際文本的許多示例中學(xué)習(xí),而不是明確地告訴機(jī)器如何識別情感。”
他們擁有的數(shù)據(jù)越多,他們就越能解決這個問題。
MIT技術(shù)評論:
“該算法使用深度學(xué)習(xí),這是一種流行的機(jī)器學(xué)習(xí)技術(shù),它依賴于訓(xùn)練一個非常大的模擬神經(jīng)網(wǎng)絡(luò)來識別使用大量數(shù)據(jù)的細(xì)微模式。訓(xùn)練這種算法的秘訣在于許多推文已經(jīng)使用類似標(biāo)簽的東西系統(tǒng)情感內(nèi)容:繪文字 “。該報告稱,研究人員收集了550億條推文,并選擇了12億條含有64種流行表情符號的組合。
如果他們的項目方法是跨越到現(xiàn)實世界的應(yīng)用程序,那么會想到許多實際用途??梢愿玫乩斫馍缃幻襟w的評論,包括表明欺凌和種族主義的言論。
此外,項目頁面說:“經(jīng)典用例是希望了解客戶對他們的看法的公司。但是現(xiàn)在還有許多其他用例,自然語言處理(NLP)正在成為一個越來越重要的部分例如,所有新的聊天機(jī)器人服務(wù)可能會受益于對文本中情感內(nèi)容的細(xì)致理解。最后,它可以用于各種有趣的研究目的。“
麻省理工學(xué)院媒體實驗室媒體藝術(shù)與科學(xué)副教授Iyad Rahwan與他的一名學(xué)生Bjarke Felbo一起開發(fā)了算法。
從更大的角度來看,費(fèi)爾博評估了這項工作可能為情緒分析帶來了什么。在8月3日的帖子中,“我們可以從Emojis學(xué)到什么?” 費(fèi)爾博寫道,“這項研究只是向更復(fù)雜的情緒分析邁出了一小步。” 例如,該領(lǐng)域的一個貢獻(xiàn)可能是“一個適當(dāng)?shù)幕鶞?zhǔn)數(shù)據(jù)集,其標(biāo)簽比正面/負(fù)面更細(xì)致?;鶞?zhǔn)驅(qū)動ML研究,因此這是至關(guān)重要的。”
下一步是什么?
Rahwan和Felbo“計劃發(fā)布算法的代碼,以便其他研究人員可以使用它,”BBC說。
一些BBC網(wǎng)站訪問者對新聞的娛樂反應(yīng)已經(jīng)反映了emjoji的談話。一個評論是“三個保齡球和一棵棕櫚樹。”
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。