神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)預(yù)測(cè)臨床訪談中抑郁癥的語(yǔ)言模式

2019-06-11 17:18:10 編輯：來(lái)源：

導(dǎo)讀為了診斷抑郁癥，臨床醫(yī)生采訪患者，詢問具體問題 - 例如，過去的精神疾病，生活方式和情緒 - 并根據(jù)患者的反應(yīng)確定病情。近年來(lái)，機(jī)器

為了診斷抑郁癥，臨床醫(yī)生采訪患者，詢問具體問題 - 例如，過去的精神疾病，生活方式和情緒 - 并根據(jù)患者的反應(yīng)確定病情。

近年來(lái)，機(jī)器學(xué)習(xí)一直被認(rèn)為是診斷的有用輔助手段。例如，已經(jīng)開發(fā)了機(jī)器學(xué)習(xí)模型，其可以檢測(cè)可以指示抑郁的語(yǔ)音的單詞和語(yǔ)調(diào)。但是這些模型傾向于根據(jù)個(gè)人對(duì)特定問題的具體答案來(lái)預(yù)測(cè)一個(gè)人是否沮喪。這些方法是準(zhǔn)確的，但它們依賴于所詢問的問題類型限制了它們的使用方式和位置。

在Interspeech會(huì)議上發(fā)表的一篇論文中，麻省理工學(xué)院的研究人員詳細(xì)介紹了一種神經(jīng)網(wǎng)絡(luò)模型，該模型可以通過采訪發(fā)現(xiàn)原始文本和音頻數(shù)據(jù)，以發(fā)現(xiàn)指示抑郁癥的語(yǔ)音模式。給定一個(gè)新主題，它可以準(zhǔn)確地預(yù)測(cè)個(gè)體是否抑郁，而不需要任何其他有關(guān)問題和答案的信息。

研究人員希望這種方法可以用來(lái)開發(fā)自然對(duì)話中檢測(cè)抑郁跡象的工具。例如，在未來(lái)，該模型可以為移動(dòng)應(yīng)用程序提供支持，以監(jiān)控用戶的文本和語(yǔ)音以進(jìn)行精神痛苦并發(fā)送警報(bào)。由于距離，成本或缺乏對(duì)某些可能出錯(cuò)的認(rèn)識(shí)，這對(duì)于那些無(wú)法前往臨床醫(yī)生進(jìn)行初步診斷的人尤其有用。

第一作者，計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的研究員Tuka Alhanai說(shuō)：“我們首先得到的是一個(gè)人快樂，興奮，悲傷，或者有一些嚴(yán)重的認(rèn)知狀況，例如抑郁癥。” CSAIL)。“如果您想以可擴(kuò)展的方式部署[抑郁檢測(cè)]模型......您希望最大限度地減少對(duì)您正在使用的數(shù)據(jù)的約束數(shù)量。您希望在任何常規(guī)對(duì)話中部署它并讓模型獲取，從自然的互動(dòng)，個(gè)人的狀態(tài)。“

CSAIL的高級(jí)研究科學(xué)家詹姆斯·格拉斯(James Glass)補(bǔ)充說(shuō)，該技術(shù)當(dāng)然可用于識(shí)別臨床辦公室臨時(shí)談話中的精神痛苦。“每個(gè)病人的談話方式都不同，如果模特看到變化可能會(huì)成為醫(yī)生的旗幟，”他說(shuō)。“這是向前邁出的一步，看看我們是否可以做一些幫助臨床醫(yī)生的輔助工作。”

該論文的另一位合著者是醫(yī)學(xué)工程與科學(xué)研究所(IMES)成員Mohammad Ghassemi。

無(wú)上下文建模

該模型的關(guān)鍵創(chuàng)新在于能夠檢測(cè)指示抑郁癥的模式，然后將這些模式映射到新的個(gè)體，而無(wú)需額外的信息。“我們稱之為'無(wú)背景'，因?yàn)槟銢]有對(duì)你正在尋找的問題類型以及對(duì)這些問題的回答類型進(jìn)行任何限制，”Alhanai說(shuō)。

其他模型提供了一組特定的問題，然后舉例說(shuō)明了沒有抑郁癥的人如何做出反應(yīng)以及抑郁癥患者如何做出反應(yīng)的例子 - 例如，直截了當(dāng)?shù)脑儐枺?ldquo;你有抑郁癥病史嗎?” 它使用那些確切的響應(yīng)，然后在被問到完全相同的問題時(shí)確定新個(gè)體是否被壓抑。“但這不是自然對(duì)話的工作方式，”Alhanai說(shuō)。

另一方面，研究人員使用了一種稱為序列建模的技術(shù)，通常用于語(yǔ)音處理。通過這種技術(shù)，他們一個(gè)接一個(gè)地從抑郁和非抑郁個(gè)體的問題和答案中提供文本和音頻數(shù)據(jù)的模型序列。隨著序列的積累，該模型提取了有抑郁癥或沒有抑郁癥的人出現(xiàn)的語(yǔ)音模式。諸如“悲傷”，“低”或“向下”之類的詞語(yǔ)可以與更平坦且更單調(diào)的音頻信號(hào)配對(duì)?；加幸钟舭Y的人也可能說(shuō)話較慢，并且在單詞之間使用較長(zhǎng)的暫停。在以前的研究中已經(jīng)探索了這些用于精神痛苦的文本和音頻標(biāo)識(shí)符。

“該模型可以看到單詞或說(shuō)話風(fēng)格的序列，并確定這些模式更容易在抑郁或抑郁的人身上看到，”Alhanai說(shuō)。“然后，如果它在新科目中看到相同的序列，它可以預(yù)測(cè)他們是否也被壓抑了。”

這種測(cè)序技術(shù)還有助于模型將整個(gè)會(huì)話視為對(duì)話，并注意隨著時(shí)間的推移，患有抑郁癥的人與不患有抑郁癥的人之間的差異。

檢測(cè)抑郁癥

研究人員在來(lái)自遇險(xiǎn)分析訪談?wù)Z料庫(kù)的142個(gè)互動(dòng)數(shù)據(jù)集上訓(xùn)練和測(cè)試了他們的模型，其中包含對(duì)患有精神健康問題的患者和由人類控制的虛擬代理人的音頻，文本和視頻訪談。使用個(gè)人健康問卷調(diào)查，每個(gè)受試者按0到27之間的等級(jí)評(píng)定抑郁。高于中度(10至14)和中度(15至19)之間的截止值的得分被認(rèn)為是抑郁的，而低于該閾值的所有其他得分被認(rèn)為是不抑制的。在數(shù)據(jù)集中的所有主題中，28個(gè)(20%)被標(biāo)記為抑郁。

在實(shí)驗(yàn)中，使用精確度和召回率來(lái)評(píng)估模型。精確測(cè)量由模型識(shí)別的哪些抑郁受試者被診斷為抑郁。Recall測(cè)量模型在檢測(cè)整個(gè)數(shù)據(jù)集中被診斷為抑郁的所有受試者時(shí)的準(zhǔn)確性。在精確度方面，該模型得分為71%，回想起來(lái)得分為83%。考慮到任何錯(cuò)誤，這些指標(biāo)的平均綜合得分為77%。在大多數(shù)測(cè)試中，研究人員的模型幾乎超過了所有其他模型。

Alhanai指出，該研究的一個(gè)關(guān)鍵見解是，在實(shí)驗(yàn)過程中，模型需要更多的數(shù)據(jù)來(lái)預(yù)測(cè)音頻中的抑郁而不是文本。通過文本，模型可以使用平均七個(gè)問答序列準(zhǔn)確地檢測(cè)抑郁癥。通過音頻，該模型需要大約30個(gè)序列。“這意味著人們使用的詞語(yǔ)模式可以預(yù)測(cè)抑郁癥發(fā)生在文本中的時(shí)間跨度比音頻更短，”Alhanai說(shuō)。這些見解可以幫助麻省理工學(xué)院的研究人員和其他人進(jìn)一步完善他們的模型。

格拉斯說(shuō)，這項(xiàng)工作代表了一個(gè)“非常令人鼓舞”的試點(diǎn)。但現(xiàn)在研究人員試圖發(fā)現(xiàn)模型在大量原始數(shù)據(jù)中識(shí)別出哪些特定模式。“現(xiàn)在它有點(diǎn)像黑盒子，”格拉斯說(shuō)。“然而，當(dāng)你對(duì)他們正在采取什么行動(dòng)做出解釋時(shí)，這些系統(tǒng)更加可信。......接下來(lái)的挑戰(zhàn)是找出它抓住的數(shù)據(jù)。”

研究人員還旨在測(cè)試這些方法來(lái)測(cè)試來(lái)自更多具有其他認(rèn)知條件的受試者的額外數(shù)據(jù)，例如癡呆。“這不是檢測(cè)抑郁癥的重要因素，但它是一種類似的評(píng)估概念，從日常的言語(yǔ)信號(hào)中評(píng)估，如果有人有認(rèn)知障礙，”Alhanai說(shuō)。

標(biāo)簽：神經(jīng)網(wǎng)絡(luò)