2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
人工智能系統(tǒng)和機器學習算法最近受到了抨擊,因為他們可以根據(jù)他們編程的數(shù)據(jù)來挑選和加強我們社會中現(xiàn)有的偏見。
但是斯坦福大學的一個跨學科小組在4月3日發(fā)表的新的“美國國家科學院院刊”上發(fā)表了這一問題。
研究人員使用詞嵌入 - 一種能夠映射詞語之間關(guān)系和關(guān)聯(lián)的算法技術(shù) - 來衡量美國過去一個世紀的性別和種族刻板印象的變化。他們分析了美國書籍,報紙和其他文本的大型數(shù)據(jù)庫,并研究了這些語言變化如何與實際的美國人口普查人口統(tǒng)計數(shù)據(jù)和主要的社會變化相關(guān)聯(lián),例如20世紀60年代的女性運動和亞洲移民的增加。
“Word嵌入可用作顯微鏡來研究我們社會中刻板印象的歷史變化,”生物醫(yī)學數(shù)據(jù)科學助理教授James Zou說。“我們之前的研究表明,嵌入有效地捕獲了現(xiàn)有的刻板印象,并且可以系統(tǒng)地去除這些偏見。但我們認為,我們也可以使用嵌入作為偏見的定量,語言和社會學分析的歷史鏡頭,而不是去除那些刻板印象。 “。
Zou與歷史學家Londa Schiebinger,語言學和計算機科學教授Dan Jurafsky以及電子工程研究生Nikhil Garg共同撰寫了該論文,他是第一作者。
“這種類型的研究為我們打開了各種各樣的大門,”Schiebinger說。“它提供了一個新的證據(jù)水平,使人文學者能夠以前所未有的規(guī)模追蹤關(guān)于刻板印象和偏見的演變的問題。”
單詞的幾何形狀
單詞嵌入是在文本集合上使用或訓練的算法。然后,算法為每個單詞分配幾何向量,將每個單詞表示為空間中的一個點。該技術(shù)使用此空間中的位置來捕獲源文本中的單詞之間的關(guān)聯(lián)。
“嵌入是一種強大的語言工具,用于衡量詞義的微妙方面,例如偏見,”Jurafsky說。
接受“光榮”這個詞。使用嵌入工具,之前的研究發(fā)現(xiàn),形容詞與“男人”這個詞的關(guān)系比“女人”更接近。
在其新的研究中,斯坦福大學的團隊使用嵌入來識別從1900年到現(xiàn)在十年間偏向于女性和特定種族群體的特定職業(yè)和形容詞。研究人員對報紙數(shù)據(jù)庫中的這些嵌入進行了培訓,并使用了以前由斯坦福大學計算機科學研究生Will Hamilton培訓的其他大型文本數(shù)據(jù)集,例如美國圖書的Google Books語料庫,其中包含了20世紀20年代和21日發(fā)表的1300多億字。幾個世紀。
研究人員將這些嵌入發(fā)現(xiàn)的偏差與1900年至今的美國人口普查數(shù)據(jù)中的人口變化進行了比較。
改變陳規(guī)定型觀念
研究結(jié)果顯示,在20世紀,人們對亞洲人和其他種族群體的性別描寫和偏見發(fā)生了可量化的變化。
出現(xiàn)的一個重要發(fā)現(xiàn)是,隨著時間的推移,對女性的偏見在某種程度上變得更好。
例如,諸如“聰明”,“邏輯”和“體貼”等形容詞在20世紀上半葉與男性更多地聯(lián)系在一起。但是自20世紀60年代以來,隨著時間的推移,這些詞語越來越多地與隨后十年的女性聯(lián)系在一起,這與20世紀60年代的女性運動有關(guān),盡管差距仍然存在。
該研究還表明,對亞洲人和亞裔美國人的刻板印象發(fā)生了巨大變化。
例如,在20世紀10年代,像“野蠻”,“怪異”和“殘忍”這樣的詞是與亞洲姓氏最相關(guān)的形容詞。到了20世紀90年代,這些形容詞被“抑制”,“被動”和“敏感”等詞語所取代。研究人員表示,這種語言變化與20世紀60年代和80年代亞洲移民對美國的急劇增加以及文化刻板印象的變化有關(guān)。
“刻板印象變化的嚴峻性對我來說很突出,”加格說。“當你研究歷史時,你會了解宣傳活動和外國群體的這些過時觀點。但當時的文學作品反映了這些刻板印象的難以理解的程度。”
總體而言,研究人員證明,嵌入一詞的變化與美國人口普查測量的人口變化密切相關(guān)。
卓有成效的合作
研究人員說,這項新研究闡明了人文科學與科學之間跨學科團隊合作的價值。
Schiebinger說,在她閱讀了之前關(guān)于減少機器學習算法的工作之后,她向2016年加入斯坦福的Zou伸出了援手。
“這導致了一次非常有趣和富有成效的合作,”Schiebinger說,并補充說該小組的成員正在一起進行進一步的研究。
“它強調(diào)了人文主義者和計算機科學家一起工作的重要性。人文科學研究中這些新的機器學習方法有能力被人們理解,”她說。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。