您的位置: 首頁 >互聯(lián)網(wǎng) >

維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實現(xiàn)了大規(guī)模

2019-06-06 17:03:53 編輯: 來源:
導(dǎo)讀 維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實現(xiàn)了大規(guī)模,開放的協(xié)作。但是,與許多協(xié)作式寫作項目一樣,制作內(nèi)容可能是一個有爭議的主題

維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實現(xiàn)了大規(guī)模,開放的協(xié)作。但是,與許多協(xié)作式寫作項目一樣,制作內(nèi)容可能是一個有爭議的主題。

通常,多個維基百科編輯會對文章或政策的某些更改意見不一致。正式解決此類爭議的主要方式之一是征求意見(RfC)流程。爭吵的編輯將在一個論壇上宣傳他們的討論,其他維基百科編輯將會在這個論壇上發(fā)表意見,一位中立的編輯將做出最終決定。

理想情況下,這應(yīng)解決所有問題。但麻省理工學(xué)院研究人員進(jìn)行的一項新研究發(fā)現(xiàn),虛弱的因素 - 例如過度爭吵和措辭不合理 - 導(dǎo)致大約三分之一的RfC未得到解決。

在這項研究中,研究人員編制并分析了有史以來第一次全面的RfC對話數(shù)據(jù)集,這些數(shù)據(jù)集是在8年時間內(nèi)完成的,并對經(jīng)常關(guān)閉RfC的編輯進(jìn)行了訪談,以了解為什么他們找不到解決方案。他們還開發(fā)了一種機器學(xué)習(xí)模型,利用該數(shù)據(jù)集來預(yù)測RfC何時可能過時。而且,他們推薦的數(shù)字工具可以使審議和解決更加有效。

麻省理工學(xué)院計算機科學(xué)與人工智能實驗室(CSAIL)的博士候選人Amy X. Zhang表示:“令人驚訝的是,有三分之一的討論沒有結(jié)束。”該論文的共同作者正在提交論文。本周的計算機支持的合作工作和社會計算ACM會議。“在維基百科上,每個人都是志愿者。人們正在投入工作,他們有興趣...編輯可能正在等待某人關(guān)閉,以便他們可以回到編輯。我們知道,通過討論,閱讀工作并且解決一個大的審議很難,特別是來回和爭議。[我們希望]幫助那個人做那項工作。“

該論文的共同作者是:第一作者Jane Im,密歇根大學(xué)信息學(xué)院的研究生; 維基媒體基金會的Christopher J. Schilling; 和David Karger,計算機科學(xué)教授和CSAIL研究員。

(不)找到封閉

維基百科提供了幾個解決編輯糾紛的渠道,其中包括兩位編輯解決他們的問題,將想法投入社區(qū)的簡單多數(shù)投票,或?qū)⑥q論帶到一個主持人小組。之前的一些維基百科研究已經(jīng)深入研究了這些渠道以及貢獻(xiàn)者之間來回的“編輯戰(zhàn)爭”。“但是RfC很有意思,因為投票心態(tài)要少得多,”張說。“通過其他流程,在一天結(jié)束時,你會投票,看看會發(fā)生什么。[RfC參與者]有時會投票,但更多的是找到共識。重要的是在討論中實際發(fā)生了什么。”

要提交RfC,編輯會根據(jù)文章基本“對話”頁面中未解決的內(nèi)容爭議起草模板提案,并邀請更廣泛的社群發(fā)表評論。提案的范圍廣泛,從對名人背景信息的微小分歧到維基百科政策的變化。任何編輯都可以發(fā)起RfC,任何編輯 - 通常是更有經(jīng)驗的編輯 - 他們沒有參與討論并且被認(rèn)為是中立的,可能會結(jié)束討論。30天后,機器人會自動刪除RfC模板,無論是否有分辨率。由于參與者的壓倒性協(xié)議,RfC可以通過近距離的正式結(jié)束,非正式地結(jié)束,或者保持陳舊,意味著在沒有解決的情況下刪除。

在他們的研究中,研究人員編制了一個數(shù)據(jù)庫,該數(shù)據(jù)庫包括2011年至2017年英語維基百科的約7,000次RfC對話,其中包括結(jié)束語,作者帳戶信息和一般回復(fù)結(jié)構(gòu)。他們還對維基百科最常見的10個關(guān)閉者進(jìn)行了訪談,以便在解決爭議時更好地了解他們的動機和注意事項。

分析數(shù)據(jù)集后,研究人員發(fā)現(xiàn)大約57%的RfC正式關(guān)閉。在剩余的43%中,78%(或大約2,300)在沒有非正式解決方案的情況下仍處于陳舊狀態(tài) - 或者在研究的所有RfC中約占33%。結(jié)合數(shù)據(jù)集分析和訪談,研究人員隨后充實了解決失敗的主要原因。主要問題包括初步論點不清晰,發(fā)起人不清楚問題或撰寫故意偏見的提案; 在討論過程中過度爭吵導(dǎo)致更復(fù)雜,更長,更具爭議性的線索,難以全面審查; 并且簡單地缺乏第三方編輯的興趣,因為主題可能過于深奧,以及其他因素。

有用的工具

然后,該團(tuán)隊開發(fā)了一種機器學(xué)習(xí)模型,通過分析文本,維基百科頁面和編輯器帳戶信息的60多個特征來預(yù)測給定的RfC是關(guān)閉(正式還是非正式)還是過時。在討論開始后的一周內(nèi),該模型可以準(zhǔn)確地預(yù)測失敗或成功率達(dá)到75%。他們發(fā)現(xiàn),預(yù)測的一些更具信息性的特征包括討論的長度,參與者和回復(fù)的數(shù)量,文章的修訂次數(shù),主題的受歡迎程度和興趣,討論參與者的經(jīng)驗以及粗俗程度,否定性和評論中的一般侵略性。

有一天,RfC發(fā)起人可以使用該模型來監(jiān)控正在展開的討論。“我們認(rèn)為編輯們知道如何針對他們的干預(yù)措施可能是有用的,”張說。“他們可以將[RfC]發(fā)布到更多[維基百科論壇]或邀請更多人,如果它看起來有可能無法解決。”

研究人員建議維基百科可以開發(fā)工具來幫助關(guān)閉者組織冗長的討論,在一個線程中標(biāo)記有說服力的論點和意見變化,并鼓勵合作關(guān)閉RfC。

將來,模型和提議的工具可能會用于涉及大規(guī)模討論和審議的其他社區(qū)平臺。張指向在線城市和社區(qū)規(guī)劃論壇,公民在這些論壇上對提案進(jìn)行權(quán)衡。“人們正在討論[提案]并對其進(jìn)行投票,因此這些工具可以幫助社區(qū)更好地理解討論......并且[也]對提案的實施者也有用。”

張,我和其他研究人員現(xiàn)在已經(jīng)為各級專家編輯建立了一個外部網(wǎng)站,可以相互學(xué)習(xí),更輕松地監(jiān)控和結(jié)束討論。“更接近的工作非常艱難,”張說,“所以人們?nèi)狈﹃P(guān)閉這些討論的人,尤其是困難,更長,更重要的討論。這可能有助于減少進(jìn)入的障礙[讓編輯成為閉門者] ]并幫助他們合作關(guān)閉RfCs。“

“雖然令人驚訝的是,這些討論中有三分之一從未得到解決,但更重要的是討論未能完成的重要原因,最有趣的結(jié)論來自于定性分析,”教授羅伯特·克勞特說。卡內(nèi)基梅隆大學(xué)人機交互的榮譽。“研究中的一些研究結(jié)果超越了維基百科,可以應(yīng)用于其他環(huán)境中的許多討論。” 他補充說,可以做更多的工作來提高機器學(xué)習(xí)模型的準(zhǔn)確性,以便為維基百科提供更多可操作的見解。

該研究揭示了一些RfC流程如何“偏離既定規(guī)范,導(dǎo)致效率低下和偏見,”維基媒體基金會研究主任Dario Taraborelli說。“結(jié)果表明,參與者的經(jīng)驗和討論的長度可以很好地預(yù)測RfC的及時關(guān)閉。這為如何使新移民和代表性不足的成員更容易獲得與治理相關(guān)的討論的問題帶來了新的實證證據(jù)。組“。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。