維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實(shí)現(xiàn)了大規(guī)模

2019-06-06 17:03:53 編輯：來源：

導(dǎo)讀維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實(shí)現(xiàn)了大規(guī)模，開放的協(xié)作。但是，與許多協(xié)作式寫作項(xiàng)目一樣，制作內(nèi)容可能是一個(gè)有爭議的主題

維基百科已經(jīng)在互聯(lián)網(wǎng)上最大的通用參考資源上實(shí)現(xiàn)了大規(guī)模，開放的協(xié)作。但是，與許多協(xié)作式寫作項(xiàng)目一樣，制作內(nèi)容可能是一個(gè)有爭議的主題。

通常，多個(gè)維基百科編輯會(huì)對文章或政策的某些更改意見不一致。正式解決此類爭議的主要方式之一是征求意見(RfC)流程。爭吵的編輯將在一個(gè)論壇上宣傳他們的討論，其他維基百科編輯將會(huì)在這個(gè)論壇上發(fā)表意見，一位中立的編輯將做出最終決定。

理想情況下，這應(yīng)解決所有問題。但麻省理工學(xué)院研究人員進(jìn)行的一項(xiàng)新研究發(fā)現(xiàn)，虛弱的因素 - 例如過度爭吵和措辭不合理 - 導(dǎo)致大約三分之一的RfC未得到解決。

在這項(xiàng)研究中，研究人員編制并分析了有史以來第一次全面的RfC對話數(shù)據(jù)集，這些數(shù)據(jù)集是在8年時(shí)間內(nèi)完成的，并對經(jīng)常關(guān)閉RfC的編輯進(jìn)行了訪談，以了解為什么他們找不到解決方案。他們還開發(fā)了一種機(jī)器學(xué)習(xí)模型，利用該數(shù)據(jù)集來預(yù)測RfC何時(shí)可能過時(shí)。而且，他們推薦的數(shù)字工具可以使審議和解決更加有效。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的博士候選人Amy X. Zhang表示：“令人驚訝的是，有三分之一的討論沒有結(jié)束。”該論文的共同作者正在提交論文。本周的計(jì)算機(jī)支持的合作工作和社會(huì)計(jì)算ACM會(huì)議。“在維基百科上，每個(gè)人都是志愿者。人們正在投入工作，他們有興趣...編輯可能正在等待某人關(guān)閉，以便他們可以回到編輯。我們知道，通過討論，閱讀工作并且解決一個(gè)大的審議很難，特別是來回和爭議。[我們希望]幫助那個(gè)人做那項(xiàng)工作。“

該論文的共同作者是：第一作者Jane Im，密歇根大學(xué)信息學(xué)院的研究生; 維基媒體基金會(huì)的Christopher J. Schilling; 和David Karger，計(jì)算機(jī)科學(xué)教授和CSAIL研究員。

(不)找到封閉

維基百科提供了幾個(gè)解決編輯糾紛的渠道，其中包括兩位編輯解決他們的問題，將想法投入社區(qū)的簡單多數(shù)投票，或?qū)⑥q論帶到一個(gè)主持人小組。之前的一些維基百科研究已經(jīng)深入研究了這些渠道以及貢獻(xiàn)者之間來回的“編輯戰(zhàn)爭”。“但是RfC很有意思，因?yàn)橥镀毙膽B(tài)要少得多，”張說。“通過其他流程，在一天結(jié)束時(shí)，你會(huì)投票，看看會(huì)發(fā)生什么。[RfC參與者]有時(shí)會(huì)投票，但更多的是找到共識(shí)。重要的是在討論中實(shí)際發(fā)生了什么。”

要提交RfC，編輯會(huì)根據(jù)文章基本“對話”頁面中未解決的內(nèi)容爭議起草模板提案，并邀請更廣泛的社群發(fā)表評(píng)論。提案的范圍廣泛，從對名人背景信息的微小分歧到維基百科政策的變化。任何編輯都可以發(fā)起RfC，任何編輯 - 通常是更有經(jīng)驗(yàn)的編輯 - 他們沒有參與討論并且被認(rèn)為是中立的，可能會(huì)結(jié)束討論。30天后，機(jī)器人會(huì)自動(dòng)刪除RfC模板，無論是否有分辨率。由于參與者的壓倒性協(xié)議，RfC可以通過近距離的正式結(jié)束，非正式地結(jié)束，或者保持陳舊，意味著在沒有解決的情況下刪除。

在他們的研究中，研究人員編制了一個(gè)數(shù)據(jù)庫，該數(shù)據(jù)庫包括2011年至2017年英語維基百科的約7,000次RfC對話，其中包括結(jié)束語，作者帳戶信息和一般回復(fù)結(jié)構(gòu)。他們還對維基百科最常見的10個(gè)關(guān)閉者進(jìn)行了訪談，以便在解決爭議時(shí)更好地了解他們的動(dòng)機(jī)和注意事項(xiàng)。

分析數(shù)據(jù)集后，研究人員發(fā)現(xiàn)大約57%的RfC正式關(guān)閉。在剩余的43%中，78%(或大約2,300)在沒有非正式解決方案的情況下仍處于陳舊狀態(tài) - 或者在研究的所有RfC中約占33%。結(jié)合數(shù)據(jù)集分析和訪談，研究人員隨后充實(shí)了解決失敗的主要原因。主要問題包括初步論點(diǎn)不清晰，發(fā)起人不清楚問題或撰寫故意偏見的提案; 在討論過程中過度爭吵導(dǎo)致更復(fù)雜，更長，更具爭議性的線索，難以全面審查; 并且簡單地缺乏第三方編輯的興趣，因?yàn)橹黝}可能過于深?yuàn)W，以及其他因素。

有用的工具

然后，該團(tuán)隊(duì)開發(fā)了一種機(jī)器學(xué)習(xí)模型，通過分析文本，維基百科頁面和編輯器帳戶信息的60多個(gè)特征來預(yù)測給定的RfC是關(guān)閉(正式還是非正式)還是過時(shí)。在討論開始后的一周內(nèi)，該模型可以準(zhǔn)確地預(yù)測失敗或成功率達(dá)到75%。他們發(fā)現(xiàn)，預(yù)測的一些更具信息性的特征包括討論的長度，參與者和回復(fù)的數(shù)量，文章的修訂次數(shù)，主題的受歡迎程度和興趣，討論參與者的經(jīng)驗(yàn)以及粗俗程度，否定性和評(píng)論中的一般侵略性。

有一天，RfC發(fā)起人可以使用該模型來監(jiān)控正在展開的討論。“我們認(rèn)為編輯們知道如何針對他們的干預(yù)措施可能是有用的，”張說。“他們可以將[RfC]發(fā)布到更多[維基百科論壇]或邀請更多人，如果它看起來有可能無法解決。”

研究人員建議維基百科可以開發(fā)工具來幫助關(guān)閉者組織冗長的討論，在一個(gè)線程中標(biāo)記有說服力的論點(diǎn)和意見變化，并鼓勵(lì)合作關(guān)閉RfC。

將來，模型和提議的工具可能會(huì)用于涉及大規(guī)模討論和審議的其他社區(qū)平臺(tái)。張指向在線城市和社區(qū)規(guī)劃論壇，公民在這些論壇上對提案進(jìn)行權(quán)衡。“人們正在討論[提案]并對其進(jìn)行投票，因此這些工具可以幫助社區(qū)更好地理解討論......并且[也]對提案的實(shí)施者也有用。”

張，我和其他研究人員現(xiàn)在已經(jīng)為各級(jí)專家編輯建立了一個(gè)外部網(wǎng)站，可以相互學(xué)習(xí)，更輕松地監(jiān)控和結(jié)束討論。“更接近的工作非常艱難，”張說，“所以人們?nèi)狈﹃P(guān)閉這些討論的人，尤其是困難，更長，更重要的討論。這可能有助于減少進(jìn)入的障礙[讓編輯成為閉門者] ]并幫助他們合作關(guān)閉RfCs。“

“雖然令人驚訝的是，這些討論中有三分之一從未得到解決，但更重要的是討論未能完成的重要原因，最有趣的結(jié)論來自于定性分析，”教授羅伯特·克勞特說。卡內(nèi)基梅隆大學(xué)人機(jī)交互的榮譽(yù)。“研究中的一些研究結(jié)果超越了維基百科，可以應(yīng)用于其他環(huán)境中的許多討論。” 他補(bǔ)充說，可以做更多的工作來提高機(jī)器學(xué)習(xí)模型的準(zhǔn)確性，以便為維基百科提供更多可操作的見解。

該研究揭示了一些RfC流程如何“偏離既定規(guī)范，導(dǎo)致效率低下和偏見，”維基媒體基金會(huì)研究主任Dario Taraborelli說。“結(jié)果表明，參與者的經(jīng)驗(yàn)和討論的長度可以很好地預(yù)測RfC的及時(shí)關(guān)閉。這為如何使新移民和代表性不足的成員更容易獲得與治理相關(guān)的討論的問題帶來了新的實(shí)證證據(jù)。組“。

標(biāo)簽：維基百科