Facebook的人工智能檢測不到20個好友請求的虛假賬戶

2022-09-01 23:21:42 編輯：宇文朗來源：

導讀在今天Face book博客上的一篇文章中，工程師們描述了一種算法-SybilEdge-來檢測假賬戶，這些假賬戶在注冊時逃避Face book的反虐過濾器，...

在今天Face book博客上的一篇文章中，工程師們描述了一種算法-SybilEdge-來檢測假賬戶，這些假賬戶在注冊時逃避Face book的反虐過濾器，但還沒有足夠的朋友來延續(xù)虐待。目標是降低賬戶對其他用戶發(fā)起攻擊的能力，部分是通過比較用戶向擴展社交網絡添加好友的方式。

SybilEdge能夠發(fā)現(xiàn)假的Face book賬戶不到一周，朋友的請求不到20個，它立即申請平臺來處理關于流行的一波誤導性信息。路透社牛津大學新聞學研究所發(fā)表的一項分析發(fā)現(xiàn)，33%的人在Twitter、Face book和YouTube等社交網絡上看到了某種形式的關于的錯誤信息。

在設計SybilEdge時，開發(fā)團隊指出，施虐者需要連接到目標才能發(fā)起虐待-也就是說，他們需要找到目標，向他們發(fā)送朋友請求，并接受請求。也許不足為奇的是，F(xiàn)ace book內部研究表明，非用戶在選擇朋友和那些朋友對朋友請求的回應方面都有所不同：假帳戶的請求比真實用戶的請求更經常被拒絕。此外，假賬戶在選擇朋友請求目標時往往很小心，這可能會最大限度地提高他們的請求被接受的概率。

Face book創(chuàng)建了一個語料庫，通過將用戶分成兩組來訓練SybilEdge：那些更有可能接受來自真實帳戶的朋友請求的人和那些可能接受虛假帳戶請求的人。如果前者拒絕傳入的請求，它將發(fā)出請求者是合法用戶的信號。另一方面，如果接受更多假請求的用戶接受請求，則表明請求者可能是假的。

西比爾邊緣分兩個階段工作。首先，它是通過觀察上述樣本的時間來訓練的，然后它利用Face book的行為和內容分類器的輸出，這些分類器根據(jù)實際的濫用標記帳戶。這個訓練階段為模型提供了所有必要的參數(shù)(即從數(shù)據(jù)中估計的配置變量，以及模型在進行預測時所需的配置變量)，以便為每個朋友的請求和響應實時運行，并更新請求者被假的概率。

Face book聲稱，SybilEdge在檢測假賬戶方面的準確率高于90%，平均有15個或更少的朋友請求，在檢測5個朋友請求的假賬戶方面的準確率高于80%。此外，與其比較的基線不同，它的性能不會隨著更多的朋友請求而降低(超過45)。

“SybilEdge幫助我們快速識別施虐者，并以一種可以解釋和分析的方式。在不久的將來，我們計劃研究更多的方法，可以進一步加快發(fā)現(xiàn)濫用帳戶，并幫助作出自信的決定，甚至比SybilEdge更快。我們計劃通過混合基于特征和基于行為的模型來實現(xiàn)這一點，“Face book寫道。

Face book正向一種名為自我監(jiān)督學習的人工智能培訓技術邁進，在這種技術中，未標記數(shù)據(jù)與少量標記數(shù)據(jù)一起使用，以提高學習精度。 Face book的深度實體分類(DEC)機器學習框架在部署以來的兩年里導致平臺上濫用賬戶減少了20%。在一個單獨的實驗中，F(xiàn)ace book的研究人員能夠訓練一個語言理解模型，該模型只有80個小時的數(shù)據(jù)，而人工標記的數(shù)據(jù)為12,000個小時。

標簽：

免責聲明：本文由用戶上傳，如有侵權請聯(lián)系刪除！