2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)
在2023年12月5日,谷歌公司旗下的研究人員表示,現(xiàn)在已經(jīng)找到了獲取OpenAI公司旗下人工智能聊天機(jī)器人ChatGPT的訓(xùn)練數(shù)據(jù)方法。在剛剛發(fā)布的論文中,谷歌公司的研究人員表示,有一些關(guān)鍵詞能夠讓ChatGPT泄露在訓(xùn)練時(shí)所接受的訓(xùn)練及內(nèi)容。
研究人員舉例模型在重復(fù)詩(shī)歌這個(gè)詞語(yǔ)以后給出的答案是一個(gè)真實(shí)存在的電子郵件地址和電話號(hào)碼。研究人員表示,個(gè)人信息泄露經(jīng)常會(huì)發(fā)生在他們向平臺(tái)發(fā)動(dòng)攻擊的時(shí)候。此外,當(dāng)研究人員要求模型重復(fù)公司這個(gè)詞語(yǔ)的時(shí)候,也出現(xiàn)了類似的情況。研究人員表示,雖然這種攻擊的方式看起來(lái)比較的簡(jiǎn)單,但是這種攻擊卻十分有效。
研究人員在論文中指出,僅僅只用價(jià)值200美元的查詢,就能夠提取出超過(guò)1萬(wàn)個(gè)逐字記憶的訓(xùn)練示例。根據(jù)研究人員的推斷,如果有更多的預(yù)算,那么就可以獲得更多競(jìng)爭(zhēng)對(duì)手的訓(xùn)練數(shù)據(jù)。目前OpenAI公司正在面臨著幾個(gè)有關(guān)于ChatGPT秘密訓(xùn)練數(shù)據(jù)的訴訟。因?yàn)闉?ChatGPT人工智能模型提供數(shù)據(jù)的是來(lái)自于互聯(lián)網(wǎng)的文本數(shù)據(jù)庫(kù),據(jù)了解,目前ChatGPT已經(jīng)接受了3,000億個(gè)單詞的訓(xùn)練。
有一項(xiàng)集體訴訟中指出OpenAI公司私自竊取了大量的個(gè)人數(shù)據(jù),其中包括私人的醫(yī)療記錄和兒童信息,這些信息全部都用來(lái)訓(xùn)練 ChatGPT人工智能模型,還有一些作家也在起訴OpenAI公司指控公司利用他們的作品來(lái)訓(xùn)練聊天機(jī)器人。對(duì)于谷歌公司研究人員的發(fā)現(xiàn)OpenAI公司已經(jīng)做出了正面回應(yīng),表示重復(fù)使用一些指令,可能違反了公司的服務(wù)條款。目前還并不清楚這種行為違反了OpenAI公司內(nèi)容政策的哪一部分,不過(guò)在OpenAI公司的使用條款中,確實(shí)規(guī)定用戶不能夠使用任何自動(dòng)或者編程的方法提取數(shù)據(jù)。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)