您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

Sora理解物理世界嗎(關(guān)于Sora的簡(jiǎn)介)

2024-02-23 14:10:01 編輯:宰荷榮 來(lái)源:
導(dǎo)讀 Sora模型發(fā)布已經(jīng)有一段時(shí)間,最初它對(duì)世界的理解能力讓人驚嘆,但有業(yè)內(nèi)人士認(rèn)為,Sora對(duì)于世界的理解還停留在比較初級(jí)的階段,對(duì)物理世界...

Sora模型發(fā)布已經(jīng)有一段時(shí)間,最初它對(duì)世界的理解能力讓人驚嘆,但有業(yè)內(nèi)人士認(rèn)為,Sora對(duì)于世界的理解還停留在比較初級(jí)的階段,對(duì)物理世界并沒(méi)有特別深的理解。

1.相比于以前的視頻生成模型,Sora對(duì)于物理世界有一定的理解能力,但并不能算很高明,在一個(gè)中國(guó)舞龍視頻當(dāng)中,Sora生成的中國(guó)字其實(shí)并不是中國(guó)字,只是比較像中國(guó)字的一個(gè)圖形,這是計(jì)算機(jī)的特性決定的,它具備很強(qiáng)的學(xué)習(xí)能力和圖像生成能力,但對(duì)于現(xiàn)象背后的物理意義和文化意義并不如ChatGPT一樣具備深刻的理解。

2.Sora在視頻的生成能力、連續(xù)性和真實(shí)世界模擬方面都具有巨大的優(yōu)勢(shì),它生成的視頻默認(rèn)為1080P,還具備視頻連接、數(shù)字世界模擬、不同世界交互、運(yùn)動(dòng)相機(jī)模擬等功能,這些功能在其他的視頻模型當(dāng)中被提及較少。

3.Open AI發(fā)布的Sora可以生成尺寸更加自由的視頻,用戶(hù)可以選擇1920*1080的橫屏、豎屏模式,介于兩者之間的所有尺寸視頻用戶(hù)都可以自由選擇,相比之下比如Runway Gen2視頻生成模型,只能選擇16:9、1:1、4:3等長(zhǎng)寬比的模型,清晰度則為1408*768px。

4.Sora能將兩個(gè)視頻揉合起來(lái),生成一個(gè)看起來(lái)沒(méi)有絲毫違和感的視頻,在官方演示視頻中,先為模型給出一個(gè)無(wú)人機(jī)穿越古羅馬的視頻,再給一個(gè)蝴蝶在海底飛行的視頻,Sora能將無(wú)人機(jī)變成蝴蝶,為古羅馬建筑加入珊瑚風(fēng)格。

5.生成的視頻中如果鏡頭中物體被其他物體遮住,鏡頭移動(dòng)到下一階段,這一物體重新出現(xiàn)時(shí)仍然能保持之前的存在狀態(tài),這種連續(xù)性是視頻生成模型的一大突破,可以預(yù)見(jiàn)未來(lái)Sora將會(huì)有廣泛的應(yīng)用前景。


免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ   備案號(hào):

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。

郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)