欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

當(dāng)前位置:主頁 > 區(qū)塊鏈 > 資訊 > 詳解Sora讓互聯(lián)網(wǎng)圈震驚

還未開放,Sora怎么就震驚了互聯(lián)網(wǎng)圈?

2024-02-21 14:22:57 | 來源: | 作者:佚名
還未開放公眾測試,OpenAI 憑借文本生成視頻模型 Sora 制作的預(yù)告片,就把科技圈、互聯(lián)網(wǎng)、社交媒體圈給震驚了,OpenAI 直接稱它為「世界模擬器」,能夠模擬物理世界中的人、動物和環(huán)境的特征,下面一起來看看正文內(nèi)容

還未開放公眾測試,OpenAI 憑借文本生成視頻模型 Sora 制作的預(yù)告片,就把科技圈、互聯(lián)網(wǎng)、社交媒體圈給震驚了。

根據(jù) OpenAI 官方發(fā)布的視頻,Sora 能夠根據(jù)用戶提供的文本信息,生成長達(dá) 1 分鐘的復(fù)雜場景「超視頻」,不僅畫面細(xì)節(jié)逼真,這個模型還會模擬鏡頭運(yùn)動感。

從已釋出的視頻效果看,業(yè)內(nèi)興奮的正是 Sora 體現(xiàn)出的理解真實(shí)世界的能力。相較其他文本到視頻的大模型,Sora 在對語義理解、畫面呈現(xiàn)、視覺連貫性和時(shí)長上都顯示出優(yōu)勢。

OpenAI 直接稱它為「世界模擬器」,宣告它能夠模擬物理世界中的人、動物和環(huán)境的特征。但該公司也承認(rèn),目前 Sora 的還不完美,依然存在理解不到位和潛在的安全問題。

因此,Sora 僅對非常少數(shù)的人開放測試,OpenAI 尚未公布 Sora 何時(shí)會向大眾開放,但它帶來的震撼足以讓研發(fā)同類模型的公司看到差距。

Sora「預(yù)告片」驚爆眾人

OpenAI 文本生成視頻模型 Sora 一出,國內(nèi)又現(xiàn)「震驚體」評價(jià)。

自媒體驚呼「現(xiàn)實(shí)不存在了」,互聯(lián)網(wǎng)大佬也吹爆了 Sora 的能力。360 創(chuàng)始人周鴻祎稱,Sora 的誕生意味著 AGI 的實(shí)現(xiàn)可能從 10 年縮短至兩年左右。短短幾天,Sora 的谷歌搜索指數(shù)迅速拉升,熱度直逼 ChatGPT。

Sora 的爆火源于 OpenAI 發(fā)布的 48 段視頻,其中時(shí)長最長的為 1 分鐘。這不僅打破了此前文生視頻模型 Gen2、Runway 生成視頻的時(shí)長極限,而且畫面清晰,甚至它還學(xué)會了鏡頭語言。

1 分鐘視頻中,一位身著紅裙的女性走在霓虹燈林立的街頭,風(fēng)格寫實(shí),畫面流暢,最令人驚艷的是女主角的特寫,連臉部的毛孔、斑點(diǎn)、痘印都模擬了出來,卡粉脫妝效果堪比直播關(guān)掉美顏濾鏡,脖子上的頸紋甚至精準(zhǔn)「泄露」了年齡,與臉部狀態(tài)做到了完美統(tǒng)一。

除了對人物寫實(shí),Sora 還能夠模擬現(xiàn)實(shí)中的動物與環(huán)境。一段視頻維多利亞冠鴿的多角度特寫,超清呈現(xiàn)了這只鳥全身至冠的藍(lán)色羽毛,甚至細(xì)微到紅色眼珠的動態(tài)和呼吸頻率,讓人很難分清這到底是 AI 生成的還是人類拍攝的。

對于非寫實(shí)的創(chuàng)意動畫,Sora 的生成效果也達(dá)到了迪士尼動畫電影的畫面感,讓網(wǎng)友擔(dān)憂起動畫師的飯碗。

而 Sora 為文本生成視頻模型帶來的改進(jìn)不僅在視頻時(shí)長與畫面效果上,它還能模擬鏡頭與拍攝的運(yùn)動軌跡,游戲的第一人稱視角,航拍視角,甚至是電影里的一鏡到底。

看完 OpenAI 放出的精彩視頻,你就能理解互聯(lián)網(wǎng)圈、社交媒體輿論為什么會為 Sora 感到震驚,而這些只是預(yù)告片。

OpenAI 提出「視覺補(bǔ)丁」數(shù)據(jù)集

那么,Sora 是如何實(shí)現(xiàn)模擬能力的?

按照 Open AI 發(fā)布的 Sora 技術(shù)報(bào)告,這個模型正在超越先前圖像數(shù)據(jù)生成模型的限制。

以往的文本生成視覺畫面的研究采用過各種方法,包括循環(huán)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)(GAN)、自回歸變換器和擴(kuò)散模型,但共性是集中在較少的視覺數(shù)據(jù)類別、較短的視頻或固定尺寸的視頻上。

Sora 采用了一種基于 Transformer 的擴(kuò)散模型,生圖過程可以分為正向過程和反向過程兩個階段,以實(shí)現(xiàn) Sora 能沿時(shí)間線向前或向后擴(kuò)展視頻的能力。

正向過程階段模擬了從真實(shí)圖像到純噪點(diǎn)圖像的擴(kuò)散過程。具體來說,模型會逐步地向圖像中添加噪點(diǎn),直到圖像完全變成噪點(diǎn)。而反向過程是正向過程的逆過程,模型會從噪點(diǎn)圖像逐步恢復(fù)出原始圖像。一正一反,虛實(shí)來回,OpenAI 以這種方式讓機(jī)器 Sora 理解視覺的形成。

從全噪點(diǎn)到清晰圖的過程

當(dāng)然,這個過程需要反復(fù)地訓(xùn)練學(xué)習(xí),模型會學(xué)習(xí)如何逐步去除噪聲并恢復(fù)圖像的細(xì)節(jié)。通過這兩個階段的迭代,Sora 的擴(kuò)散模型能夠生成高質(zhì)量的圖像。這種模型在圖像生成、圖像編輯、超分辨率等領(lǐng)域表現(xiàn)出了優(yōu)秀的性能。

上述過程解釋了 Sora 能做到高清、超細(xì)節(jié)的原因。但從靜態(tài)的圖像到動態(tài)的視頻,仍需要模型進(jìn)一步積累數(shù)據(jù),訓(xùn)練學(xué)習(xí)。

在擴(kuò)散模型的基礎(chǔ)上,OpenAI 將視頻和圖像等所有類型的視覺數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一表示,以此來對 Sora 做大規(guī)模的生成訓(xùn)練。Sora 使用的表示方式被 OpenAI 定義為「視覺補(bǔ)丁(patches)」,即一種更小數(shù)據(jù)單元的集合,類似于 GPT 中的文本集合。

研究者首先將視頻壓縮到一個低維潛空間中,隨后把這種表征分解為時(shí)空 patch,這是一種高度可擴(kuò)展的表征形式,方便實(shí)現(xiàn)從視頻到 patch 的轉(zhuǎn)換,也正適用于訓(xùn)練處理多種類型視頻和圖片的生成模型。

將視覺數(shù)據(jù)轉(zhuǎn)化為 patches

為了用更少的信息與計(jì)算量訓(xùn)練 Sora,OpenAI 開發(fā)了一個視頻壓縮網(wǎng)絡(luò),把視頻先降維到像素級別的地低維潛空間,然后再去拿壓縮過的視頻數(shù)據(jù)去生成 patches,這樣就能使輸入的信息變少,從而減少計(jì)算壓力。同時(shí),OpenAI 還訓(xùn)練了相應(yīng)的解碼器模型,將壓縮后的信息映射回像素空間。

基于視覺補(bǔ)丁的表示方式,研究者能對 Sora 針對不同分辨率、持續(xù)時(shí)間和長寬比的視頻 / 圖像進(jìn)行訓(xùn)練。進(jìn)入推理階段,Sora 能通過在適當(dāng)大小的網(wǎng)格中排列隨機(jī)初始化的 patches 來判斷視頻邏輯、控制生成視頻的大小。

OpenAI 報(bào)告,在大規(guī)模訓(xùn)練時(shí),視頻模型就表現(xiàn)出令人興奮的功能,包括 Sora 能夠真實(shí)模擬現(xiàn)實(shí)世界中的人、動物和環(huán)境,生成高保真的視頻,同時(shí)實(shí)現(xiàn) 3D 一致性、時(shí)間一致性,從而真實(shí)模擬物理世界。

Altman 當(dāng)二傳手為網(wǎng)友測試

從結(jié)果到研發(fā)過程,Sora 顯示著強(qiáng)大的能力,但普通用戶還無從體驗(yàn),目前只能寫好提示詞,在 X 上@OpenAI 創(chuàng)始人 Sam Altman,由他作為二傳手,幫網(wǎng)友們在 Sora 上生成視頻后放出來給公眾看效果。

這也不免令人懷疑 Sora 是否真的如 OpenAI 官方展示得那么牛。

對此,OpenAI 直言,目前模型還存在一些問題。如同早期的 GPT 一樣,現(xiàn)在的 Sora 也有「幻覺」,這種錯誤表示在以視覺為主的視頻結(jié)果上顯示地更為具象。

例如,它不能準(zhǔn)確地模擬許多基本相互作用的物理過程,例如跑步機(jī)履帶與人的運(yùn)動關(guān)系,玻璃杯破碎與杯內(nèi)液體流出的時(shí)序邏輯等等。

在下面這個「考古工作者們挖掘出一個塑料椅」的視頻片段里,塑料椅直接從沙子里「飄」了出來。

還有憑空出現(xiàn)的小狼崽,被網(wǎng)友戲稱為「狼的有絲分裂」。

它有時(shí)也分不清前后左右。

這些動態(tài)畫面中存在的紕漏似乎都在證明,Sora 仍需要對物理世界運(yùn)動的邏輯去做更多的理解和訓(xùn)練。此外,相比 ChatGPT 的風(fēng)險(xiǎn),給人直觀視覺體驗(yàn)的 Sora 存在的道德、安全風(fēng)險(xiǎn)更甚。

此前,文生圖模型 Midjourney 已經(jīng)告訴人類 「有圖不見得有真相」,人工智能生成的以假亂真的圖片開始成為謠言要素。身份驗(yàn)證公司 iProov 的首席科學(xué)官紐維爾博士就表示,Sora 能讓「惡意行為者更容易生成高質(zhì)量的假視頻?!?/p>

可想而知,如果 Sora 生成的視頻被惡意濫用,搞在欺詐和誹謗、傳播暴力和色情上,造成的后果也難以估量,這也是 Sora 讓人在震驚之余還會害怕的原因。

OpenAI 也考慮到了 Sora 可能帶來的安全問題,這大概也是 Sora 僅對非常少數(shù)人以邀請制開放測試的原因。何時(shí)會大眾開放?OpenAI 沒有給出時(shí)間表,而從官方釋出的視頻看,其他公司追趕 Sora 模型的時(shí)間不多了。

免責(zé)聲明:本文只為提供市場訊息,所有內(nèi)容及觀點(diǎn)僅供參考,不構(gòu)成投資建議,不代表本站觀點(diǎn)和立場。投資者應(yīng)自行決策與交易,對投資者交易形成的直接或間接損失,作者及本站將不承擔(dān)任何責(zé)任。!
Tag:Sora  

你可能感興趣的文章

更多

熱門幣種

  • 幣名
    最新價(jià)格
    24H漲幅
  • bitcoin BTC 比特幣

    BTC

    比特幣

    $ 118532.52¥ 843833
    +3.37%
  • ethereum ETH 以太坊

    ETH

    以太坊

    $ 4378.56¥ 31170.96
    +5.66%
  • ripple XRP 瑞波幣

    XRP

    瑞波幣

    $ 2.9677¥ 21.127
    +4.28%
  • tether USDT 泰達(dá)幣

    USDT

    泰達(dá)幣

    $ 1.0003¥ 7.1211
    +0.03%
  • binance-coin BNB 幣安幣

    BNB

    幣安幣

    $ 1032.81¥ 7352.57
    +2.29%
  • solana SOL Solana

    SOL

    Solana

    $ 223.91¥ 1594.01
    +7.01%
  • usdc USDC USD Coin

    USDC

    USD Coin

    $ 0.9993¥ 7.114
    -0.02%
  • dogecoin DOGE 狗狗幣

    DOGE

    狗狗幣

    $ 0.2535¥ 1.8046
    +8.7%
  • tron TRX 波場

    TRX

    波場

    $ 0.3419¥ 2.4339
    +2.4%
  • cardano ADA 艾達(dá)幣

    ADA

    艾達(dá)幣

    $ 0.8542¥ 6.081
    +6.12%

幣圈快訊

  • ETH突破4400美元

    2025-10-02 14:32
    行情顯示,ETH突破4400美元,現(xiàn)報(bào)4407.71美元,24小時(shí)漲幅達(dá)到6.58%,行情波動較大,請做好風(fēng)險(xiǎn)控制。
  • Paxos發(fā)布畢馬威出具的八月鑒證報(bào)告:PYUSD代幣流通總額突破11億枚

    2025-10-02 14:32
    Paxos官方發(fā)布由“四大會計(jì)事務(wù)所”之一畢馬威出具的2025年8月穩(wěn)定幣PYUSD鑒證報(bào)告,其中披露:PYUSD代幣流通總額(TotalTokensOutstanding)截至8月29日升至1,169,714,720枚;總凈資產(chǎn)中可贖回抵押品名義頭寸價(jià)值1,173,383,198美元,高于PYUSD代幣的流通總額。此外,Paxos數(shù)據(jù)還顯示,隨著黃金價(jià)格上漲,旗下黃金掛鉤代幣PAXG市值已突破11.5億美元,現(xiàn)報(bào)1,153,328,709美元,續(xù)創(chuàng)新高。
  • 花旗:將未來12個月以太坊價(jià)格目標(biāo)設(shè)定為5440美元

    2025-10-02 14:32
    花旗:將未來12個月以太坊價(jià)格目標(biāo)設(shè)定為5440美元。
  • Ju.comCEO:資產(chǎn)所有權(quán)是數(shù)字人權(quán),把不可能變成可能

    2025-10-02 14:09
    10月2日,Ju.comCEO兼聯(lián)合創(chuàng)始人SammiLi在新加坡TOKEN2049發(fā)表“重寫不可能”主題演講。她指出65%新用戶首次嘗試DeFi即流失,Ju.com用“一點(diǎn)即觸,一鍵交易”消解復(fù)雜門檻。平臺已覆蓋50M+用戶、100+國家,日均成交約50億美元,JU代幣自IEO的0.10美元升至7美元以上。核心功能如合約守護(hù)機(jī)制已穩(wěn)定運(yùn)行,xBrokers則通過三重飛輪模式重塑港股流動性。JuPay已結(jié)合JuCard,上線法幣入金、全球速匯、掃碼支付等功能,正在把支付從交易延展到日常生活。Sammi強(qiáng)調(diào):資產(chǎn)所有權(quán)是數(shù)字人權(quán),Ju.com的使命是把“不可能”變成“我可能”。
  • ETH全網(wǎng)合約持倉量24h增長6.83%

    2025-10-02 13:41
    據(jù)Coinglass數(shù)據(jù)顯示,ETH全網(wǎng)合約持倉量在過去24小時(shí)增長6.83%,當(dāng)前總持倉量為586.32億美元。其中Binance持倉量為114.89億美元,OKX持倉量為34.77億美元,Bybit持倉量為51.26億美元。
  • 查看更多