當(dāng)前位置：主頁(yè) > 區(qū)塊鏈 > 資訊 > 詳解Sora讓互聯(lián)網(wǎng)圈震驚

還未開放，Sora怎么就震驚了互聯(lián)網(wǎng)圈？

2024-02-21 14:22:57 | 來源： | 作者：佚名

還未開放公眾測(cè)試，OpenAI 憑借文本生成視頻模型 Sora 制作的預(yù)告片，就把科技圈、互聯(lián)網(wǎng)、社交媒體圈給震驚了,OpenAI 直接稱它為「世界模擬器」，能夠模擬物理世界中的人、動(dòng)物和環(huán)境的特征，下面一起來看看正文內(nèi)容

還未開放公眾測(cè)試，OpenAI 憑借文本生成視頻模型 Sora 制作的預(yù)告片，就把科技圈、互聯(lián)網(wǎng)、社交媒體圈給震驚了。

根據(jù) OpenAI 官方發(fā)布的視頻，Sora 能夠根據(jù)用戶提供的文本信息，生成長(zhǎng)達(dá) 1 分鐘的復(fù)雜場(chǎng)景「超視頻」，不僅畫面細(xì)節(jié)逼真，這個(gè)模型還會(huì)模擬鏡頭運(yùn)動(dòng)感。

從已釋出的視頻效果看，業(yè)內(nèi)興奮的正是 Sora 體現(xiàn)出的理解真實(shí)世界的能力。相較其他文本到視頻的大模型，Sora 在對(duì)語(yǔ)義理解、畫面呈現(xiàn)、視覺連貫性和時(shí)長(zhǎng)上都顯示出優(yōu)勢(shì)。

OpenAI 直接稱它為「世界模擬器」，宣告它能夠模擬物理世界中的人、動(dòng)物和環(huán)境的特征。但該公司也承認(rèn)，目前 Sora 的還不完美，依然存在理解不到位和潛在的安全問題。

因此，Sora 僅對(duì)非常少數(shù)的人開放測(cè)試，OpenAI 尚未公布 Sora 何時(shí)會(huì)向大眾開放，但它帶來的震撼足以讓研發(fā)同類模型的公司看到差距。

Sora「預(yù)告片」驚爆眾人

OpenAI 文本生成視頻模型 Sora 一出，國(guó)內(nèi)又現(xiàn)「震驚體」評(píng)價(jià)。

自媒體驚呼「現(xiàn)實(shí)不存在了」，互聯(lián)網(wǎng)大佬也吹爆了 Sora 的能力。360 創(chuàng)始人周鴻祎稱，Sora 的誕生意味著 AGI 的實(shí)現(xiàn)可能從 10 年縮短至兩年左右。短短幾天，Sora 的谷歌搜索指數(shù)迅速拉升，熱度直逼 ChatGPT。

Sora 的爆火源于 OpenAI 發(fā)布的 48 段視頻，其中時(shí)長(zhǎng)最長(zhǎng)的為 1 分鐘。這不僅打破了此前文生視頻模型 Gen2、Runway 生成視頻的時(shí)長(zhǎng)極限，而且畫面清晰，甚至它還學(xué)會(huì)了鏡頭語(yǔ)言。

1 分鐘視頻中，一位身著紅裙的女性走在霓虹燈林立的街頭，風(fēng)格寫實(shí)，畫面流暢，最令人驚艷的是女主角的特寫，連臉部的毛孔、斑點(diǎn)、痘印都模擬了出來，卡粉脫妝效果堪比直播關(guān)掉美顏濾鏡，脖子上的頸紋甚至精準(zhǔn)「泄露」了年齡，與臉部狀態(tài)做到了完美統(tǒng)一。

除了對(duì)人物寫實(shí)，Sora 還能夠模擬現(xiàn)實(shí)中的動(dòng)物與環(huán)境。一段視頻維多利亞冠鴿的多角度特寫，超清呈現(xiàn)了這只鳥全身至冠的藍(lán)色羽毛，甚至細(xì)微到紅色眼珠的動(dòng)態(tài)和呼吸頻率，讓人很難分清這到底是 AI 生成的還是人類拍攝的。

對(duì)于非寫實(shí)的創(chuàng)意動(dòng)畫，Sora 的生成效果也達(dá)到了迪士尼動(dòng)畫電影的畫面感，讓網(wǎng)友擔(dān)憂起動(dòng)畫師的飯碗。

而 Sora 為文本生成視頻模型帶來的改進(jìn)不僅在視頻時(shí)長(zhǎng)與畫面效果上，它還能模擬鏡頭與拍攝的運(yùn)動(dòng)軌跡，游戲的第一人稱視角，航拍視角，甚至是電影里的一鏡到底。

看完 OpenAI 放出的精彩視頻，你就能理解互聯(lián)網(wǎng)圈、社交媒體輿論為什么會(huì)為 Sora 感到震驚，而這些只是預(yù)告片。

OpenAI 提出「視覺補(bǔ)丁」數(shù)據(jù)集

那么，Sora 是如何實(shí)現(xiàn)模擬能力的？

按照 Open AI 發(fā)布的 Sora 技術(shù)報(bào)告，這個(gè)模型正在超越先前圖像數(shù)據(jù)生成模型的限制。

以往的文本生成視覺畫面的研究采用過各種方法，包括循環(huán)網(wǎng)絡(luò)、生成對(duì)抗網(wǎng)絡(luò)（GAN）、自回歸變換器和擴(kuò)散模型，但共性是集中在較少的視覺數(shù)據(jù)類別、較短的視頻或固定尺寸的視頻上。

Sora 采用了一種基于 Transformer 的擴(kuò)散模型，生圖過程可以分為正向過程和反向過程兩個(gè)階段，以實(shí)現(xiàn) Sora 能沿時(shí)間線向前或向后擴(kuò)展視頻的能力。

正向過程階段模擬了從真實(shí)圖像到純?cè)朦c(diǎn)圖像的擴(kuò)散過程。具體來說，模型會(huì)逐步地向圖像中添加噪點(diǎn)，直到圖像完全變成噪點(diǎn)。而反向過程是正向過程的逆過程，模型會(huì)從噪點(diǎn)圖像逐步恢復(fù)出原始圖像。一正一反，虛實(shí)來回，OpenAI 以這種方式讓機(jī)器 Sora 理解視覺的形成。

從全噪點(diǎn)到清晰圖的過程

當(dāng)然，這個(gè)過程需要反復(fù)地訓(xùn)練學(xué)習(xí)，模型會(huì)學(xué)習(xí)如何逐步去除噪聲并恢復(fù)圖像的細(xì)節(jié)。通過這兩個(gè)階段的迭代，Sora 的擴(kuò)散模型能夠生成高質(zhì)量的圖像。這種模型在圖像生成、圖像編輯、超分辨率等領(lǐng)域表現(xiàn)出了優(yōu)秀的性能。

上述過程解釋了 Sora 能做到高清、超細(xì)節(jié)的原因。但從靜態(tài)的圖像到動(dòng)態(tài)的視頻，仍需要模型進(jìn)一步積累數(shù)據(jù)，訓(xùn)練學(xué)習(xí)。

在擴(kuò)散模型的基礎(chǔ)上，OpenAI 將視頻和圖像等所有類型的視覺數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一表示，以此來對(duì) Sora 做大規(guī)模的生成訓(xùn)練。Sora 使用的表示方式被 OpenAI 定義為「視覺補(bǔ)?。╬atches）」，即一種更小數(shù)據(jù)單元的集合，類似于 GPT 中的文本集合。

研究者首先將視頻壓縮到一個(gè)低維潛空間中，隨后把這種表征分解為時(shí)空 patch，這是一種高度可擴(kuò)展的表征形式，方便實(shí)現(xiàn)從視頻到 patch 的轉(zhuǎn)換，也正適用于訓(xùn)練處理多種類型視頻和圖片的生成模型。

將視覺數(shù)據(jù)轉(zhuǎn)化為 patches

為了用更少的信息與計(jì)算量訓(xùn)練 Sora，OpenAI 開發(fā)了一個(gè)視頻壓縮網(wǎng)絡(luò)，把視頻先降維到像素級(jí)別的地低維潛空間，然后再去拿壓縮過的視頻數(shù)據(jù)去生成 patches，這樣就能使輸入的信息變少，從而減少計(jì)算壓力。同時(shí)，OpenAI 還訓(xùn)練了相應(yīng)的解碼器模型，將壓縮后的信息映射回像素空間。

基于視覺補(bǔ)丁的表示方式，研究者能對(duì) Sora 針對(duì)不同分辨率、持續(xù)時(shí)間和長(zhǎng)寬比的視頻 / 圖像進(jìn)行訓(xùn)練。進(jìn)入推理階段，Sora 能通過在適當(dāng)大小的網(wǎng)格中排列隨機(jī)初始化的 patches 來判斷視頻邏輯、控制生成視頻的大小。

OpenAI 報(bào)告，在大規(guī)模訓(xùn)練時(shí)，視頻模型就表現(xiàn)出令人興奮的功能，包括 Sora 能夠真實(shí)模擬現(xiàn)實(shí)世界中的人、動(dòng)物和環(huán)境，生成高保真的視頻，同時(shí)實(shí)現(xiàn) 3D 一致性、時(shí)間一致性，從而真實(shí)模擬物理世界。

Altman 當(dāng)二傳手為網(wǎng)友測(cè)試

從結(jié)果到研發(fā)過程，Sora 顯示著強(qiáng)大的能力，但普通用戶還無從體驗(yàn)，目前只能寫好提示詞，在 X 上@OpenAI 創(chuàng)始人 Sam Altman，由他作為二傳手，幫網(wǎng)友們?cè)?Sora 上生成視頻后放出來給公眾看效果。

這也不免令人懷疑 Sora 是否真的如 OpenAI 官方展示得那么牛。

對(duì)此，OpenAI 直言，目前模型還存在一些問題。如同早期的 GPT 一樣，現(xiàn)在的 Sora 也有「幻覺」，這種錯(cuò)誤表示在以視覺為主的視頻結(jié)果上顯示地更為具象。

例如，它不能準(zhǔn)確地模擬許多基本相互作用的物理過程，例如跑步機(jī)履帶與人的運(yùn)動(dòng)關(guān)系，玻璃杯破碎與杯內(nèi)液體流出的時(shí)序邏輯等等。

在下面這個(gè)「考古工作者們挖掘出一個(gè)塑料椅」的視頻片段里，塑料椅直接從沙子里「飄」了出來。

還有憑空出現(xiàn)的小狼崽，被網(wǎng)友戲稱為「狼的有絲分裂」。

它有時(shí)也分不清前后左右。

這些動(dòng)態(tài)畫面中存在的紕漏似乎都在證明，Sora 仍需要對(duì)物理世界運(yùn)動(dòng)的邏輯去做更多的理解和訓(xùn)練。此外，相比 ChatGPT 的風(fēng)險(xiǎn)，給人直觀視覺體驗(yàn)的 Sora 存在的道德、安全風(fēng)險(xiǎn)更甚。

此前，文生圖模型 Midjourney 已經(jīng)告訴人類「有圖不見得有真相」，人工智能生成的以假亂真的圖片開始成為謠言要素。身份驗(yàn)證公司 iProov 的首席科學(xué)官紐維爾博士就表示，Sora 能讓「惡意行為者更容易生成高質(zhì)量的假視頻。」

可想而知，如果 Sora 生成的視頻被惡意濫用，搞在欺詐和誹謗、傳播暴力和色情上，造成的后果也難以估量，這也是 Sora 讓人在震驚之余還會(huì)害怕的原因。

OpenAI 也考慮到了 Sora 可能帶來的安全問題，這大概也是 Sora 僅對(duì)非常少數(shù)人以邀請(qǐng)制開放測(cè)試的原因。何時(shí)會(huì)大眾開放？OpenAI 沒有給出時(shí)間表，而從官方釋出的視頻看，其他公司追趕 Sora 模型的時(shí)間不多了。

免責(zé)聲明：本文只為提供市場(chǎng)訊息，所有內(nèi)容及觀點(diǎn)僅供參考，不構(gòu)成投資建議，不代表本站觀點(diǎn)和立場(chǎng)。投資者應(yīng)自行決策與交易，對(duì)投資者交易形成的直接或間接損失，作者及本站將不承擔(dān)任何責(zé)任。！

Tag：Sora

你可能感興趣的文章

幣名
最新價(jià)格
24H漲幅
BTC
比特幣

$ 95846.87￥ 680953.67

-0.16%
ETH
以太坊

$ 3196.17￥ 22707.5

-0.44%
USDT
泰達(dá)幣

$ 0.999￥ 7.0974

-0.03%
XRP
瑞波幣

$ 2.2686￥ 16.1174

+0.45%
BNB
幣安幣

$ 936.32￥ 6652.17

-0.64%
SOL
Solana

$ 141.26￥ 1003.59

-0.45%
USDC
USD Coin

$ 1.0005￥ 7.1081

-0.01%
TRX
波場(chǎng)

$ 0.2926￥ 2.0788

-1.48%
DOGE
狗狗幣

$ 0.1619￥ 1.1502

-0.92%
ADA
艾達(dá)幣

$ 0.4964￥ 3.5267

-1.33%

幣圈快訊

F2Pool聯(lián)創(chuàng)Wang Chun向幣安存入3,500枚ETH，價(jià)值約1,120萬美元
2025-11-17 16:36
據(jù) Nansen 監(jiān)測(cè)，過去 20 分鐘內(nèi)，F(xiàn)2Pool 聯(lián)創(chuàng) Wang Chun 向幣安存入 3,000 枚 ETH，價(jià)值約 960 萬美元。隨后該地址又向幣安轉(zhuǎn)入 500 枚 ETH，累計(jì)存入 3,500 枚 ETH，價(jià)值約 1,120 萬美元。目前該錢包仍持有 1,000 枚 ETH，價(jià)值約...
F2Pool聯(lián)創(chuàng)WangChun過去30分鐘將3500枚ETH存入幣安
2025-11-17 16:33
據(jù)Nansen監(jiān)測(cè)，F(xiàn)2Pool聯(lián)創(chuàng)WangChun相關(guān)錢包過去30分鐘分兩批將3,500枚ETH存入幣安，他首先轉(zhuǎn)入3,000枚ETH（價(jià)值9,600萬美元），隨后又轉(zhuǎn)入500枚ETH，目前其錢包內(nèi)還持有1,000枚ETH。
StraitsX向Binance轉(zhuǎn)移300萬XUSD，價(jià)值300萬美元
2025-11-17 16:32
據(jù)Arkham數(shù)據(jù)，在16:24，StraitsX向Binance轉(zhuǎn)移300萬XUSD。
過去24小時(shí)全網(wǎng)爆倉(cāng)6.16億美元，多單爆倉(cāng)3.95億美元，空單爆倉(cāng)2.2億美元
2025-11-17 16:30
據(jù)Coinglass數(shù)據(jù)，過去24小時(shí)全網(wǎng)爆倉(cāng)6.16億美元，多單爆倉(cāng)3.95億美元，空單爆倉(cāng)2.2億美元。其中比特幣多單爆倉(cāng)1.37億美元，比特幣空單爆倉(cāng)1.09億美元，以太坊多單爆倉(cāng)1.29億美元，以太坊空單爆倉(cāng)3,940.21萬美元。此外，最近24小時(shí)，全球共有148,248人被爆倉(cāng)，最大單筆爆倉(cāng)單發(fā)生在Hyperliquid-BTC-USD價(jià)值3060.26萬美元。
BTC突破96,000美元，24小時(shí)漲幅0.07%
2025-11-17 16:25
據(jù) HTX 行情數(shù)據(jù)顯示，BTC 突破 96,000 美元，現(xiàn)報(bào) 96,000.00 美元，24 小時(shí)漲幅 0.07 %。

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

還未開放，Sora怎么就震驚了互聯(lián)網(wǎng)圈？

Sora「預(yù)告片」驚爆眾人

OpenAI 提出「視覺補(bǔ)丁」數(shù)據(jù)集

Altman 當(dāng)二傳手為網(wǎng)友測(cè)試

你可能感興趣的文章

AI概念幣種市值已突破120億美元！Sora熱潮下LPT飆漲150%

Sora Ventures投資Bitcoin Magazine 300萬！成立首個(gè)比特幣生態(tài)基金

AI智能體是加密貨幣的下一個(gè)重要催化劑

ApeChain選中Horizen Labs！采用Arbitrum技術(shù)開發(fā) 主攻游戲

幣安將在2/20下架XMR、MULTI、ANT、VAI！不同時(shí)代敘事的終點(diǎn)

Jeremy Grantham：美國(guó)經(jīng)濟(jì)衰退將至、AI泡沫將破滅、比特幣是騙局

BNB Chain展望2024：One BNB策略整合BSC、opBNB、BNB Greenfield

超越技術(shù)的界限：AI+Web3 的未來發(fā)展之道

超越技術(shù)的界限：AI+Web3的未來發(fā)展之道

拆解ZetaChain：為何說2024是“鏈抽象”賽道發(fā)展大年？

熱門幣種

BTC

ETH

USDT

XRP

BNB

SOL

USDC

TRX

DOGE

ADA

幣圈快訊

區(qū)塊鏈百科

最新資訊

還未開放，Sora怎么就震驚了互聯(lián)網(wǎng)圈？

Sora「預(yù)告片」驚爆眾人

OpenAI 提出「視覺補(bǔ)丁」數(shù)據(jù)集

Altman 當(dāng)二傳手為網(wǎng)友測(cè)試

你可能感興趣的文章

AI概念幣種市值已突破120億美元！Sora熱潮下LPT飆漲150%

Sora Ventures投資Bitcoin Magazine 300萬！成立首個(gè)比特幣生態(tài)基金

AI智能體是加密貨幣的下一個(gè)重要催化劑

ApeChain選中Horizen Labs！采用Arbitrum技術(shù)開發(fā) 主攻游戲

幣安將在2/20下架XMR、MULTI、ANT、VAI！不同時(shí)代敘事的終點(diǎn)

Jeremy Grantham：美國(guó)經(jīng)濟(jì)衰退將至、AI泡沫將破滅、比特幣是騙局

BNB Chain展望2024：One BNB策略整合BSC、opBNB、BNB Greenfield

超越技術(shù)的界限：AI+Web3 的未來發(fā)展之道

超越技術(shù)的界限：AI+Web3的未來發(fā)展之道

拆解ZetaChain：為何說2024是“鏈抽象”賽道發(fā)展大年？

熱門幣種

幣圈快訊

區(qū)塊鏈百科

最新資訊

還未開放，Sora怎么就震驚了互聯(lián)網(wǎng)圈？

AI概念幣種市值已突破120億美元！Sora熱潮下LPT飆漲150%

Sora Ventures投資Bitcoin Magazine 300萬！成立首個(gè)比特幣生態(tài)基金

ApeChain選中Horizen Labs！采用Arbitrum技術(shù)開發(fā) 主攻游戲

幣安將在2/20下架XMR、MULTI、ANT、VAI！不同時(shí)代敘事的終點(diǎn)

Jeremy Grantham：美國(guó)經(jīng)濟(jì)衰退將至、AI泡沫將破滅、比特幣是騙局

BNB Chain展望2024：One BNB策略整合BSC、opBNB、BNB Greenfield

拆解ZetaChain：為何說2024是“鏈抽象”賽道發(fā)展大年？