在公開(kāi)預(yù)覽過(guò)去10個(gè)月后,在OpenAI的12天連更計(jì)劃的第3天,視頻生成大模型Sora終于正式登場(chǎng)。12月10日,OpenAI宣布正式向用戶開(kāi)放Sora,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。應(yīng)用落地也來(lái)得很快。作為“視頻版GPT”,OpenAI已開(kāi)始向電影制片廠、媒體高管以及經(jīng)紀(jì)公司示好,還允許一些藝術(shù)家、知名演員和導(dǎo)演試用該服務(wù)。
巨強(qiáng)巨貴
今年2月,OpenAI首次向外界展示了Sora的存在。據(jù)其介紹,Sora可以直接輸出長(zhǎng)達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。OpenAI在官網(wǎng)上公布了數(shù)十個(gè)視頻demo,并不斷在社交平臺(tái)X上放出由Sora生成的視頻。這些內(nèi)容被集合推送至OpenAI的TikTok賬號(hào)上,短短5天內(nèi)便獲得了51.3萬(wàn)次贊,粉絲數(shù)也漲至10.6萬(wàn)。
Sora不僅為OpenAI帶來(lái)了大量粉絲,也讓其估值進(jìn)一步提升。不過(guò),當(dāng)時(shí)這家公司表示,Sora在短期內(nèi)不會(huì)向大眾開(kāi)放,因?yàn)槠?ldquo;技術(shù)仍存在一些缺陷,包括一些空間問(wèn)題”。
在將近10個(gè)月之后,萬(wàn)眾矚目下,Sora終于在此次系列發(fā)布中重磅登場(chǎng)。OpenAI表示,2月發(fā)布Sora之后,團(tuán)隊(duì)開(kāi)發(fā)了其新版本Sora Turbo,其性能有了顯著進(jìn)步,即日起該版本將作為獨(dú)立產(chǎn)品提供給ChatGPT Plus和Pro用戶。
相比初次亮相的Sora,Sora Turbo生成效率顯著提升,能夠通過(guò)文本直接生成最多20秒或最高分辨率1080P的視頻,成為目前全球生成時(shí)長(zhǎng)最長(zhǎng)的視頻模型之一。該模型支持文本加圖片或視頻的輸入,可生成特定視頻內(nèi)容,并能夠編輯生成視頻,使生成效果更加可控。
此外,Sora Turbo還有多種視頻編輯工具,包括替換、刪除或重新構(gòu)想視頻中的元素;找到并隔離最佳幀,然后向任一方向延伸它們以完成場(chǎng)景;使用Loop剪輯并創(chuàng)建無(wú)縫重復(fù)的視頻以及一個(gè)名為Storyboard的選項(xiàng),用戶可以通過(guò)它詳細(xì)描述希望視頻在不同時(shí)間點(diǎn)發(fā)生的內(nèi)容,從而更好地指導(dǎo)一系列片段的生成。
定價(jià)方面,Sora Turbo將免費(fèi)提供給ChatGPT Plus和Pro用戶,月租20美元(約合人民幣145元)的Plus用戶,每月最多可以生成50個(gè)480P分辨率的優(yōu)先視頻;Pro訂閱者則最多可生成500個(gè)優(yōu)先視頻,普通視頻無(wú)限量生成,可下載無(wú)水印版視頻,對(duì)應(yīng)每月費(fèi)用為200美元(約合1450元)。
這一定價(jià)也引發(fā)了不同的聲音,有用戶直呼“太貴”,有用戶卻認(rèn)為“一分錢(qián)一分貨”。雖然當(dāng)前價(jià)格仍被部分用戶認(rèn)為偏高,但這已是OpenAI努力降低成本的結(jié)果。OpenAI還透露,他們計(jì)劃針對(duì)不同用戶類型開(kāi)發(fā)新的定價(jià)模式,并將于明年初推出。
視頻版GPT
目前,美國(guó)及其他市場(chǎng)的ChatGPT付費(fèi)用戶可以通過(guò)該網(wǎng)站開(kāi)始使用Sora,但在歐洲大部分地區(qū)和英國(guó)還需要一段時(shí)間才能使用,中國(guó)用戶依然受限。
不過(guò),由于實(shí)在是太火爆,Sora網(wǎng)站一度被擠到崩潰,OpenAI CEO山姆·奧特曼(Sam Altman)表示:“由于需求超出預(yù)期,我們將不得不間歇性地關(guān)閉新用戶注冊(cè),并且生成內(nèi)容的速度會(huì)在一段時(shí)間內(nèi)減慢。”
在技術(shù)路線上,目前,業(yè)界普遍猜測(cè)Sora的成功延續(xù)了OpenAI的Scaling law法則,即通過(guò)海量的數(shù)據(jù)、大量的算力,再加上大參數(shù)模型,最終“大力出奇跡”。OpenAI研究科學(xué)家Noam Brown在Sora Turbo發(fā)布后表示,Sora是scale(規(guī)模)力量最直觀的展示。山姆·奧特曼則表示,“大家可以將 Sora看作視頻版的GPT-1”。OpenAI還表示,Sora是一項(xiàng)理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù),是開(kāi)發(fā)能夠與物理世界互動(dòng)模型的重要一步。
中國(guó)銀河證券研究院的報(bào)告也顯示,Sora對(duì)算力需求呈指數(shù)級(jí)增長(zhǎng)。其根據(jù)Sora參數(shù)規(guī)模推演出的訓(xùn)練單次算力需求或可達(dá)到2.6×10^24Flops,相當(dāng)于GPT-3175B的8.2倍。目前Sora還在初級(jí)階段,伴隨不斷迭代調(diào)優(yōu),其訓(xùn)練數(shù)據(jù)集規(guī)模將進(jìn)一步增大,未來(lái)算力需求也會(huì)大幅增加。
在國(guó)內(nèi),互聯(lián)網(wǎng)大廠和大模型公司也在紛紛跟進(jìn)視頻大模型這一賽道,包括字節(jié)跳動(dòng)、快手,今年發(fā)布視頻生成模型的公司還包括阿里云、Minimax、生數(shù)科技、智譜AI等公司。就在最近,騰訊混元大模型也宣布上線視頻生成能力,正式加入競(jìng)爭(zhēng)激烈的視頻生成賽道。
不過(guò),視頻生成模型領(lǐng)域雖然看起來(lái)火熱,也面臨著非常嚴(yán)峻的挑戰(zhàn)。近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,李彥宏在內(nèi)部講話中稱,Sora這種視頻生成模型的投入周期太長(zhǎng),10年、20年都可能拿不到業(yè)務(wù)收益,無(wú)論多火爆,百度都不去做。
商業(yè)化空間打開(kāi)
自今年2月首次預(yù)告Sora以來(lái),OpenAI便開(kāi)始與電影制片廠、媒體高管以及經(jīng)紀(jì)公司展開(kāi)會(huì)談。OpenAI還允許一些藝術(shù)家、知名演員和導(dǎo)演試用該服務(wù)。市場(chǎng)預(yù)計(jì),Sora的發(fā)布會(huì)對(duì)視頻制作領(lǐng)域帶來(lái)革命性的變化,無(wú)論是電影制作、廣告、游戲開(kāi)發(fā)還是社交媒體,都可以借助視頻生成大模型降低視頻創(chuàng)作的門(mén)檻,產(chǎn)生新的機(jī)遇。
對(duì)于企業(yè)和內(nèi)容創(chuàng)作者而言,視頻制作往往是一項(xiàng)繁瑣且耗時(shí)的任務(wù)。借助視頻生成大模型,用戶只需提供簡(jiǎn)短的文本描述,即可自動(dòng)生成高質(zhì)量視頻。“這不僅節(jié)省了大量時(shí)間,也大幅降低了對(duì)專業(yè)技能的要求,即使沒(méi)有視頻制作經(jīng)驗(yàn)的用戶也能輕松創(chuàng)建專業(yè)級(jí)內(nèi)容。視頻生成大模型的廣泛應(yīng)用有望改變廣告營(yíng)銷(xiāo)、產(chǎn)品推廣和教育輔導(dǎo)等多個(gè)行業(yè)的內(nèi)容創(chuàng)作流程,推動(dòng)生產(chǎn)力的升級(jí)。”一位視頻后期制作人員對(duì)北京商報(bào)記者表示。
“國(guó)產(chǎn)多模態(tài)視頻大模型歷經(jīng)一年多迭代,已逐步提升對(duì)內(nèi)容制作的賦能效果,拓寬了創(chuàng)作邊界,預(yù)計(jì)后續(xù)AI影視領(lǐng)域商業(yè)化空間將打開(kāi)。”開(kāi)源證券表示。不過(guò),業(yè)內(nèi)人士也向北京商報(bào)記者表示,視頻生成大模型擁有樂(lè)觀的商業(yè)化前景的同時(shí),從可用度而言,還未到大規(guī)模商用的階段,仍有很多技術(shù)難點(diǎn)需要克服,比如對(duì)物理世界規(guī)律的理解、高分辨率、鏡頭動(dòng)作連貫性以及時(shí)長(zhǎng)等,都是行業(yè)激戰(zhàn)且有待提升的重要維度。
此外,從AI誕生之初,對(duì)于版權(quán)的問(wèn)題就爭(zhēng)論不休。有從事設(shè)計(jì)行業(yè)的人士對(duì)北京商報(bào)記者直言:“Sora確實(shí)厲害,但AI生成視頻內(nèi)容質(zhì)量和版權(quán)問(wèn)題怎么解決?會(huì)員免費(fèi)用,那創(chuàng)作者收益呢?這些問(wèn)題不解決,技術(shù)再牛也難長(zhǎng)久。”
北京商報(bào)記者 趙天舒
本網(wǎng)站所有內(nèi)容屬北京商報(bào)社有限公司,未經(jīng)許可不得轉(zhuǎn)載。 商報(bào)總機(jī):010-64101978 媒體合作:010-64101871
商報(bào)地址:北京市朝陽(yáng)區(qū)和平里西街21號(hào) 郵編:100013 法律顧問(wèn):北京市中同律師事務(wù)所(010-82011988)
網(wǎng)上有害信息舉報(bào) 違法和不良信息舉報(bào)電話:010-84276691 舉報(bào)郵箱:bjsb@bbtnews.com.cn
ICP備案編號(hào):京ICP備08003726號(hào)-1 京公網(wǎng)安備11010502045556號(hào) 互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號(hào)