從Chatgpt到文生視頻Sora,AI給文化產業帶來了哪些機遇和挑戰?
一、從chatgpt1.0 到文生視頻Sora,人工智能都發生了哪些變化?
2022年11月30日一家名叫OpenAI企業上線了一款實驗性產品——ChatGPT3.5。這款由OpenAI開發的聊天機器人,不僅能夠回答各種問題,還能夠創作詩歌、故事、歌曲、代碼等內容,甚至能夠模仿名人的風格和語氣。它的出現,開啟了生成式AI領域的新篇章。
2023年2月OpenAI推出GPT的API編程接口,只要接上API就能夠做自己的AI應用,甚至可以搭建一個大模型。編程接口開放后,“套殼AI”如雨后春筍,中國“大模型之戰”正蓄勢爆發。復旦大學發布中國首個類ChatGPT模型,百度、阿里云、網易等企業,相繼宣布研發類似ChatGPT的相關產品。
3月15日,OpenAI發布了千億級參數的多模態版本GPT4.0;
百度在3月16日發布中國首個生成式語言大模型文心一言。
緊跟步伐,AI繪圖工具Midjourney更新了第五版它生成的1990年代背景的情侶照徹底引爆中文互聯網。
OpenAI的天使投資人馬斯克聯合1100多名專家發表公開信,要求所有AI實驗室立即暫停6個月,意大利政府下令封鎖ChatGPT,三星電子的員工因ChatGPT,造成公司機密的泄露。350名全球人工智能專家聯名警告“AI或給人類帶來滅絕性的風險”。
2023年8月份OpenAI推出ChatGPT企業版,越來越多的組織卷入到大變革中,中國大模型亦在加速,百度“文心一言”向公眾開放服務,騰訊“混元大模型”進入應用內測,智譜華章上線AI助手“智譜清言”,到2023年9月阿里云的“通義千問”大模型正式向公眾開放,中國的大模型超過了100個。
2024年2月16日凌晨(美國當地時間2月15日),開發出ChatGPT的OpenAI團隊在官網上對外放出數段視頻,這些視頻全部由全球首個文生視頻大模型——Sora根據用戶提示詞自動生成。
據Sora官網,其引發關注的一段視頻的提示描述為“一位時尚的女士漫步在東京街頭,街上充滿了溫暖的霓虹燈和生動的城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子,手中提著一個黑色手提包。她戴著太陽鏡,涂著紅色口紅。走路時自信而隨意。街道潮濕且反光,形成了彩色燈光的鏡面效果,許多行人來來往往。”
除上述視頻外,OpenAI在首頁一口氣展示了其余47部Sora自動生成的視頻。
證券研究機構表示“Sora的發布也意味著AGI有望加速到來,是AGI實現過程中的重大里程碑事件,而不僅僅是視頻生成?!眱H需要一段文字,Sora模型就可以生成一段60s的1080p視頻,包含不同景別鏡頭。不由得讓人感嘆——“真實和虛幻的差別,到底還有多大距離?”
二、AI的技術迭代對文化產業哪些具體的行業和領域帶來了機遇和挑戰?
自Sora問世,引爆了國內各行各業的關注,三川匯文化產業(ID:schwhcy)綜合網上的各種評論和信息,分析起來,Sora技術,會對多數行業產生潛在影響,理論上可能顛覆影視制作、傳媒業、廣告創意、游戲設計、虛擬現實、教育等多個行業。但應用何時落地,距離真正商業化還有多遠,都暫未可知。
面對OpenAI的文生視頻沖擊,國內外業內專家和機構,有持開放擁抱的態度,有危機緊迫的態度,謹慎觀望的,還有積極進取努力趕超的。一起來看看Sora問世10天來,給業界帶來了哪些機遇和挑戰吧!
1.對短視頻行業比如字節跳動、抖音的影響:
Sora發布,最直觀的影響就是AGI視頻創業公司。對于字節跳動來說,Sora的出現無疑是對于剪映的一大威脅。就在Sora問世的一周前,原抖音集團CEO張楠卸任,轉而投入剪映,反映出抖音對于AIGC工具的重視。隨著Sora的不斷發展,剪映如何才能學習Sora并創新,成為當務之急。
近期有市場消息稱,字節跳動在Sora引爆文生視頻賽道之前,已在研發一款名為“Boximator”的創新性視頻模型,相當于中文版Sora。
對此,字節跳動相關人士回應證券時報記者表示,Boximator只是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。
除此之外,Sora類AI模型對于好萊塢以及電影、電視、廣告等領域的影響是最直觀的。
把現有的短視頻簡單分為兩類,一類由真人出鏡,往往真人就是一個賬號甚至一家公司的“核心資產”,Sora對這類內容的沖擊并不大;另一類由素材集合而成,考驗拍攝、創意能力。Sora的出現,將大幅提升這類視頻的生產效率。
從AI 制作視頻的流程上來看,當前的Sora需要先輸入一段文字,隨后再生成視頻,視頻的原創性還是在依賴著創作者的審美,Sora的工具屬性更加突出。
比起原創內容,Sora的優勢更在于,那些需要耗費大量人力物力的特效片段。所以,也有網友預測,雖然未來視頻制作流程中的剪輯師、特效師等后期崗位會面臨更為嚴峻的處境。但過往那些受限于拍攝成本、拍攝技術的內容,則會更受關注。
理想的情況下,Sora未來能夠代替更多機械、重復的工作,使得創作者可以集中精力于創新的、深度的解讀,給文化消費者們提供更優質的內容。此外,由于AI的理解內容更加偏向于輸入“關鍵詞”,而非劇本。所以在未來,如何創作出適合AI 理解的劇本,從而生成視頻,也是值得關注的問題。
綜合多位業內人士的觀點,在類型上,目前Sora對真人出鏡類短視頻影響較小,對動漫類、解說類內容影響比較大,甚至會淘汰很多沒有創意、只蹭熱點的批量做號公司。在崗位上,部分做機械性重復工作的人員可能會面臨淘汰,但創意類人員會被提至更高位置。Sora的出現降低了短視頻創作門檻,會有越來越多的人加入,跟他們搶奪流量和變現機會。
2.對影視動畫行業的影響
中國香港青年導演朱智立告訴藍鯨財經記者,“它(Sora)對電影行業的影響只是一個時間問題,因為它已經把畫面做到非常真實、有細節,包括一個女人在東京街頭的畫面,連臉上的雀斑都能做到非常真實。”
朱智立向藍鯨財經表示,Sora對宣傳片、廣告片的影響會更大,“電影還有劇本、情節、臺詞等復雜因素,而在廣告、宣傳片行業,沖擊可能會更快到來。如果提示詞可以細節到分鏡,那AI不僅僅是幫助導演畫分鏡和視覺參考圖了,而是直接可以做成更高效的動態分鏡預覽,或者等技術更成熟時可以直接用來做成影視作品?!?/p>
但360公司創始人周鴻祎則發文表示:“今天很多人談到Sora對影視工業的打擊,我倒不覺得是這樣,因為機器能生產一個好視頻,但視頻的主題、腳本和分鏡頭策劃、臺詞的配合,都需要人的創意,至少需要人給提示詞。一個視頻或者電影是由無數個60秒組成的。今天 Sora 可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆,但它不一定那么快擊敗TikTok,更可能成為 TikTok的創作工具。”
3.對文旅行業的影響
Sora表現出來的能力在最淺表層次將從三個層面影響文旅產業。
其一,文旅營銷和宣傳推廣。文旅營銷對視頻產品和社交平臺正處于深度依賴階段,這一AI新技術必將對文旅產業產生長遠影響。無論是圖文時代的《孤獨星球》還是PC互聯網時代的馬蜂窩、窮游,還是現在的抖音、快手,圖文、視頻都是文旅業營銷宣傳最為依賴的介質,這些內容是我們認識世界最重要的資料之一。但昂貴的制作成本讓很多美景、美食、目的地不被大眾所熟知。Sora將帶來內容創作與品牌傳播的革命。Sora模型可以為文旅產業提供全新的內容創作工具。
對宣傳方來說,文旅宣傳的成本有可能極大降低。無論是目的地營銷,還是景區、酒旅企業,在視頻宣傳制作上的巨大投入,將來有可能用一段幾百字的文字就可以搞定,而且實現制作更精良、更富想象力的效果。
對于文旅機構目的地及企業方,可以利用Sora生成吸引人的宣傳視頻,這些視頻可以展示目的地的美景、文化活動和特色體驗。
對于文旅產業的內容創作方,目前視頻制作普遍存在的成本高、自然條件受限、拍攝技術有限等缺點,利用AI技術可以更快速地制作出高質量的宣傳視頻、旅游攻略、文化展示等內容,而無需昂貴的實地拍攝。這將極大地降低營銷成本,縮短制作周期,同時提高內容的吸引力和傳播效率。文字與視頻相比,不但成本極低,而且更有細膩、豐富的表現力。若文生視頻技術不斷突破物理表現的瓶頸,達到與文字高度一致的表現力,文本的競爭力將成為文旅宣傳的核心競爭力。
對平臺方而言,聚合文旅營銷業務將變得更加困難。目前,文旅種草的商業投放正在成為以小紅書、抖音為代表的社交平臺的重要商業板塊。但在AI時代,隨著普通創作者在技術加持下將大規模涌現,且創作能力可能與專業團隊不相上下,用戶的需求和注意力將更加分散,平臺目前基于大數據對旅游需求的分析和對目標人群的鎖定將愈發困難,在此基礎上與供應鏈商家的合作也將面臨困境。
對消費者來說,旅游信息將會爆炸性增長,但對于決策來說,這未必一定是好事。因為,Sora時代的文旅也將面臨一個巨大的挑戰,那就是“真實性”。
其二,可以推動虛擬現實體驗提質升級。文旅的體驗受制于時間和空間兩個維度,時間上大多只能依托于自然和文化資源,品味當下的呈現而無法沉浸式體驗其歷史和未來,空間上受制于大投資且長周期場景搭建和資源開發。將來Sora也許可以根據用戶的個性化需求生成定制化的沉浸式體驗內容,如根據用戶的旅行偏好推薦旅游路線,或者為游客提供虛擬旅游體驗。這將增強游客的互動性和參與感,提升旅游體驗。在文旅產業中,Sora可以用于創建虛擬現實(VR)和增強現實(AR)體驗,讓游客在不離開家的情況下就能預覽旅游目的地,增強旅游決策的互動性和沉浸感。
其三,可以更容易搭建呈現沉浸式文博與文化場景。對于文化遺產的保護和利用,Sora可以幫助創建歷史場景的復原視頻,讓游客更直觀地了解歷史和文化,提高教育的趣味性和參與度。我們到了故宮只能橫斷面地感受歷史的斷層,而無法輕易穿越。未來,Sora加上VR設備將使我們輕易實現西部世界中的沉浸感。比如,我想看看一百年前的故宮,一百年后的故宮,以及三百年疊加的影像是什么樣。時下,文旅產業可能只能用高昂的制作成本來表現些許的細枝末節,從成本和資源限制上可能根本無法實現Sora這樣的表現能力。如果能夠大規模實現,一個場景接上大模型,一個虛擬體驗設備就可以讓千人千面的體驗實現,試想,迪士尼耗資五億美元的飛躍地平線還有競爭力嗎?
綜上,以上這些認識也許還只是十分淺表的皮毛,對文旅業的影響也許遠不止如此。
4.對經濟形態、生產力和就業的影響
Sora 釋放出的生產力浪潮,將直接影響千萬人的就業和生計,整個社會的運行也將發生深層次的變革。
一是給市場主體生存帶來新的競爭壓力。依靠 AI 生產的視頻、圖片等內容將變得極為便宜,這必定會擠壓現有從業者的生存空間。數據資產入表后,數據資源的貨幣價值將大幅提升,這將使得數據相關企業的盈利能力和競爭力增強,而傳統的影視制作企業將面臨更大的成本壓力和市場挑戰。
二是推動更多傳統行業實現數字化轉型?;谏墒絻热莸男滦蛫蕵沸问健⒂螒蚧拥纫矊映霾桓F,創造出新的經濟增長點。文化大數據的應用將為文化產業帶來新的增長空間,促進文化和科技、文化和旅游、文化和教育等領域的深度融合,提升文化的創新力和影響力。
三、中國版的Sora在哪?
我們必須正視Sora所帶來的警示。中國絕不能在核心科技上失去優勢和話語權。要知道,在兩次工業革命中,正是曾經的科技落后導致我們付出了巨大的代價。今天,中國同樣承受不起在AI賽道上的落后。所以,從國家層面到企業和個人,我們必須迎難而上,主動擁抱AI變革。
中國的AI大模型同樣早已在文生視頻賽道布局。2023年3月,阿里達摩院就放出了“文本生成視頻大模型”,并在開源模型平臺上對外測試。百度文心一言則在正式發布的支持多模態文本生成視頻能力基礎上,在去年8月又上線了文本轉視頻原生插件。不過,這些AI大模型生成的視頻與Sora相比還有一定差距,一方面是體現在持續時長上,絕大多數視頻時長還在4-10秒左右,其連貫性也有所不足。另一方面是鏡頭的組合,絕大多數視頻都是單鏡頭;而Sora已實現了在一個視頻里面,多角度鏡頭的組合。例如,在剪影動畫中,視頻從一只狼對著月亮嚎叫,直到它找到狼群,切換了不同景別的多個鏡頭。
面對 Sora 這樣顛覆性的新技術,我們不能因循守舊,而要順應其發展趨勢,轉換思維模式,全面擁抱 AI。需要及早布局,從政策引導到科研布局再到產業扶持,形成系統性“加速器”,幫助 AI 等前沿技術更快落地應用,使其惠及廣大人民。
一方面,我們要加強對 Sora 等新技術的研究和監管,防止其濫用和滋生。Sora 雖然具有強大的視頻生成能力,但也可能被用于制造虛假和誤導性的信息,對社會和個人造成傷害。我們要建立健全的技術評估和審核機制,規范和引導 Sora 等新技術的合理使用,保障數據安全和隱私權,維護社會公序良俗和道德規范。
另一方面,我們要加強對 Sora 等新技術的創新和應用,提升其價值和效益。Sora 雖然具有強大的視頻生成能力,但也需要不斷地優化和改進,以適應不同的場景和需求。我們要鼓勵和支持 Sora 等新技術的研發和創新,拓展其應用領域和范圍,提升其質量和效率,使其能夠為社會和經濟發展提供“新質生產力”。
具體來說:
在制度層面上,要加快新舊動能轉換,形成有利于創新的政策環境和市場規則。
在資金支持上,要加大前沿技術的投入力度,特別是重點扶持初創企業。
在產業協同上,要打通從科研到應用的孵化鏈條,讓更多 AI 創新成果轉化為現實生產力。
在個人素質上,要強化全民對新技術的理解和適應能力,這是應對變革的社會基礎。
只有這樣,中國才能在新一輪科技革命和產業變革中立于不敗之地,最終成為領頭羊。
結語
目前的Sora仍處于1.0階段,在處理精細的背景時常常出現力不從心的情況,但沒人會否認Sora對于AGI實現路程上的里程碑地位。AI風口下,Sora的出現讓我們看到了AGI實現的可能,也逼迫著同行業內不斷創新發展。
盡管海內外文生視頻的技術水平尚有差異,普遍預測,2024年人工智能向多模態模型演變將成為重要的趨勢,Sora的出現更是將全球目光聚焦于視頻生成領域,有望大幅降低短視頻等內容創作門檻。視頻、游戲、動畫等創作公司已密切關注Sora和積極布局相關文生視頻應用。2024年大模型一定會逐步進入到百行千業,與具體業務和產品功能相結合,危機挑戰與行業賦能并存。讓我們拭目以待,大模型發展如何為新質生產力賦能!