2022年,是中國(guó)人追逐群星的里程碑之年。
今年10月31日,中國(guó)天宮空間站的第二個(gè)科學(xué)實(shí)驗(yàn)?zāi)K——夢(mèng)天實(shí)驗(yàn)艙,搭載長(zhǎng)征五號(hào)B遙四運(yùn)載火箭發(fā)射升空。隨著之后天實(shí)驗(yàn)艙成功與之前發(fā)射的天和核心艙完成精準(zhǔn)對(duì)接,中國(guó)空間站歷史性地完成了“合體”。至此,中國(guó)空間站距離建成僅剩一步之遙。
從天舟四號(hào)到天舟五號(hào),從問(wèn)天艙到夢(mèng)天艙,從神舟十四號(hào)到神舟十五號(hào),取得一系列航天成果的2022,同時(shí)也是中國(guó)載人航天工程立項(xiàng)實(shí)施30周年。三十年奮進(jìn)勃發(fā),讓中國(guó)人史無(wú)前例地接近星辰,接近宇宙中的無(wú)限可能。
而在科技賽場(chǎng)的另一條關(guān)鍵跑道上,2022同樣至關(guān)重要。近日,新華社與百度文心一格聯(lián)合推出了一支AIGC視頻——《AI描繪天宮盛宴》。這支視頻畫(huà)面全部由AI自動(dòng)生成,用充滿中國(guó)韻味的筆觸,回顧了中國(guó)載人航天的三十年輝煌歷程。眾多網(wǎng)友感嘆,AI生成內(nèi)容竟然在極短時(shí)間內(nèi)就達(dá)成了這種效果,實(shí)在難以想象。
2022年,被業(yè)界稱為AIGC元年。伴隨著AI作畫(huà)大規(guī)模商業(yè)化落地,這一能力開(kāi)始為全球用戶所接受。AIGC的飽含巨大商業(yè)價(jià)值的下一站,就是AI生成內(nèi)容。而在AIGC的“宇宙探索”中,中國(guó)人同樣不落人后。以百度文心大模型為代表的中國(guó)力量,正在帶領(lǐng)全球AI產(chǎn)業(yè)接近AIGC的無(wú)限可能。
2022年,文心大模型在AI生成內(nèi)容這條賽道上不停探索,給出了一系列讓人眼前一亮的成績(jī)。在其背后,既可以看到大模型在AI作畫(huà)領(lǐng)域的技術(shù)趨于完備,又可以看到中文、中國(guó)文化背景下的AIGC全面發(fā)展。面向AIGC的群星,文心大模型已經(jīng)成為中國(guó)AI產(chǎn)業(yè)的一座“空間站”。
探索AIGC更多可能,文心大模型的成績(jī)單
在全球經(jīng)濟(jì)普遍遇冷的2022,AI技術(shù)卻是一片繁榮。從AI作畫(huà)到AI對(duì)話,各種AI技術(shù)創(chuàng)新在全球范圍內(nèi)火爆出圈。而所有AI能力中最讓人看好其商業(yè)前景的,則是AIGC的下一站——AI生成內(nèi)容。
我們處在一個(gè)被短視頻顛覆和重構(gòu)的時(shí)代。短視頻平臺(tái)已經(jīng)在全球范圍內(nèi)形成了用戶最多、影響力大的媒介形式。AI與視頻的結(jié)合,正變成新的巨型風(fēng)口。在2022年,百度文心大模型先后帶來(lái)了一系列視頻生成作品,其完善的效果與創(chuàng)意性地表達(dá),贏得了業(yè)界與公眾的一致認(rèn)可。
在百度2022萬(wàn)象大會(huì)期間,數(shù)字人度曉曉作詞作曲演唱的MV《啟航星》正式上線。這也成為成為首支全AIGC生成的音樂(lè)MV?!秵⒑叫恰稭V視頻依托百度推出的AI藝術(shù)和創(chuàng)意輔助平臺(tái)——文心一格,根據(jù)歌詞自動(dòng)生成畫(huà)面。其不僅探索了數(shù)字人、AI生成內(nèi)容等技術(shù)的邊界,更為MV制作、AI與音樂(lè)產(chǎn)業(yè)結(jié)合展現(xiàn)出了清晰的路徑。
10月20日,《人民日?qǐng)?bào)》發(fā)布AI根據(jù)二十大報(bào)告中部分詞語(yǔ)描繪的未來(lái)中國(guó)圖景視頻,該視頻由百度飛槳、文心一格提供技術(shù)支持。根據(jù)內(nèi)容描述,文心大模型準(zhǔn)確描繪出了未來(lái)中國(guó)的發(fā)展圖卷。筆觸老練自然,完全沒(méi)有傳統(tǒng)意義上認(rèn)為AIGC內(nèi)容會(huì)有的生澀感與不和諧。
等到《AI描繪天宮盛宴》到來(lái),我們可以看到文心大模型生成的視頻內(nèi)容更加具有整體性風(fēng)格,畫(huà)面調(diào)動(dòng)也更有邏輯性,并且內(nèi)容能夠與中國(guó)傳統(tǒng)文化,比如《西游記》中蟠桃盛宴,進(jìn)行有機(jī)且巧妙的結(jié)合。
在這一哥哥AI生成內(nèi)容背后,我們可以看到文心大模型走出了兩條路:技術(shù)之路,與文化之路。
AI生成內(nèi)容的技術(shù)難點(diǎn),正被一個(gè)個(gè)打破
“最先進(jìn)的 AI 動(dòng)畫(huà)生成技術(shù)在中國(guó)?!?/p>
這句話,是今年8月文心ERNIE-ViLG 2.0模型通過(guò)百度API服務(wù)的方式進(jìn)行開(kāi)放公測(cè)后,一位外國(guó)開(kāi)發(fā)者留在評(píng)論區(qū)的。幾個(gè)月之后,這樣的肯定依舊令我們振奮。數(shù)年前,絕大部分人可能會(huì)覺(jué)得中國(guó)難以在AI生成內(nèi)容中實(shí)現(xiàn)領(lǐng)先,但現(xiàn)在這一切已經(jīng)做到了。
究其根本,在于文心大模型持續(xù)面向AIGC的技術(shù)挑戰(zhàn)發(fā)起一波波沖鋒。今年在文心大模型支持的多部破圈視頻里,我們可以看到其中的技術(shù)力表現(xiàn)持續(xù)升級(jí)。簡(jiǎn)單感、不流暢、缺乏創(chuàng)意風(fēng)格等AI生成內(nèi)容的傳統(tǒng)問(wèn)題,正在一個(gè)個(gè)被文心打破。
在這背后,是文心大模型ERNIE-ViLG 2.0跨模態(tài)圖文生成能力的幫助和支持?;贓RNIE-ViLG 2.0,可以實(shí)現(xiàn)從文本內(nèi)容到視頻內(nèi)容中,轉(zhuǎn)化的可控性與細(xì)節(jié)描述能力不斷提升。而這源于秉承著百度在文心大模型當(dāng)中探索的知識(shí)增強(qiáng)方向,為ERNIE-ViLG 2.0找到了核心的升級(jí)方向。ERNIE-ViLG 2.0采用基于知識(shí)增強(qiáng)算法的混合降噪專(zhuān)家建模,是全球首個(gè)將知識(shí)增強(qiáng)與AIGC相互結(jié)合的大模型。其最終表現(xiàn),在權(quán)威評(píng)測(cè)集 MS-COCO 和人工盲評(píng)上均超越了 Stable Diffusion、DALL-E 2等主流模型,在AI生成內(nèi)容等方面,取得全球業(yè)界的最佳效果,在語(yǔ)義可控性、圖像清晰度等方面均展現(xiàn)出了顯著優(yōu)勢(shì)。
從《AI描繪天宮盛宴》中,我們可以看到畫(huà)面可控性、復(fù)雜構(gòu)圖和細(xì)節(jié)刻畫(huà)能力都達(dá)到了新的水平高度。AI生成內(nèi)容不再是生成一幀幀圖片合成視頻,而是基于統(tǒng)一風(fēng)格,完整、連續(xù)地展現(xiàn)出了視頻全貌。這就是知識(shí)增強(qiáng)路徑為AIGC帶來(lái)的不同之處。
當(dāng)時(shí)間來(lái)到2023,中國(guó)AI行業(yè)、AI開(kāi)發(fā)者,以及廣大視頻創(chuàng)作者,將得到全球領(lǐng)先的AI生成內(nèi)容能力作為發(fā)展引擎——這就是文心大模型,這座“空間站”的戰(zhàn)略意義。
更懂中國(guó),更懂未來(lái)
另一方面,我們可以在《AI描繪天宮盛宴》看到一種我們非常熟悉的審美風(fēng)格,其神韻非常類(lèi)似1961年上海美術(shù)電影制片廠制作的《大鬧天宮》。那既是中國(guó)動(dòng)畫(huà)史的開(kāi)端,也是深刻國(guó)民DNA的文化記憶。
用這種審美意蘊(yùn)展現(xiàn)中國(guó)航天三十年的故事,是非常容易獲得國(guó)人共鳴,產(chǎn)生審美與文化認(rèn)同的。這一點(diǎn)其實(shí)非常重要,AIGC的最終價(jià)值在于文化傳播。試想一下,如果AI生成的內(nèi)容不懂一個(gè)國(guó)家的語(yǔ)言、文化、典故以及審美意味,那么最終做出來(lái)的內(nèi)容是否可能實(shí)現(xiàn)高效率、有認(rèn)同的傳播?
從這個(gè)角度看,中國(guó)的AI大模型發(fā)展與AIGC能力建設(shè)就顯得更加富有不可替代性。我們不能等到AI生成內(nèi)容大規(guī)模落地時(shí),一味照搬符合他國(guó)文化與英語(yǔ)語(yǔ)言習(xí)慣的內(nèi)容給中國(guó)觀眾看。而文心對(duì)中文數(shù)據(jù)、中文知識(shí)的學(xué)習(xí),以及對(duì)中國(guó)文化、中國(guó)審美的理解,則適當(dāng)?shù)靥钛a(bǔ)了這個(gè)空白。從文心一格對(duì)中文的理解能力,以及最終生成內(nèi)容中展現(xiàn)的中國(guó)意境,就可以看到目前適合中國(guó)環(huán)境的AIGC。我們不需要在基礎(chǔ)能力和技術(shù)上進(jìn)行漫長(zhǎng)的模仿與追趕,而是可以站在更高點(diǎn),直視AIGC最前沿、最令人激動(dòng)的可能性。
2022年,是中國(guó)人追逐群星之年,也是中國(guó)人追逐AIGC之夢(mèng)的一年。伴隨著更多AI生成內(nèi)容火爆出全,更多AIGC的行業(yè)化方案落地,更多平臺(tái)化能力開(kāi)放,文心一格正在打開(kāi)科技與文化融合創(chuàng)新的想象空間,文心大模型正在成為AIGC發(fā)展的新引擎。
在文心這座“空間站”,我們已能看到智能世界的浩瀚星空。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。