導讀:度曉曉還原富春山居圖 始料未及真相簡直令人震驚!而以上“戲劇化”的場景便是本次百度世界大會的亮點之一。在大會現場,“猜猜誰是數字人”環節,數字人度曉曉通過唱歌、問答展現在語音情緒識別、知識圖譜推演等方面的超能力;度曉曉與撒貝寧互動,展現“問一問功能”、為撒貝寧點咖啡。
百度AI數字人希加加現場作畫
不過,這并未難倒希加加。在AI系統對關鍵詞進行搜索匯總之后,希加加幾秒便完成了創作,更是收獲了撒貝寧“挺有創意”的評價。
而以上“戲劇化”的場景便是本次百度世界大會的亮點之一。在大會現場,“猜猜誰是數字人”環節,數字人度曉曉通過唱歌、問答展現在語音情緒識別、知識圖譜推演等方面的超能力;度曉曉與撒貝寧互動,展現“問一問功能”、為撒貝寧點咖啡。
度曉曉為撒貝寧點咖啡
值得注意的是,在見識了希加加的出色表現,百度CEO李彥宏也不禁感慨,“希加加,你比上次見面的時候更聰明了,看來你學習能力很強大啊”。
其實,AI數字人為何能讓李彥宏會產生“一日不見,如隔三秋”的感慨的個中原因,早在2022百度世界大會媒體預溝通會便已提前揭曉。
百度副總裁袁佛玉曾表示,與市面上其他數字人相比,百度AI數字人擁有可交互、有創造力、應用場景廣泛等特性。其中,百度飛槳的文心大模型負責為AI數字人提供技術支持。AI數字人對話能力使用的是對話生成大模型—文心 PLATO,PLATO有接近真人水平的對話能力,對話效果已經達到世界領先水平;數字人畫畫能力,使用的是文心大模型—跨模態圖文生成模型ERNIE-ViLG,使得數字人不僅可以根據個性化需求自動生成油畫、水彩畫、中國畫等多種風格的圖像,還能實現“看圖說話”的效果。
除了活靈活現的AI數字人外,百度通過人工智能技術對分散兩地的《富春山居圖》的“合璧”之舉更是讓人贊不絕口。
《富春山居圖》是元代畫壇宗師、“元四家”之首黃公望晚年的杰作,也是中國古代水墨山水畫的巔峰之筆,被譽為“中國十大傳世名畫”之一。該畫于清代順治年間遭火焚,從此斷為長短兩卷。前半卷被另行裝裱,重新定名為《富春山居圖·剩山圖》,現藏于浙江省博物館;后半卷被稱為《富春山居圖·無用師卷》,現藏于臺北故宮博物院。
在2022百度世界大會現場,百度首席技術官王海峰博士展示了基于文心大模型“補全”后的《富春山居圖》。
該畫得到了黃公望紀念館負責人毛傳鑌的高度評價:文心大模型補全的《富春山居圖》“與現存真跡風格一致,使兩岸畫卷走出博物館實現了合璧,光線風格統一,山水脈絡和諧,不僅符合原畫審美特點,視覺上還同樣具有觀賞價值”。
值得注意的是,相比于用AI復原老照片、讓古畫中的人物“活”起來等“常規操作”,此次應用百度文心大模型“補全”的《富春山居圖》在互動形式上則更具特色。
其亮點在于每個人都可以根據自己的想法參與《富春山居圖》“虛擬修復”工作,只需不到1秒鐘,在中間空白處簡單勾勒幾筆,文心大模型就能自動“補全”畫卷,人人都能像專業畫家一樣畫出自己心中的山水。
文心大模型助力《富春山居圖》“山水合璧”
然而,短短1秒鐘的“虛擬修復”時間,是團隊努力跨越多道關卡后的結果。在清晰度上,百度針對《富春山居圖》實現了高清尺寸的補全,生成的畫作更加逼真,具備了更高的藝術觀賞性;在還原度上,在只有一幅樣本的條件下,對《富春山居圖》進行高度還原,對模型的遷移學習能力要求極高;在參與度上,由于不同用戶輸入的筆觸千變萬化、形態各異,需要同時滿足所有人多樣化的創作期望和天馬行空的創意想法,并且近乎實時地生成畫作。
對此,百度采取了“視覺生成大模型+單樣本微調”的技術策略,使用文心視覺大模型實現了對畫作的補全。文心大模型先是學習了大量的中國山水畫,實現了從山水畫“小白”向“大師”的進階,然后具備“大師”水平的文心大模型再去學習黃公望的《富春山居圖》時,就能夠更容易地掌握這幅傳世名作的精髓,從而讓補全出來的畫作與現存真跡風格一致。
其實,不管是AI數字人抑或是文物修復,其背后所體現的是百度想通過大模型幫助提升素材和物料的生產效率、降低成本,探索文化創作、交互等場景新玩法的邏輯。
李彥宏提到,我們都知道一句話,“熟讀唐詩三百首,不會作詩也會吟”。但人的學習和記憶能力是有限的,《全唐詩》有接近5萬首,通讀都很難,背誦就更不容易了。而這對于大模型來說,根本就不是事兒。百度文心大模型學習效率更高、學習能力更強,還能跨語言、跨模態學習。一旦跨過某個奇點,就能產生真正意義上的AI原創內容。
據了解,百度推出的文心大模型具備“知識增強”的核心特點,能從大規模知識和海量數據中進行融合學習,具有通用性好、泛化性強的特點。作為人工智能“基礎設施”的一部分,預訓練大模型拓寬了人工智能技術落地場景的覆蓋廣度,同時降低了滲透到產業應用的難度。
業界也認為,2022年,大規模預訓練模型將呈現知識增強、跨模態統一建模、多學習方式共同演進的趨勢,并逐漸實用化,破除盲目增加參數規模的“軍備競賽”。
與此同時,生產力的改進也必將帶動生產關系的演化。
李彥宏認為,AIGC(人工智能自主生成內容)是PGC、UGC之后,全新的內容生產方式。它不僅會提升內容生產的效率,也會創造出有獨特價值和獨立視角的內容。
其中,AIGC的發展歷程大致可以分為三大階段:第一個階段,我們稱之為AIGC的“助手階段”,AIGC用來輔助人類進行內容生產;第二個階段,我們稱之為AIGC的“協作階段”,AIGC以虛實并存的虛擬人形態出現,形成人機共生的局面;第三個階段,我們稱之為AIGC的“原創階段”,AIGC將獨立完成內容創作。大模型技術的突破,正在加速這個發展趨勢。未來十年,AIGC將顛覆現有內容生產模式。可以實現以“十分之一的成本”,以百倍千倍的生產速度,去生成AI原創內容。
百度研究院預測,2022年AIGC技術將借助大模型的跨模態綜合技術能力,可以激發創意,提升內容多樣性,降低制作成本,實現大規模應用。
“我們正處在技術創新的大周期中,新能源、太空探索、生物醫藥、智能制造等新技術紛紛涌現,中國的科技發展一定會走到世界前沿。”李彥宏表示,而這條路,需要很多“石塊”鋪就。百度愿意成為其中的一塊“鋪路石”,在基礎研究、基礎技術和底層創新上貢獻力量。