賈迎亞等:“真人復(fù)刻數(shù)字人”搶市場,中小企業(yè)如何突圍?|天天熱門
2023-05-30 17:36:25    中新經(jīng)緯

題:“真人復(fù)刻數(shù)字人”搶市場,中小企業(yè)如何突圍?

作者 賈迎亞 上海大學(xué)管理學(xué)院副教授


(資料圖片僅供參考)

李博倫 上海大學(xué)管理學(xué)院碩士生

邱肅川 復(fù)旦大學(xué)智慧城市研究中心高級研究員

年中將至,各大電商平臺紛紛進入618倒計時,精打細(xì)算的消費者,也開始在各大平臺互相交流自己的“作業(yè)”。數(shù)字人也在成為MCN機構(gòu)直播布局的重點。在競爭激烈的市場環(huán)境中,億萬分身不眠不休,億萬產(chǎn)業(yè)無窮無盡,越來越多的數(shù)字人類被開發(fā)、應(yīng)用于互聯(lián)網(wǎng)中。技術(shù)使機器充分具備了人的特點,人類也在追求智能化的道路上越走越遠(yuǎn)。“真人復(fù)刻數(shù)字人”真能實現(xiàn)彎道超車嗎?中小企業(yè)如何突圍?

真人復(fù)刻數(shù)字人服務(wù)面臨兩大需求

真人復(fù)刻數(shù)字人(2D或3D形象),是一種利用計算機視覺、圖形渲染、動作捕捉、深度學(xué)習(xí)、語音合成等多項先進技術(shù),在外觀形象、行為表達、思想交互三個方面完美復(fù)制實體人的數(shù)字化存在。艾瑞咨詢預(yù)測,真人復(fù)刻數(shù)字人將會經(jīng)歷三個階段,第一階段,以CG技術(shù)(Computer Graphics)還原真人表情、動作的階段。第二階段,以腦機接口植入意識、記憶到數(shù)字備份中,并通過電腦還原。第三階段,通過量子計算機進行深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),對思維和意識進行全部還原。

當(dāng)前,想要提供真人復(fù)刻數(shù)字人服務(wù)或利用數(shù)字人特性進行業(yè)務(wù)驅(qū)動、場景升級的中小企業(yè)面臨兩大需求:一是進入元宇宙虛擬空間的數(shù)字形象需求,二是用戶對數(shù)字分身進行內(nèi)容創(chuàng)作的需求。

據(jù)IDC預(yù)測,中國數(shù)字人市場規(guī)模預(yù)計到2026年達102.4億元人民幣。清華大學(xué)發(fā)布的《虛擬數(shù)字人研究報告2.0版》顯示,數(shù)字人已經(jīng)滲透到各行各業(yè),成為新一代的生產(chǎn)力和創(chuàng)造力。從頭部企業(yè)的布局來看,數(shù)字人產(chǎn)品服務(wù)在B端占有79%的市場,而在C端的占比僅有36%,顯然,B端是當(dāng)前頭部企業(yè)數(shù)字人布局的重點領(lǐng)域。

頭部企業(yè)切入B端賽道,主要圍繞“人-貨-場”的發(fā)展路徑,并建立了完整的數(shù)字人產(chǎn)業(yè)鏈。不管是數(shù)字人IP、功能型數(shù)字人還是AI員工的市場,頭部企業(yè)在基礎(chǔ)層和平臺層已建立較高的行業(yè)壁壘,例如,占據(jù)基礎(chǔ)層的微軟、Unity、英特爾等,占據(jù)平臺層的網(wǎng)易、科大訊飛、騰訊等。

中小企業(yè)搶灘數(shù)字人賽道選擇哪種發(fā)展模式?

目前最可行、便捷與最易變現(xiàn)的渠道是從事真人復(fù)刻數(shù)字人的AIGC內(nèi)容創(chuàng)作,最關(guān)鍵的是落實到具體的垂直場景,根據(jù)客戶需要進行相應(yīng)設(shè)計,這才是入局的“初心”所在。

在Chat GPT掀起了人工智能創(chuàng)作的浪潮之后,各大科技巨頭紛紛加入競爭,AIGC迎來了前所未有的機遇和挑戰(zhàn)。AIGC即AI Generated Content,是一種利用人工智能技術(shù)來生成內(nèi)容的應(yīng)用。在Web3.0時代,內(nèi)容生產(chǎn)方式由PGC(專業(yè)制作)和UGC(用戶制作)逐步過渡到AIUGC(AI輔助用戶創(chuàng)作)和AIGC時代。AIGC利用生成式算法、自然語言處理(NLP)以及人工智能學(xué)習(xí)知識圖譜,打破了內(nèi)容創(chuàng)作者的創(chuàng)作限制,創(chuàng)作者可以更自由地實現(xiàn)二次精加工。從長期來看,隨著數(shù)據(jù)、算法、算力等要素的不斷提升,創(chuàng)作者甚至可以利用AI技術(shù)創(chuàng)造出超越現(xiàn)實的奇幻世界。

最令人驚嘆的是,AIGC能夠?qū)崿F(xiàn)真人復(fù)刻數(shù)字人的多模態(tài)化,即外觀、聲音和動作三者完美融合。AIGC在生成方面包含著基于線索的部分生成、完全自主生成和基于底稿的優(yōu)化生成。內(nèi)容方面,不僅包含圖像、文本、音頻等外顯內(nèi)容,同樣也包括策略、劇情、訓(xùn)練數(shù)據(jù)等內(nèi)在邏輯內(nèi)容。當(dāng)垂直場景直接導(dǎo)入或模型生成(如NeRF模型),只需利用大廠提供的AI工具(Bing、Midjourney、Runway、Soundraw等),一款多模態(tài)化的真人復(fù)刻數(shù)字人就可以出現(xiàn)在你的眼前。

對中小企業(yè)而言,實現(xiàn)真人復(fù)刻數(shù)字人在細(xì)分場景下變現(xiàn),需注意以下三點:

第一,規(guī)避大廠深耕多年的數(shù)字人場景,尋找有特色和需求的場景。例如,利用數(shù)字人打造具有當(dāng)?shù)匚幕厣穆糜尉包c、鄉(xiāng)村振興項目、遠(yuǎn)程醫(yī)療服務(wù)、老年人生活輔助、智慧城市管理等,讓用戶感受到數(shù)字人與真實世界的互動和融合,提高用戶的沉浸感、真實感和參與感,解決現(xiàn)實世界中存在的問題。

第二,不斷創(chuàng)新,快速迭代,打造高品質(zhì)的數(shù)字人產(chǎn)品。要想讓數(shù)字人從平面圖像變成立體模型,從單一表達變成多樣化交流,需要不斷地優(yōu)化技術(shù)和算法。如專注于開發(fā)能夠模擬真人感官體驗的2D數(shù)字人賽道,從醫(yī)療、法律、直播帶貨三個場景出發(fā),構(gòu)建數(shù)字人應(yīng)用平臺,提升數(shù)字人的服務(wù)水平。目前,許多數(shù)字人中小企業(yè)都選擇了類似的策略,即在基礎(chǔ)技術(shù)階段“做深、做細(xì)、做實”,然后向著渲染、動捕和唇形等技術(shù)難度較大的3D數(shù)字人領(lǐng)域進軍,并不斷豐富場景化應(yīng)用。

第三,打造數(shù)字人業(yè)務(wù)閉環(huán)。需要考慮的是如何從人工標(biāo)注、模型訓(xùn)練,到深度學(xué)習(xí)、自我迭代,并建立穩(wěn)固的用戶反饋。短期來看,視頻生成技術(shù)還原了真人的唇形和語音、語速、語調(diào),應(yīng)是發(fā)展的重心。長期來看,實時互動技術(shù)才能滿足元宇宙中的社交需求,為用戶帶來真實體驗。在這個過程中,中小企業(yè)應(yīng)圍繞用戶的實時反饋來優(yōu)化數(shù)字人產(chǎn)品與服務(wù)。

真人復(fù)刻數(shù)字人是一條全新的進化路線。當(dāng)虛擬偶像市場已被頭部企業(yè)所壟斷,中小企業(yè)無法與之抗衡時,要利用自身的技術(shù)和創(chuàng)新能力,專注于C端市場,打造最適合用戶需求的真人復(fù)刻數(shù)字人。(中新經(jīng)緯APP)

本文由中新經(jīng)緯研究院選編,因選編產(chǎn)生的作品中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。選編內(nèi)容涉及的觀點僅代表原作者,不代表中新經(jīng)緯觀點。

責(zé)任編輯:孫慶陽

關(guān)鍵詞: