直擊WAIC丨專訪畢馬威中國(guó)張慶杰:算力如果不能普惠化 任何AI暢想都是空中樓閣
2023-07-08 19:57:30    21世紀(jì)經(jīng)濟(jì)報(bào)道

作為支撐AI數(shù)據(jù)和模型的底層能量,算力正在成為數(shù)字經(jīng)濟(jì)時(shí)代新型生產(chǎn)力的主要形式,有望迎來(lái)重大發(fā)展機(jī)遇。

7月7日,在2023WAIC“計(jì)算+:讓人工智能更通用賦能”論壇上,畢馬威中國(guó)數(shù)字化賦能主管合伙人張慶杰接受了21世紀(jì)經(jīng)濟(jì)報(bào)道記者的專訪,在他看來(lái),國(guó)內(nèi)各大科技公司近日紛紛推出了自家的大模型產(chǎn)品,AI大模型的競(jìng)賽正在打響。未來(lái)行業(yè)應(yīng)該從“大規(guī)模、低成本與低能耗”三個(gè)方向來(lái)進(jìn)一步夯實(shí)算力基礎(chǔ)。

“據(jù)公開(kāi)資料,目前在追趕GPT3.5的中國(guó)團(tuán)隊(duì)約有10個(gè),在這一背景下,能否擁有或持續(xù)獲取算力將成為未來(lái)決定競(jìng)爭(zhēng)格局的關(guān)鍵?!睆垜c杰說(shuō)道。


(資料圖)

《21世紀(jì)》:您如何看待中國(guó)大模型的競(jìng)爭(zhēng)現(xiàn)狀和發(fā)展前景?

張慶杰:大模型的核心技術(shù)壁壘是數(shù)據(jù)、算法、算力等要素資源的精巧組合,單純從時(shí)間維度來(lái)評(píng)價(jià)發(fā)展差距可能過(guò)于片面。能夠擁有或持續(xù)獲取算力將是決定未來(lái)競(jìng)爭(zhēng)格局的關(guān)鍵。

AI大模型的真正價(jià)值最終將體現(xiàn)在具體場(chǎng)景,可以依靠“大模型+小模型”的方式來(lái)推進(jìn),即大小模型協(xié)同進(jìn)化,在利用大參數(shù)訓(xùn)練完大模型之后,通過(guò)高精度壓縮,將大模型轉(zhuǎn)化為端側(cè)可用的小模型,大模型相當(dāng)于超級(jí)大腦,小模型相當(dāng)于垂直領(lǐng)域?qū)<?,進(jìn)而實(shí)現(xiàn)場(chǎng)景化應(yīng)用。

《21世紀(jì)》:您認(rèn)為算力如何更好地支持大模型發(fā)展,還面臨哪方面挑戰(zhàn)?

張慶杰:中國(guó)是世界人工智能重要領(lǐng)軍國(guó)家之一,但做大模型還面臨多方面的挑戰(zhàn),需要在政策、技術(shù)、資源、人才培養(yǎng)等方面進(jìn)行綜合的改革和發(fā)展。

首先在計(jì)算資源方面,大模型的訓(xùn)練需要大量的計(jì)算資源,包括CPU、GPU、TPU等。雖然中國(guó)算力具備一定的基礎(chǔ),但在計(jì)算資源方面還存在一定的短板,各行各業(yè)在底層計(jì)算資源上存在缺乏,這會(huì)限制大模型的訓(xùn)練和優(yōu)化。

除此之外,大模型的訓(xùn)練需要大量的高質(zhì)量數(shù)據(jù),但是目前在數(shù)據(jù)質(zhì)量方面還存在一定的問(wèn)題,包括數(shù)據(jù)噪聲、數(shù)據(jù)缺失、數(shù)據(jù)不平衡等問(wèn)題。這會(huì)影響大模型的訓(xùn)練效果和準(zhǔn)確性。

而在投入成本方面,大模型的訓(xùn)練需要大量的資金支持,包括硬件設(shè)備、人才引進(jìn)、技術(shù)研發(fā)等方面的投入。最后,行業(yè)應(yīng)該在專業(yè)人才、技術(shù)生態(tài)以及計(jì)算架構(gòu)方面進(jìn)行發(fā)力,來(lái)進(jìn)一步夯實(shí)算力基礎(chǔ)。

《21世紀(jì)》:我國(guó)高度重視人工智能產(chǎn)業(yè)發(fā)展,智能算力發(fā)展的基礎(chǔ)在不斷夯實(shí)。請(qǐng)問(wèn)智能算力如何推動(dòng)人工智能的發(fā)展?

張慶杰:對(duì)通用人工智能(AGI)的來(lái)說(shuō),數(shù)據(jù)、算力、算法三大核心要素中,算力向下扎根于數(shù)據(jù),向上支撐著算法,將是驅(qū)動(dòng)AGI發(fā)展的核心動(dòng)力。算力發(fā)展需要滿足大規(guī)模、低成本與低能耗三個(gè)方面。

首先在算力規(guī)模方面,在大數(shù)據(jù)、大模型、大算力的相互作用下,全球人均算力有望實(shí)現(xiàn)G-T-P三連跳,即從GFLOPS級(jí)別躍升到TFLOPS再到PFLOPS,乃至更高級(jí)別。正如工業(yè)經(jīng)濟(jì)模式下,人均用電量和人民生活質(zhì)量成正比,在數(shù)字經(jīng)濟(jì)時(shí)代,人均算力也將會(huì)是衡量人民智能化生活水平的重要指標(biāo),算力需同電力一樣成為規(guī)?;l(fā)展的公共資源。

但與此同時(shí),大模型訓(xùn)練依然面臨著高昂的成本。放眼全球,除了幾大科技巨頭外,幾乎沒(méi)有企業(yè)承擔(dān)得起大模型訓(xùn)練的高昂成本,算力不實(shí)現(xiàn)普惠化,任何關(guān)于AI和科技革命的暢想都將是空中樓閣。

目前偏大規(guī)模的算力需求以B端和G端為主,算力降本需求十分迫切,要利用有限資金獲取更多元的算力,同時(shí)優(yōu)化算力資源配置和利用效率。

最后,低能耗也是行業(yè)需要探索的方向。數(shù)據(jù)中心是各國(guó)算力發(fā)展的重中之重,但也存在著嚴(yán)重的碳排放問(wèn)題,隨著“碳中和”目標(biāo)成為全球共識(shí),大部分國(guó)家都提出了較為嚴(yán)格的數(shù)據(jù)中心節(jié)能減排要求。

《21世紀(jì)》:ChatGPT的出現(xiàn)具有顛覆性意義,中國(guó)可以從哪些方面發(fā)力去鼓勵(lì)ChatGPT這一類的技術(shù)顛覆式創(chuàng)新?

張慶杰:ChatGPT的顛覆性意義在于打破了以往人工智能技術(shù)發(fā)展的慣性思維,即從弱人工智能轉(zhuǎn)向強(qiáng)人工智能(也稱通用人工智能),智能不再局限于某些專用領(lǐng)域,如人臉識(shí)別、機(jī)器翻譯等,而是在盡可能多的領(lǐng)域中,幫助甚至代替人類執(zhí)行體力和智力任務(wù)。

對(duì)于鼓勵(lì)ChatGPT一類的技術(shù)顛覆式創(chuàng)新來(lái)說(shuō),中國(guó)可以從基礎(chǔ)研究、應(yīng)用創(chuàng)新發(fā)力等方面發(fā)力。

首先,基礎(chǔ)研究是整個(gè)科學(xué)體系的源頭,也是所有技術(shù)問(wèn)題的總機(jī)關(guān),在實(shí)現(xiàn)高水平科技自立自強(qiáng)、建設(shè)科技強(qiáng)國(guó)的時(shí)代背景下,基礎(chǔ)研究的重要性愈發(fā)凸顯。

中國(guó)近年來(lái)一直在持續(xù)加強(qiáng)基礎(chǔ)研究投入,科技部數(shù)據(jù)顯示,基礎(chǔ)研究經(jīng)費(fèi)已從2012年的499億元增長(zhǎng)到2022年的1951億元,年均增長(zhǎng)近15%,接近全社會(huì)研發(fā)投入增長(zhǎng)速度的2倍。在通用人工智能這一嶄新發(fā)展機(jī)遇面前,圍繞產(chǎn)出重大原創(chuàng)成果,堅(jiān)持目標(biāo)導(dǎo)向、市場(chǎng)導(dǎo)向和自由探索將有利于中國(guó)在人工智能領(lǐng)域取得重大突破。

與此同時(shí),通用人工智能也應(yīng)當(dāng)與經(jīng)濟(jì)社會(huì)深度融合,在重大應(yīng)用場(chǎng)景中錘煉技術(shù)。圍繞場(chǎng)景創(chuàng)新加快資本、人才、技術(shù)、數(shù)據(jù)、算力等要素匯聚,促進(jìn)人工智能創(chuàng)新鏈、產(chǎn)業(yè)鏈深度融合,將會(huì)是推動(dòng)通用人工智能落到實(shí)處的重要方式。

夯實(shí)底層算力。當(dāng)前中國(guó)各大科技公司正不斷加碼算力進(jìn)行大模型訓(xùn)練,普遍要承擔(dān)巨大的成本投入。

以構(gòu)建GPT-3為例,OpenAI數(shù)據(jù)顯示,滿足GPT-3算力需求至少要上萬(wàn)顆英偉達(dá)GPU A100,一次模型訓(xùn)練總算力消耗約3,640PF-days(即每秒一千萬(wàn)億次計(jì)算,運(yùn)行3640天),成本超過(guò)1200萬(wàn)美元,這還不包括模型推理成本和模型后續(xù)升級(jí)所需的訓(xùn)練成本。

因此,推動(dòng)算力更加普適和智慧,才能切實(shí)助力科技企業(yè)等創(chuàng)新主體實(shí)現(xiàn)技術(shù)攻關(guān)。

《21世紀(jì)》:ChatGPT在聊天機(jī)器人、文本生成和語(yǔ)音識(shí)別等領(lǐng)域取得了巨大進(jìn)展,未來(lái)大模型在實(shí)體行業(yè)的應(yīng)用前景如何?

張慶杰:ChatGPT在一定程度上驗(yàn)證了沿著“大數(shù)據(jù)、大模型、大算力”路徑發(fā)展通用人工智能的可行性。目前,各類科技創(chuàng)新企業(yè)都在積極探索這種可能性,相關(guān)方向包括教育、移動(dòng)、搜索引擎、內(nèi)容制作、醫(yī)藥等。

判斷這些應(yīng)用價(jià)值關(guān)鍵在于落地成效如何,需要技術(shù)提供商和應(yīng)用側(cè)企業(yè)共同厘清落地成效的具體維度和評(píng)估方式。

大模型在實(shí)體行業(yè)應(yīng)用中面臨的挑戰(zhàn)和算力的落地挑戰(zhàn)存在共性??傮w來(lái)說(shuō),算力在各行業(yè)的落地挑戰(zhàn)主要包括算力總量亟需補(bǔ)充、邊緣算力較為緊缺、單位能耗算力性能有待提升、中心式計(jì)算架構(gòu)需轉(zhuǎn)型等。

預(yù)計(jì)隨著各行業(yè)全要素、全流程、全場(chǎng)景邁向數(shù)字化和智能化,實(shí)現(xiàn)“業(yè)務(wù)、數(shù)據(jù)、算力”之間的高效聯(lián)動(dòng),將是保證各類大模型或小模型按需匹配、精準(zhǔn)賦能的重要前提。

(文章來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道)

關(guān)鍵詞: