AI大模型掀起“軍備競(jìng)賽” 商湯“日日新”如何先發(fā)制人?
2023-04-14 16:06:05    21世紀(jì)經(jīng)濟(jì)報(bào)道

ChatGPT引發(fā)的大模型熱潮依然洶涌,吸引著企業(yè)和資本爭(zhēng)相涌入。

在市場(chǎng)喧囂之前,商湯科技在對(duì)AI基礎(chǔ)設(shè)施SenseCore大裝置進(jìn)行研發(fā)投入的路上已經(jīng)走過了多年,甚至顯得有些孤獨(dú)。


(相關(guān)資料圖)

2023年,AI賽道被重新點(diǎn)燃,厚積薄發(fā)的商湯科技終于曬出了深耕AI領(lǐng)域多年的成果。4月10日,商湯分享了以“大模型+大算力”推進(jìn)AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,并公布了“日日新SenseNova”大模型體系,推出自然語言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。

在活動(dòng)現(xiàn)場(chǎng)和直播平臺(tái)上,商湯大模型引發(fā)了觀眾轟動(dòng):“超出預(yù)期”“主播和UP主要失業(yè)了”。更有投資者發(fā)出感嘆:商湯大模型目前幾乎秒殺前期已經(jīng)發(fā)布的其他大模型。

對(duì)商湯科技而言,從2014年成立開始,其對(duì)大模型及相關(guān)技術(shù)的積累就貫穿企業(yè)生命線之中。此間,質(zhì)疑也好、贊譽(yù)也罷,商湯始終堅(jiān)持著自己的獨(dú)特發(fā)展路徑。

多年前瞻布局

2022年末,大模型ChatGPT橫空出世掀起市場(chǎng)熱潮,資本終于意識(shí)到了超大模型的研發(fā)價(jià)值。一夜之間,AI投資再度火熱,國際大廠紛紛入局;二級(jí)市場(chǎng)上,人工智能概念股更被炒作得“沸反盈天”。

但,人工智能產(chǎn)業(yè)發(fā)展永遠(yuǎn)不是依靠投機(jī)和市場(chǎng)情緒的追逐,技術(shù)才是“硬道理”。

“在商湯,我們這么多年來一直在積極投入建設(shè)超大規(guī)模的算力,也一直在訓(xùn)練越來越大的模型?!鄙虦萍级麻L兼CEO徐立在技術(shù)交流日上表示。

2018年,商湯開始了AI大模型的研發(fā),一年之后已經(jīng)具備了千卡并行的系統(tǒng)能力。那兩年是商湯在大模型研發(fā)的起步。2019年,商湯自研了一個(gè)10億參數(shù)的CV大模型,實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。

2022年,商湯科技人工智能計(jì)算中心(AIDC)在上海臨港正式投用,成為SenseCore大裝置的重要算力基座,也是亞洲最大的人工智能計(jì)算中心之一。

經(jīng)過5年的探索,商湯建設(shè)的AI大裝置已處于業(yè)界領(lǐng)先,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計(jì)算平臺(tái)之一。基于大裝置的能力,商湯已構(gòu)建了計(jì)算機(jī)視覺、自然語言處理、AI內(nèi)容生成、多模態(tài)、決策智能等多個(gè)領(lǐng)域的大模型,持續(xù)演進(jìn)能力并廣泛支持各種應(yīng)用。

至今,商湯科技仍保持著穩(wěn)定、高水平的研發(fā)投入。2022年,商湯科技研發(fā)投入達(dá)到40.14億元。同時(shí)在2022年,商湯科技的人均研發(fā)效率持續(xù)提升,人均每年研發(fā)模型數(shù)相較于2021年進(jìn)一步提高了90%,達(dá)到9.35個(gè)。

商湯此次發(fā)布的“日日新SenseNova”大模型體系下的語言大模型,以及AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型及應(yīng)用,是商湯大模型技術(shù)突破的最新動(dòng)向,更是這些年商湯依托AI大裝置SenseCore實(shí)現(xiàn)“大模型+大算力”融合創(chuàng)新研發(fā)體系下的成果展示。

具體來看,在“日日新SenseNova”模型下,各應(yīng)用各有特色,比如:

“秒畫SenseMirage”文生圖創(chuàng)作平臺(tái),展現(xiàn)了光影真實(shí)、細(xì)節(jié)豐富、風(fēng)格多變的強(qiáng)大的文生圖能力,可支持6K高清圖的生成;客戶還可根據(jù)自身需求訓(xùn)練生成模型。

商湯表示, “秒畫SenseMirage”是一個(gè)包含商湯自研AIGC大模型和便捷的LoRA訓(xùn)練能力,并提供第三方社區(qū)開源模型加速推理的創(chuàng)作平臺(tái),旨在為創(chuàng)作者提供更加便利、完善的內(nèi)容生產(chǎn)創(chuàng)作工具。

“秒畫SenseMirage”不僅融合了超10億參數(shù)的商湯自研文生圖生成模型,還支持一鍵導(dǎo)入多個(gè)平臺(tái)的開源模型或上傳用戶本地模型并對(duì)其進(jìn)行特異性推理加速優(yōu)化,結(jié)合自研模型及訓(xùn)練能力,用戶可免除本地化部署流程,并基于開源模型自訓(xùn)練模型,高效地生成更多樣的內(nèi)容。

在商湯技術(shù)交流會(huì)現(xiàn)場(chǎng)演示環(huán)節(jié)中,不僅演示了基于商湯自研AIGC模型的作圖(MiaoHua team作品),也介紹了用戶可導(dǎo)入開源模型并通過秒畫平臺(tái)對(duì)該模型加速推理(作畫)的能力。

“如影SenseAvatar”AI數(shù)字人視頻生成平臺(tái),僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動(dòng)作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。

“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺(tái),可以高效低成本生成大規(guī)模三維場(chǎng)景和精細(xì)化的物件,為元宇宙、虛實(shí)融合應(yīng)用打開新的想象空間。

大模型驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)

依靠領(lǐng)先的“大模型+大裝置”技術(shù)路徑,商湯科技在國內(nèi)人工智能領(lǐng)域拔得頭籌,建起以AI賦能的四大業(yè)務(wù)板塊——智慧生活、智能汽車、智慧商業(yè)與智慧城市,搶先實(shí)現(xiàn)商業(yè)化。

商湯發(fā)布的2022年報(bào)顯示,營收來源呈現(xiàn)多頭并進(jìn)的趨勢(shì),業(yè)務(wù)收入格局更為均衡健康。

其中,智慧生活業(yè)務(wù)在2022年出現(xiàn)爆炸式增長,營收規(guī)模同比增長130%,收入金額達(dá)到9.55億元,沖擊10億元大關(guān)。另一項(xiàng)同比增長達(dá)到59%的收入來源為智能汽車業(yè)務(wù)。該項(xiàng)業(yè)務(wù)貢獻(xiàn)收入從上年同期的1.84億元一口氣增長至2022年的3億元。

兩項(xiàng)業(yè)務(wù)在商湯科技的營收貢獻(xiàn)也有較大提高,占比分別從2021年的9%和4%提升至25%和8%。原先收入占比較高的智慧商業(yè)與智慧城市業(yè)務(wù),在2022年收入占比與智慧生活和智能汽車兩大新興業(yè)務(wù)呈現(xiàn)板塊輪動(dòng)趨勢(shì)。

不難發(fā)現(xiàn),商湯更專注在服務(wù)B端客戶。商湯認(rèn)為,AI大模型發(fā)展最本質(zhì)的是要解決生產(chǎn)力的進(jìn)步問題。而在上述業(yè)務(wù)增長的背后,到處可見商湯大模型的身影。

比如商湯“SenseAuto絕影”智能汽車平臺(tái),以SenseCore商湯Al大裝置為基石,以SenseAuto Empower絕影賦能引擎為底座,通過智能車艙、量產(chǎn)智能駕駛及車路協(xié)同構(gòu)成全棧體系,全面賦能國內(nèi)外車企客戶的智能化升級(jí)戰(zhàn)略。目前來看,商湯絕影智能駕駛覆蓋L1-L4的全棧自研自動(dòng)駕駛技術(shù)。接下來,商湯的目標(biāo)是打通L1至L4的全棧軟件算法能力。

智慧生活業(yè)務(wù)更是商湯科技賦能生產(chǎn)力升維的生動(dòng)體現(xiàn)。去年公司智慧生活整體收入大幅增長,主要是智慧生活A(yù)I內(nèi)容生成(AIGC)、AI傳感器、AI ISP芯片、智慧醫(yī)療四項(xiàng)產(chǎn)品實(shí)現(xiàn)商業(yè)化突破。披露的數(shù)據(jù)顯示,在智能手機(jī)和智能終端領(lǐng)域,商湯科技提供AI SDK、AI傳感器和AI ISP芯片的產(chǎn)品組合,為客戶提供強(qiáng)大的AI能力。2022年,搭載商湯AI SDK的新增量產(chǎn)智能手機(jī)達(dá)4.5億臺(tái)。

隨著商湯科技“日日新”大模型體系不斷優(yōu)化,未來將更大程度上驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)。

從技術(shù)交流日來看,“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務(wù),包括圖片生成,自然語言生成,視覺感知通用任務(wù)與標(biāo)注服務(wù)??蛻艨筛鶕?jù)實(shí)際應(yīng)用需求,調(diào)用“日日新SenseNova”大模型的各項(xiàng)AI技術(shù)能力,低門檻、低成本、高效率地實(shí)現(xiàn)各類AI應(yīng)用。

“日日新SenseNova”也已為商湯的自身業(yè)務(wù)帶來了諸多突破。例如在智能駕駛領(lǐng)域,基于視覺大模型,商湯實(shí)現(xiàn)了可識(shí)別3000類物體的BEV環(huán)視通用感知算法的實(shí)車量產(chǎn),也構(gòu)建了感知決策一體化的自動(dòng)駕駛多模態(tài)模型,帶來更強(qiáng)的環(huán)境、行為、動(dòng)機(jī)解碼能力。

更大范圍內(nèi)破局AGI

商湯科技在AI領(lǐng)域留給外界的想象不止于此。

市場(chǎng)人士認(rèn)為,“日日新SenseNova”帶來的這些強(qiáng)大而易用的內(nèi)容生成能力,將會(huì)改變內(nèi)容生產(chǎn)行業(yè)的生產(chǎn)范式,突破內(nèi)容創(chuàng)意的天花板,將會(huì)重塑內(nèi)容生產(chǎn)行業(yè)生態(tài)并打開新的增長空間。

浙商證券就指出,大模型將商湯在CV領(lǐng)域的深厚積累予以變現(xiàn),多模態(tài)實(shí)力超預(yù)期看好商湯充分利用CV技術(shù)經(jīng)驗(yàn),通過跨模態(tài)和三維化相結(jié)合形成模型差異化競(jìng)爭(zhēng)優(yōu)勢(shì),并在游戲、直播等領(lǐng)域打開商空間。

值得注意的是,無論是語言大模型,還是文生圖或數(shù)字人生成,都離不開大規(guī)模AI基礎(chǔ)設(shè)施的算力支持。商湯AI大裝置SenseCore,擁有行業(yè)領(lǐng)先的算力輸出能力、超大模型訓(xùn)練及大規(guī)模推理能力,將會(huì)成為AGI和大模型時(shí)代的基礎(chǔ)設(shè)施服務(wù)領(lǐng)導(dǎo)者。

當(dāng)前業(yè)界訓(xùn)練大模型,對(duì)大算力的需求非常旺盛,真正好用的基礎(chǔ)設(shè)施十分稀缺。“在AI大模型時(shí)代,數(shù)據(jù)、算法和算力這三要素在經(jīng)歷新的演變,大模型參數(shù)量將以指數(shù)級(jí)速率提升,而數(shù)據(jù)量隨著多模態(tài)的引入也將大規(guī)模增長,因此必然會(huì)導(dǎo)致對(duì)算力需求的劇增?!毙炝⒈硎尽?/p>

“我們以AI大裝置SenseCore打造AGI時(shí)代的基礎(chǔ)設(shè)施,并基于此將大模型體系命名為‘日日新SenseNova’,寓意‘茍日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能?!彼a(bǔ)充道。

據(jù)悉,基于AI大裝置SenseCore和“日日新SenseNova”大模型體系,商湯面向行業(yè)伙伴提供涵蓋自動(dòng)化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署、開發(fā)效率提升等多種大模型即服務(wù)。

“基于預(yù)訓(xùn)練大模型的自動(dòng)化數(shù)據(jù)標(biāo)注可實(shí)現(xiàn)相較于人工數(shù)據(jù)標(biāo)注近百倍的效率提升?!鄙虦萍悸?lián)合創(chuàng)始人、大裝置事業(yè)群副總裁陳宇恒介紹,“而模型推理部署服務(wù)可將大模型推理效率提高100%以上,降低用模型提供服務(wù)的成本。”此外,商湯也向行業(yè)開發(fā)人員開放大量預(yù)訓(xùn)練模型及AI開發(fā)工具鏈,全面賦能開發(fā)效率。

“AGI催生了新的研究范式,即基于一個(gè)強(qiáng)大的多模態(tài)基模型,通過強(qiáng)化學(xué)習(xí)和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務(wù)。AGI將實(shí)現(xiàn)從‘?dāng)?shù)據(jù)飛輪’到‘智慧飛輪’的演進(jìn),最終邁向人機(jī)共智?!鄙虦萍悸?lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示:“商湯已建立了全棧的大模型研發(fā)體系,并已在多個(gè)行業(yè)場(chǎng)景中落地,場(chǎng)景的多樣性,任務(wù)的復(fù)雜度,數(shù)據(jù)的豐富度均充分展示了我們大模型的能力和未來潛力?!?/p>

可以說,在當(dāng)前的AI競(jìng)賽中,商湯科技因其長期主義和獨(dú)特的技術(shù)路徑,找到了關(guān)鍵破局點(diǎn),走出了一條新商業(yè)模式。

關(guān)鍵詞: