大模型商業(yè)化開荒 微軟走到哪里了|天天速遞
2023-04-18 15:51:08    21世紀(jì)經(jīng)濟(jì)報道

4月17日,微軟以Azure OpenAI國際版服務(wù)所提供的GPT-3、GPT-4、Codex、DALL-E和企業(yè)級ChatGPT服務(wù)為基礎(chǔ),針對零售電商、制造業(yè)、數(shù)字原生等行業(yè)領(lǐng)域推出首批三套“Azure全球創(chuàng)新行業(yè)場景”。

今年一月,Azure OpenAI國際版服務(wù)首次推出面向企業(yè)用戶的大模型服務(wù),目前已經(jīng)可以提供用于文本理解生成的GPT-3、GPT-4,可理解和生成代碼的Codex,可通過文本提示生成圖片的DALL-E,以及能夠提供聊天集成和定制服務(wù)的企業(yè)級ChatGPT等五種主要大模型服務(wù)。

“國內(nèi)客戶更主動擁抱新技術(shù),很多應(yīng)用場景可能都是中國客戶有一些創(chuàng)新想法以及去積極使用,換一個角度,從傳播需求角度來講,大家發(fā)現(xiàn)OpenAI、ChatGPT已經(jīng)成為傳播熱點(diǎn),媒體在關(guān)注,用戶在關(guān)注,市場也在關(guān)注,我們產(chǎn)品的服務(wù)也緊跟著而來。所以在中國市場籠統(tǒng)來說,對應(yīng)用場景的關(guān)注,創(chuàng)新性技術(shù)的使用,我覺得其實(shí)一點(diǎn)都不差,而且可能還是在全球比較領(lǐng)先的位置上?!監(jiān)neSight一網(wǎng)互通公司聯(lián)合創(chuàng)始人兼首席運(yùn)營官苗宇表示。


(資料圖)

場景試點(diǎn)開發(fā)

作為OpenAI生成式人工智能的獨(dú)家云服務(wù)商,在此前3月初舉辦的Azure技術(shù)峰會上,微軟首次面向中國市場介紹和講解了Azure OpenAI相關(guān)服務(wù),針對當(dāng)前市場需求最為迫切的零售電商、制造業(yè)、數(shù)字原生三大領(lǐng)域,微軟也在近日正式推出首批Azure OpenAI國際版“全球創(chuàng)新行業(yè)場景”。

在零售電商領(lǐng)域,可幫助客戶快速生成產(chǎn)品相關(guān)文案及可視創(chuàng)意素材,創(chuàng)造更符合用戶需求的銷售及培訓(xùn)話術(shù),編制客戶服務(wù)及輿情應(yīng)對預(yù)案;呼叫及客服中心服務(wù)記錄匯總,新品營銷活動反饋分析,售后評價及投訴分析;快速編制應(yīng)用接口代碼,由自然語言生成SQL查詢語句;基于自然語言理解的搜索優(yōu)化。

在制造業(yè)領(lǐng)域,可以實(shí)現(xiàn)多語言智能終端與人機(jī)交互體驗(yàn),適應(yīng)海外市場的銷售及客服話術(shù);基于垂直領(lǐng)域的生產(chǎn)技術(shù)文檔歸納,跨平臺多方會議紀(jì)要總結(jié);加速應(yīng)用開發(fā)與迭代,加速跨數(shù)據(jù)平臺代碼轉(zhuǎn)換;企業(yè)內(nèi)部智能客服(如行政及IT),基于垂直領(lǐng)域的文檔搜索,面向外部的售后、技術(shù)、產(chǎn)品支持。

在數(shù)字原生領(lǐng)域,則可以進(jìn)行無限故事創(chuàng)作的NPC (Non-Player Character)交互體驗(yàn),游戲、互聯(lián)網(wǎng)出海營銷所需的文字及可視內(nèi)容、素材生成和加工;匯總分析多渠道玩家反饋,當(dāng)?shù)厥袌龌顒?、競品情報分析;生成、重?gòu)過程游戲平臺代碼;面向海外市場的智能化游戲客服機(jī)器人。

“技術(shù)上的領(lǐng)先以及廠商們的應(yīng)用,也反饋給我們很多的洞察。像在零售電商行業(yè),流量上來之后就涉及到跨界的一些服務(wù),比如搜索。我們會發(fā)現(xiàn),原來不同的行業(yè)在很多場景又合在一起了,然后彼此跨界,出現(xiàn)很多新的可能性。剛剛兩三個月,我們也在看到客戶也在不斷的嘗試和創(chuàng)新,但是我們已經(jīng)看到有一些苗頭,未來也會有一些跨界的應(yīng)用出現(xiàn)?!蔽④浿袊髷?shù)據(jù)和人工智能產(chǎn)品市場總監(jiān)李冕表示。

“OpenAI并不是微軟智能云Azure唯一提供的AI服務(wù),其他一些場景,比如識別字幕、語音翻譯、語言翻譯等,這些都是Azure本身就有的服務(wù),只是跟OpenAI做了一個結(jié)合?!蔽④浌靖笨偛?、微軟大中華區(qū)首席運(yùn)營官康容表示。

商業(yè)化探路

對于走在最前沿的微軟,在其帶領(lǐng)大模型的技術(shù)探索及落地實(shí)踐中,如何將可能一本正經(jīng)說瞎話的AI,調(diào)整為能夠解決各種實(shí)際問題的專家成為重要的關(guān)注點(diǎn)。

參考GPT-3到ChatGPT式的飛躍式進(jìn)步,對大模型進(jìn)行微調(diào),通過語料庫對模型參數(shù)進(jìn)行調(diào)整,“再投喂”海量的行業(yè)數(shù)據(jù),對大模型進(jìn)行更進(jìn)一步的專業(yè)訓(xùn)練,從而滿足特定領(lǐng)域?qū)?zhǔn)確度等方面的要求,無疑是主要思路之一。

日前,北京智源人工智能研究院理事長張宏江也表示同樣的觀點(diǎn),他指出,從“大煉模型”到“煉大模型”是一個范式的轉(zhuǎn)變,未來的APP的開發(fā)將是在大模型的基礎(chǔ)上“大模型+微調(diào)”的流水線運(yùn)作方式,向產(chǎn)業(yè)提供源源不斷的智力源。相比以前既做APP,又煉小模型的方式,釋放掉重復(fù)造小模型的人力等資源浪費(fèi),極大降低開發(fā)成本,使邊際成本趨零,帶來百倍甚至千倍的生產(chǎn)力提升。

但李冕告訴21世紀(jì)經(jīng)濟(jì)報道記者,即使是對于微軟,微調(diào)的know how(技術(shù)訣竅)目前也依然是個技術(shù)門檻。

“我們對微調(diào)的感覺是,GPT用了非常大的,超過1750億參數(shù)的語料庫,現(xiàn)在只把極少的數(shù)據(jù)量導(dǎo)進(jìn)去,就像往大海里面倒幾桶水,其實(shí)改變不了大模型,相反可能越改越差。雖然我們的平臺是open to everybody,我們把微調(diào)的功能開放出來,所有人可以去做微調(diào),但如何確保微調(diào)之后就一定能實(shí)現(xiàn)更好的結(jié)果,目前還沒有一個特別好的實(shí)踐。”李冕表示。

“我們推薦客戶通過prompt engineering和embedding的方式去做匹配,效果要比微調(diào)要好一些,比如萬科,它并沒有做特別多的微調(diào),它也是通過prompt engineering以及embedding的方式,將物業(yè)管理中的一些分類工作交給Azure OpenAI,像門禁、下水道以及安保等問題,這些原來是人工來做的,可能大部分情況是對的,現(xiàn)在用AI分揀,試了一下,效果有一點(diǎn)點(diǎn)差距。AI沒有取代人,但是極大輔助了團(tuán)隊(duì),這是我們看到的一個案例?!崩蠲嵫a(bǔ)充道。

值得說明的是,prompt engineering,即“提示工程”,是指由于大模型可能生成不準(zhǔn)確或不當(dāng)?shù)奈谋荆ㄟ^優(yōu)化輸入提示,引導(dǎo)大模型生成更加準(zhǔn)確、可靠、符合預(yù)期的輸出內(nèi)容,進(jìn)而實(shí)現(xiàn)各種應(yīng)用場景的實(shí)際使用優(yōu)化;而embedding則是指事先把預(yù)先設(shè)定好專有領(lǐng)域的問題和答案生成詞向量,存入向量數(shù)據(jù)庫,每次對話時先去向量數(shù)據(jù)庫的搜索問題和答案,再交給大模型對問題和答案進(jìn)行整理,最終再輸出給用戶,這種方式又被稱為“檢索增強(qiáng)”。

“只有像那種以前做過機(jī)器學(xué)習(xí),打過標(biāo)簽,也失敗過,知道微調(diào)中會碰到很多坑的客戶,我們才會鼓勵它們?nèi)プ鑫⒄{(diào),但是一些傳統(tǒng)的行業(yè)就很難,因?yàn)樗麄兌疾恢览锩娴目佑卸嗌?,一碰到問題就非常frustrated(沮喪懊惱)。因?yàn)槿耸怯衅谕档模I(lǐng)導(dǎo)說能不能調(diào)好,你說能,結(jié)果調(diào)了一個禮拜,花了大量的人力物力去組織、拿數(shù)據(jù)、打標(biāo)簽,效果還是不行,一個月之后領(lǐng)導(dǎo)就把它砍掉了?!崩蠲釋?1世紀(jì)經(jīng)濟(jì)報道記者表示。

(文章來源:21世紀(jì)經(jīng)濟(jì)報道)

關(guān)鍵詞: