首頁>消費 >
環(huán)球快看點丨AI大模型“戰(zhàn)火”從互聯(lián)網燒到了手機側 誰在提前布局? 2023-07-05 17:38:17  來源:第一財經

盡管大模型算力消耗驚人,但這并沒有阻止各大科技公司將AI應用于其他設備,比如智能手機。

一個月內,已有多家科技廠商對AI大模型在手機上的應用作出公開表態(tài),以自研或者合作的方式進入這一狂熱的賽道。

“手機上的對話助手、智能相冊和地圖等都可以基于AI大模型升級。”IDC中國研究總監(jiān)盧言霞對第一財經記者表示,生成式AI的應用,例如語音修圖、智能對話、文生圖等也將逐步得到落地。


(相關資料圖)

“但預訓練大模型的進展和手機端算力的不斷提升是實現(xiàn)這些應用的關鍵因素。大模型的成敗高度依賴于算力的支持,而一個大型的人工智能大模型通常需要使用數(shù)萬億個單詞進行訓練,其參數(shù)量也達到了上萬億級別,這對于手機終端來說仍是一個巨大的挑戰(zhàn)。”盧言霞說。

“大模型手機”要來了?

ChatGPT引發(fā)的全球AI領域軍備賽,已經從互聯(lián)網蔓延至手機端。

今年5月,OpenAI發(fā)布了ChatGPT應用程序的iOS版本。不到三周,市場下載量便高達500萬次。在那前后,與AI大模型相關的APP已充斥在iOS與安卓應用商店中。

在互聯(lián)網廠商還在討論“中國版ChatGPT”何時誕生的時候,手機廠商以及產業(yè)鏈玩家也在尋找大模型為手機產業(yè)帶來的新機會,試圖從中分得一杯羹。

“我們內部正在就網絡大模型方面的需求跟互聯(lián)網公司進行合作,目前已(和意向公司)有所接觸?!睒s耀CEO趙明在此前舉行的上海世界移動通信大會上對記者表示,正在把AI大模型的能力引入終端。

趙明表示,榮耀在AI上的布局分為三個階段:第一階段是從0到1提出概念,將需求場景化,比如相機可以直接識別綠植、天空,AI能夠對圖像進行對應的優(yōu)化;第二階段,AI有了上下文理解與學習,基于位置、時間對消費者習慣進行整合式機器的決策。第三階段就是把AI引入端側。

在趙明看來,智能手機行業(yè)正處在一個AI、5G+開啟的新一輪創(chuàng)新周期中,而智能手機是計算平臺、通信平臺、顯示平臺、AI平臺的集合,智能手機的發(fā)展就是不斷打破邊界、集成新技術、融合新品類的過程。AI、通信技術的持續(xù)演進,以及新形態(tài)的發(fā)展為智能手機打開了機會大門,利于行業(yè)重回千帆競渡態(tài)勢,共同開啟下一個黃金周期。

除了榮耀外,國內廠商方面,華為以及OPPO也在低調部署。

目前,華為基于多模態(tài)大模型技術,通過在手機端側對模型進行小型化處理,完善了手機在海量圖片中的搜索能力。

OPPO研究院6月初則在一篇論文中介紹了一款專注圖片標記的基礎模型“Recognize Anything Model”,而在此前更是與阿里大模型展開深度合作。

OPPO中國區(qū)總裁劉波對記者表示,內部也在思考大模型在手機端的應用,未來AI或將改變整個手機產業(yè)鏈。

以語音助手為例,該技術采用的也是深度學習模型,但語音大模型可以替代語音助手工作模塊中對語義理解的功能,修復此前因為喚醒和識別錯誤帶來的不便。

微軟CEO納德拉曾直言不諱地指出語音助手的“愚蠢”:“無論是Cortana、Alexa、Google Assistant還是Siri,這些語音助手笨得像塊石頭?!钡谖磥恚Z音助手或許可以真正像個人助理一樣,精準地幫助用戶實現(xiàn)預訂機票、網上購物等功能。

趙明對記者表示,現(xiàn)階段榮耀以MagicOS中“YOYO建議”已經可以提供基于地理圍欄、用戶習慣等數(shù)據的多場景個人化提醒。“Magic V2上將會部署AI功能,在未來可以通過在端側引入AI大模型賦能語音智慧助手,提供更自然的交互與更精準的意圖識別服務?!?/p>

算力與成本下的挑戰(zhàn)

但和其他大模型公司所遇到的一樣,在手機端側上實現(xiàn)這一技術的最大挑戰(zhàn)來自于兩方面,其一是算力,其二是成本。

在盧言霞看來,將大模型部署到手機端進行推理主要有兩種方式,一種是通過云端進行推理,一種是在手機端直接進行推理。如果選擇回傳云端推理,則對手機的通訊能力要求較高;而如果選擇在手機端推理,則對算力有一定的要求。盡管技術提供商會對模型進行剪枝和壓縮等優(yōu)化,但仍然需要一定的算力。

例如,ChatGPT這樣的超大模型需要1000張主流卡容量的獨立計算集群,以及對應的模型并行算法框架來支持訓練。在成本方面,超大模型的訓練需要大規(guī)模計算集群以及對應的模型并行算法框架的支撐,因此訓練成本通常很高。ChatGPT單次模型訓練耗時1個月,訓練成本達1200萬美元。

CounterpointResearch分析師FloraTang對第一財經記者表示,手機公司的軟件工程團隊相較于互聯(lián)網公司而言,人力較少,所以從大模型的自研角度是不現(xiàn)實的。但可以選擇一些已有的合作方進行大模型領域的技術優(yōu)化。

但從手機產業(yè)鏈來看,上游芯片廠商正在做出努力,試圖在英偉達統(tǒng)治的算力江湖下找到縫隙,以減少成本并且實現(xiàn)對AI芯片的把控能力。

高通前不久提出了一個云邊一體“混合AI”的概念,并計劃在今年下半年對外展示在手機上運行100億個參數(shù)的大語言模型。從高通已有的模型落地案例來看,其邊緣大模型相當于云端大模型的“感知器官”,從而實現(xiàn)AI功能在終端設備的實現(xiàn)。

同時,雖然蘋果并沒有直接表態(tài),但從其芯片布局來看,蘋果已經公開進入生成式AI訓練硬件領域?!癕2芯片家族的最新成員M2 Ultra是蘋果在AI領域一個值得關注的地方,這種能力可能會在訓練大模型上派上用場。”FloraTang對記者說。

值得注意的是,今年6月,iOS 17發(fā)布的開發(fā)者版本中,其中一個改動是“Hey Siri”去掉了前綴,用戶僅需說“Siri”就能喚醒語音助手。這一變動背后也有來自于語音大模型的支撐。

國內廠商方面,榮耀在上海所布局的一家芯片公司也受到了行業(yè)內的關注。在隨后的回應中,榮耀表示,上海榮耀智慧科技開發(fā)有限公司主要進行的是終端側核心軟件、圖形算法、通信、拍照等方面研究開發(fā)工作。

結合趙明此前在采訪提及的“將在算力中心進行端側大模型的前置算法訓練”,上述芯片公司的定位或與榮耀端側AI大模型布局有關。

在業(yè)內看來,不管是自身技術實力的積累還是與未來與蘋果在AI上的競爭,擁有處理AI數(shù)據的能力變得越來越重要。

“大型模型將在云中進行訓練,但真正的價值在于更小、更高效的模型,這些模型經過調整,可以在手機終端設備上運行?!盕loraTang說。

但對于何時能真正迎來手機端的“ChatGPT”時刻,盧言霞則對記者表示,這取決于大模型本身的進展。一些小的應用,例如對話式應用,很快就可以落地。然而,對于一些具有挑戰(zhàn)性的應用,例如文生圖或者在現(xiàn)有APP中嵌入這些應用,可能還需要一定的時間。

(文章來源:第一財經)

關鍵詞:

相關閱讀:
熱點
圖片