張通社 zhangtongshe.com
5.0”大模型亮相前夕,商湯科技再獲20億港元投資。
近日,商湯科技在港交所發(fā)布公告,宣布了一筆通過配售獲得的20億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現(xiàn)有股東增持。資金將用于擴大商湯科技大裝置規(guī)模、支持大模型研究及產(chǎn)品開發(fā)的生成式AI 進一步發(fā)展。
商湯科技成立于2014年,是人工智能算法供應(yīng)商,專注于計算機視覺和深度學(xué)習原創(chuàng)技術(shù)。2021年,公司在港股上市,成為港股AI第一股,也是“AI四小龍”中首家上市企業(yè)。
上市之后,商湯科技卻不斷虧損。2021年至2023年,商湯科技同期歸母凈利潤分別虧損171億元、60億元、64億元。在下滑的營收和虧損的數(shù)據(jù)中,生成式AI成為商湯科技的業(yè)績亮點,其年報顯示,2023年生成式AI收入突破11.84億元,實現(xiàn)199.9%的飛速增長,逐步成為其核心業(yè)務(wù)。
在今年7月,商湯科技還將發(fā)布新版大模型,其具備更強的知識、數(shù)學(xué)、推理及代碼能力,綜合性能全面升級。
01、2023年,生成式AI業(yè)務(wù)爆發(fā)式增長199.9%
在2023年的業(yè)務(wù)重組中,商湯科技明確了新的三大業(yè)務(wù)板塊,生成式AI、傳統(tǒng)AI和智能汽車。其中,生成式AI業(yè)務(wù)為其重點發(fā)展方向。得益于在生成式AI業(yè)務(wù)上的不斷投入,2023年,商湯科技成功實現(xiàn)了生成式AI大模型從研發(fā)到商業(yè)化應(yīng)用的革新。
2023年4月,商湯科技推出“日日新SenseNove”大模型體系,這是商湯科技首個發(fā)布的大語言模型之一,同時還包括“秒畫”文書圖模型、3D內(nèi)容生成等多種生成式AI模型。
在2023年的7、8月份,商湯科技快速迭代了2.0和3.0版本,通過提高訓(xùn)練數(shù)據(jù)質(zhì)量,實現(xiàn)了基礎(chǔ)語言能力的顯著提升。其新的“模型即服務(wù)”商業(yè)模式,使客戶能夠輕松地在大裝置微調(diào)和調(diào)用各類生成式AI能力,無需自己建設(shè)和管理底層基礎(chǔ)設(shè)施。據(jù)了解,“日日新”成為國內(nèi)首個超越了GPT
3.5-turbo性能的基模型,也作為首批通過國家備案的大模型,正式面向用戶開放服務(wù)。
在算力規(guī)模上,“日日新”大規(guī)模體系實現(xiàn)了突破性增長。據(jù)了解,商湯科技大裝置的總算力達到12000petaFLOPS,連管GPU數(shù)量達45000卡。
對于商湯科技而言,生成式AI不僅僅是AI技術(shù)領(lǐng)域的變革性創(chuàng)新,更逐步成為其核心業(yè)務(wù)。據(jù)商湯科技公布的年報顯示,“日日新”大模型+大裝置帶動生成式AI收入突破11.837億元,業(yè)務(wù)實現(xiàn)199.9%的爆發(fā)式增長,占集團收入的比例由2022年的10.4%提升至34.8%。這是商湯科技成立十年以來,以最快速度從無到有、超過10億元收入體量的業(yè)務(wù)。
在弗若斯特沙利文發(fā)布的《2023年中國AI開發(fā)平臺市場報告中》,商湯科技在增長指數(shù)和創(chuàng)新指數(shù)兩大評估維度的綜合評分中位居國內(nèi)首位。這一成績不僅展示了商湯在生成式AI領(lǐng)域的領(lǐng)先地位,更是對其創(chuàng)新能力和市場擴張速度的國際認可。
02、獲20億港幣投資,將用于AI大模型
2024年,國內(nèi)的“百模大戰(zhàn)”進入深水區(qū),MiniMax、智譜AI、訊飛星火、華為、抖音等企業(yè)相繼推出大模型。作為已入局者,商湯科技不斷追求創(chuàng)新,提升大模型技術(shù)實力。
今年2月,商湯科技發(fā)布了“日日新”4.0版本,它在代碼編寫、數(shù)據(jù)分析和醫(yī)療問答等多種場景中達到與GPT-4相匹配的能力。同時,商湯科技開源了7B和20B兩種參數(shù)規(guī)格的基模型InternLM2,其性能超過了Meta的Llama2和Google的Gemma等同級別開源模型。此外,“秒畫”文生圖模型也經(jīng)歷了四次更新至4.0版本,提升到百億參數(shù)量,疊加十倍級推理加速的優(yōu)化。
為了進一步鞏固并擴大商湯科技在大模型、大裝置領(lǐng)域的領(lǐng)先地位,6月21日,商湯科技在港交所發(fā)布公告,根據(jù)一般授權(quán)配售新B類股份。在香港聯(lián)交所交易時段前,配售1673446000股配售股份,每股配售價為1.20港元。商湯科技表示,目前通過配售已獲得20.08億港元投資,多家戰(zhàn)略投資人及頭部基金入股,現(xiàn)有股東增持。
據(jù)了解,配售事項的所得款項凈額將主要用于繼續(xù)擴大商湯科技的領(lǐng)先優(yōu)勢,包括擴大商湯科技大裝置規(guī)模、支持大模型研究及產(chǎn)品開發(fā)的生成式AI 進一步發(fā)展,以及用作公司的一般營運資金。
在2024年戰(zhàn)略目標中,商湯科技也不斷強調(diào)將著力發(fā)展大模型。具體來說,將進一步發(fā)揮“大裝置+大模型”的深度協(xié)同優(yōu)勢,持續(xù)擴充算力規(guī)模、提升基礎(chǔ)設(shè)施和大模型的綜合服務(wù)能力;持續(xù)投入日日新模型體系的迭代,讓模型能力保持業(yè)界領(lǐng)先。
同時,商湯科技還將致力于實現(xiàn)大模型推理效率提升的摩爾定律,通過云+端結(jié)合等創(chuàng)新優(yōu)化策略,讓模型推理成本迅速降低,從而打開更廣闊的應(yīng)用場景。
03、“日日新SenseNova 5.0”大模型發(fā)布在即
在7月的WAIC世界人工智能大會上,商湯科技將發(fā)布其新版大模型——“日日新SenseNova 5.0”。
“日日新SenseNova 5.0”大模型,具備更強的知識、數(shù)學(xué)、推理及代碼能力,綜合性能全面升級。這主要得益于以下三個方面的提升:一是采用混合專家架構(gòu)(MoE),激活少量參數(shù)就能完成推理,且推理時上下文窗口達到200K 左右;二是基于超過10TB tokens訓(xùn)練、覆蓋數(shù)千億量級的邏輯型合成思維鏈數(shù)據(jù);三是商湯AI大裝置SenseCore算力設(shè)施與算法設(shè)計的聯(lián)合調(diào)優(yōu)。
日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級“日日新SenseNova 5.0”大模型進行了全方位綜合性測評,結(jié)果顯示在SuperCLUE綜合基準上,日日新5.0以總分80.03分的優(yōu)異成績刷新國內(nèi)最好成績,這也是國內(nèi)大模型首次在SuperCLUE中文基準測試中實現(xiàn)登頂。
在端側(cè)大模型應(yīng)用上,為了滿足移動終端用戶對大模型技術(shù)的應(yīng)用需求,商湯科技推出日日新·端側(cè)大模型,性能實現(xiàn)同等尺度性能最優(yōu),跨級尺度全面領(lǐng)先。其日日新·端側(cè)大語言模型的推理速度達到了業(yè)內(nèi)最快,可在中端平臺實現(xiàn)18.3字/s的平均生成速度,旗艦平臺更是達到了78.3字/s。
對于金融、代碼、醫(yī)療、政務(wù)等重點行業(yè)邊緣側(cè)日益增長的AI應(yīng)用需求,商湯科技正式推出企業(yè)級大模型一體機,可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。
此外,商湯科技前瞻洞察中心化算力需求向端側(cè)擴展的未來趨勢,以及企業(yè)級在邊緣側(cè)的AI需求,在業(yè)內(nèi)首次推出“云、端、邊”全棧大模型產(chǎn)品矩陣,其中包括應(yīng)用于終端設(shè)備的“商湯端側(cè)大模型”,以及面向金融、代碼、醫(yī)療、政務(wù)等多個領(lǐng)域的邊緣產(chǎn)品“商湯企業(yè)級大模型一體機”。
憑借在大裝置+大模型深度協(xié)同優(yōu)勢、云端協(xié)同能力,以及多場景落地的豐富經(jīng)驗,商湯科技將在人工智能2.0的風口上實現(xiàn)長遠的飛躍式發(fā)展。
文字|張文琪? ? ??編輯|呂穎穎