文|?Juny??編輯| VickyXiao
美西時間今天早間,大數(shù)據(jù)巨頭Databricks 宣布已簽署最終協(xié)議,將以13億美元的價格,收購位于舊金山的人工智能初創(chuàng)公司MosaicML 。
該收購之后,MosaicML 將成為 Databricks Lakehouse 平臺的一部分,MosaicML 的整個團隊和技術(shù)都將納入Databricks旗下,為企業(yè)提供統(tǒng)一的平臺來管理數(shù)據(jù)資產(chǎn),并且能夠使用自己的專有數(shù)據(jù)來構(gòu)建、擁有和保護自己的生成式 AI 模型。
值得注意的是,MosaicML是一家非常年輕的生成式AI公司,它于2021年成立于舊金山,目前只公開披露過一輪融資,員工僅62人。在上一輪的融資中,其估值為2.2億美元,也就是說,此次收購MosaicML的估值直接躍升了6倍。
此筆交易是截至目前今年生成式AI領(lǐng)域內(nèi)所公布的最大一筆收購案。就在不久前,云計算巨頭Snowflake剛剛宣布收購了另一家生成式AI公司Neeva。在經(jīng)歷了幾個月的投資熱之后,大型企業(yè)對生成式AI初創(chuàng)公司的大規(guī)模并購潮似乎正在開啟。
|MosaicML是誰?
MosaicML 由曾在 Intel 擔任人工智能產(chǎn)品負責人、Nervana Systems 的聯(lián)合創(chuàng)始人 Naveen Rao 以及英特爾AI實驗室的高級主管Hanlin Tang創(chuàng)立。
MosaicML的創(chuàng)始人,Hanlin Tang(左一)、Naveen Rao(左二),圖片來自MosaicML
Naveen Rao 1997年畢業(yè)于杜克大學的計算機科學專業(yè),后取得布朗大學神經(jīng)科學的博士學位,長期致力于人工智能神經(jīng)網(wǎng)絡(luò)的學習和開發(fā)。他曾在高通擔任過神經(jīng)形態(tài)機器的研究員,并曾在2014年創(chuàng)立了人工智能公司Nervana Systems。
或許現(xiàn)在很多人并不熟悉Nervana Systems,但在深度學習和AI芯片領(lǐng)域,Nervana可以說曾經(jīng)風頭無兩。Nervana 的目標是通過其云服務(wù)和硬件產(chǎn)品來改善深度學習的計算效率,它在2015年推出了超強性能的深度學習底層框架Neon在業(yè)界一炮而紅,緊接著在2016年推出了Nervana Cloud深度學習云平臺,以及Nervana Engine專用硬件加速器。
Nervana 表示,在Nervana Cloud中把Neon框架運行在Nervana Engine芯片上后,該組合能夠比英偉達Titan X的性能高出10倍。Nervana的強勁表現(xiàn)在當時也引起了芯片霸主英特爾的注意,而英特爾在AI領(lǐng)域所邁出的第一個大動作就是——花4億美元收購Nervana。
被收購之后,Naveen Rao成為了英特爾人工智能產(chǎn)品的負責人,Neon架構(gòu)和Nervana的相關(guān)產(chǎn)品也被整合到英特爾的產(chǎn)品線中,Nervana Engine被定名為Crest系列。
此后,在2017年-2019年間,英特爾多次發(fā)布Nervana Lake Crest的進展,并多次公布包括Nervana NNP-T系列等相關(guān)芯片產(chǎn)品。但就在大家等待著該系列芯片量產(chǎn)時,2020年,英特爾突然宣布將用自己后來花20億美元收購的以色列公司Habana系列產(chǎn)品取代原定的Nervana服務(wù)器端AI加速芯片。當時業(yè)界分析的原因是Habana的技術(shù)和設(shè)計更具可擴展性,并且已經(jīng)具有量產(chǎn)交付能力。
而在英特爾決定“拋棄” Nervana后,Naveen Rao和Nervana的前核心員工Hanlin Tang也離開了英特爾,兩人另立門戶創(chuàng)立了MosaicML。根據(jù)LinkedIn的信息,Hanlin Tang應(yīng)該是一名華裔,曾在哈佛大學取得生物物理學博士學位,目前擔任MosaicML的CTO。
那么,從英特爾“出走:后的MosaicML主要做什么業(yè)務(wù)呢?
MosaicML仍然致力于幫助企業(yè)提高AI效率上,只是這次他們不再在硬件上投入過多精力,而是專注于生成式AI。簡單來說,MosaicML提供了一個平臺,讓各類型企業(yè)都可以輕松地在安全的環(huán)境中訓練和部署 AI 模型,并且?guī)椭髽I(yè)降低AI系統(tǒng)的開銷。
他們的產(chǎn)品組合產(chǎn)品組合包括開源的、商業(yè)授權(quán)的MPT Foundation系列模型和MosaicML 推理和訓練服務(wù),為企業(yè)提供了一系列的工具。
比如,MosaicML Explorer可以幫助開發(fā)人員探索和理解不同的云服務(wù)和硬件選項之間的時間、性能和成本,以簡化和評估實施選項。推出MosaicML Composer開源的深度學習庫,提供20種用于計算機視覺和自然語言處理的方法,包括模型、數(shù)據(jù)集和基準。推出MosaicML AI開發(fā)平臺,提供了成本效益高的模型部署和定制訓練,同時保證數(shù)據(jù)安全,使用戶能夠擁有模型的所有權(quán)等。
圖片來自MosaicML官網(wǎng)
|瞄準企業(yè)服務(wù),Databricks也要用生成式AI出招
回看MosaicML的創(chuàng)始團隊,可以說他們的業(yè)務(wù)選擇一直都比潮流領(lǐng)先了一步。在大家都還在觀望時做AI芯片,在AI行業(yè)的低谷中做率先探索生成式AI的商業(yè)化。
憑借著強大的團隊技術(shù)背景和行業(yè)經(jīng)驗,MosaicML剛成立不久就得到了知名風投DCVC、Lux Capital、Future Ventures等投資者3700萬美元的融資,之后的融資總額攀升到了6400萬美元。據(jù)了解,Databricks收購MosaicML,主要還是看中其生成式AI模型在企業(yè)端的商業(yè)化能力。
MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以來,使用大量數(shù)據(jù)進行“訓練”的人工智能模型的復(fù)雜度急劇上升,訓練一個模型現(xiàn)在至少要花費數(shù)百萬美元,除了大公司之外,其他中小型企業(yè)普遍都無法承受。
而此次收購之后,Databricks的Lakehouse 平臺和 MosaicML 技術(shù)的聯(lián)合產(chǎn)品將能夠讓企業(yè)可以使用自己的專有數(shù)據(jù)來簡單、快速、低成本進行生成式AI模型的訓練和構(gòu)建,在讓用戶擁有數(shù)據(jù)的控制權(quán)和所有權(quán)的情況下,可以進行自定義 AI 模型開發(fā)。
圖片來自MosaicML官網(wǎng)
MosaicML 的模型訓練自動優(yōu)化承諾比傳統(tǒng)方法快 2–7 倍的訓練速度,資源的近線性可伸縮性確保了具有數(shù)十億參數(shù)的模型可以在幾小時內(nèi)訓練,而不是過去的幾天。根據(jù)Databricks的相關(guān)說法,在 Databricks 和 MosaicML的平臺和技術(shù)支持下,企業(yè)訓練和使用 LLMs 的成本將顯著降低,預(yù)計可以降至數(shù)千美元左右。
值得注意的是,在MosaicML加入之前, Databricks曾基于EleutherAI 的 Pythia-12b 開發(fā)了一個名為 Dolly-2 的120 億參數(shù)語言模型,而伴隨著此次 MosiacML的加入,Databricks未來將提供 Dolly-2 和 MosaicML MPT兩個領(lǐng)先的大語言模型。
“每個組織都應(yīng)該能夠從人工智能革命中受益,并對其數(shù)據(jù)的使用方式有更多的控制。Databricks 和 MosaicML 有一個難以置信的機會來實現(xiàn)人工智能的民主化,并使 Lakehouse 成為構(gòu)建生成式人工智能的最佳場所?!盌atabricks 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Ali Ghodsi 在新聞稿中表示。
|60名員工喜提“大禮包”,AIGC并購潮拉開帷幕
MosaicML?收購是目前生成式 AI 領(lǐng)域里目前公開披露的最大交易,高達13億的收購額對于目前僅有62員工的MosaicML來說也無疑是天降“大禮包”。
根據(jù)Levels.fyi的數(shù)據(jù),此前MosaicML的軟件工程師的薪資平均水平在75萬美元到85萬美元之間。員工的期權(quán)會以現(xiàn)金折現(xiàn)或是轉(zhuǎn)成Databricks的期權(quán)目前還尚不清楚,但而此次收購之后,MosaicML的整個團隊都將加入Databricks。
圖片來自Levels.fyi
在當前的AI熱潮下,大型公司對于生成式AI初創(chuàng)公司的并購或許才剛剛拉開帷幕。
不久前,云數(shù)據(jù)管理領(lǐng)軍企業(yè) Snowflake剛宣布收購了由兩位前 Google 員工創(chuàng)立的生成式AI搜索初創(chuàng)公司 Neeva,交易額并未向外公布。Neeva主要業(yè)務(wù)是利用生成性 AI 進行搜索,并且主要聚焦在企業(yè)搜索領(lǐng)域。加入Snowflake之后,Neeva將幫助服務(wù)企業(yè)客戶利用AI去快速搜索和分析數(shù)據(jù)點、數(shù)據(jù)資產(chǎn),獲得數(shù)據(jù)洞察的能力。
從Snowflake和Databricks接連的收購步伐中我們可以看到,大型科技公司對于生成式AI技術(shù)正在從自主研發(fā)、戰(zhàn)略投資逐步邁向兼并收購階段。這也給一些初創(chuàng)型生成式AI公司提供了更多的機會,不出意外的話,我們還會在今年下半年看到更多類似的收購案出現(xiàn)。
此外,無論是這兩筆大型收購的應(yīng)用方向,還是Cohere、Anthropic等近期高歌猛進的獨角獸,其業(yè)務(wù)重點都主要是在生成式AI技術(shù)的企業(yè)級應(yīng)用方面。
在消費端熱鬧了大半年之后,生成式AI技術(shù)開始大舉朝著企業(yè)用戶進軍。