?
人工智能世界,在多少年前,是只能從科幻電影中看到的場景。而今這個熒幕上的夢正在照進現(xiàn)實,一步步從理論走向?qū)嶋H。這條路無疑是不好走、漫長的。
回頭看計算機發(fā)展史,就不難發(fā)現(xiàn),新的計算模式一般都會催生新的專用芯片。因此,可以想象,未來的人工智能芯片領域有多大的市場。畢竟,在多少年以后,這個世界將是人工智能的世界。
芯片,一直以來都是中國半導體行業(yè)乃至整個中國的“心腹大患”,“缺芯之痛”也一直受人詬病。從前,我們沒有好的芯片,很大程度上是我們國家半導體行業(yè)發(fā)展本身就比其他國家晚,錯過了最佳的市場。而在這輪人工智能浪潮中,全世界都處于同一起跑線上,都渴望從這未來的巨大市場中殺出重圍,奪得“一畝三分地”。而這次,中國芯片更是前所未有的靠近世界前沿,不僅能和歐美初創(chuàng)公司比肩,甚至還渴望于英偉達、谷歌、英特爾等巨頭口中奪食。
前兩期與非網(wǎng)《中國芯勢力》欄目,走近了兩家人工智能芯片廠商——地平線和寒武紀。今天,我們就來看看另外一個經(jīng)常被人與這兩家公司同時提起的人工智能處理器廠商——深鑒科技。
姚老板和他的師父師兄們
隨便在各大搜索網(wǎng)站上搜索一下“深鑒科技”,就可以看到這家公司有多年輕,這個團隊有多年輕。提到深鑒科技,必定繞不過一個“清華四人幫”,那就是姚頌和他的師父師兄們。
姚頌可謂是我們口中的“學霸”,從小學一路直升,2011 年高三保送至清華大學電子系。這或許并不是什么值得驚奇的事情,因為這樣的學霸,估計還是不少。但,姚頌從大一就進入實驗室,恐怕理工科同學更能理解到這有多牛逼,想想小編大一的時候天天謀劃著下課去吃什么,差距呀!在本科階段,姚頌不僅在斯坦佛訪問;微軟亞洲研究院實習;開發(fā)項目;發(fā)表論文。還擔任電子系科協(xié)主席,主辦過電設等一系列科創(chuàng)賽事??赡芤彩且驗榭茀f(xié)主席這個位置和公司 CEO 有很多類似的地方吧,因此姚頌人送外號:姚老板。
師兄弟一起創(chuàng)業(yè)或許還是比較尋常的,但師生一起創(chuàng)業(yè),恐怕就是少數(shù)了。深鑒科技就是這么來的。姚頌的本科生導師汪玉,說起來可能還是姚頌走上人工智能之路的指引者。
2012 年姚頌便跟著汪玉開始涉足人工智能、深度學習領域。
2012 年底,汪玉看到了那場名為“ImageNet”的大賽,覺得非常有意思,便“召集”了他的學生——包括姚頌在內(nèi)的 3 員猛將,展開對深度學習軟件的研究。
2015 年畢業(yè)前夕,姚頌順利拿到了卡耐基梅隆大學(CMU)攻讀博士學位的邀請,但被姚頌拒絕了,“要知道 CMU 的博士一般是 6 年,這 6 年的時間可能讓我錯失很多事情?!?/p>
也是 2015 年姚頌畢業(yè)之際,隨著實驗室算法做的越來越好,合作的項目也在不斷增加的情況下,技術的商業(yè)落地情況卻始終不能讓姚頌滿意,姚頌判斷是時候成立一家公司來解決這個問題了。
有了這一次的成功,姚頌舊事重提,鼓勵自己的老師邁出步伐,讓世界看看到底什么才是“中國制造”。經(jīng)過了反復斟酌,汪玉決定走出校門。
?
2016 年年初,姚頌拉著老師汪玉,以及遠在美國斯坦福大學(當時 PHD 在讀,后任教 MIT)的韓松,“謀劃”成立一個公司。就這樣,這個想要“開拓人工智能應用邊界”的深鑒科技終于落地,而這也成為了這個師生組合實現(xiàn)夢想的起跑線。作為創(chuàng)始團隊中唯一一個全職人員,姚頌則成為 CEO,開始了從學生到公司創(chuàng)始人的角色轉(zhuǎn)變。
深鑒科技的另外一位合伙人單羿,是 2016 年年底才加入這個“清華幫”的,他是汪玉帶的第一位博士生。曾在地平線機器人擔任 FPGA 技術負責人,在百度深度學習研究院擔任高級工程師。
圖|合伙人兼 CTO 單羿、聯(lián)合創(chuàng)始人汪玉、聯(lián)合創(chuàng)始人兼 CEO 姚頌,聯(lián)合創(chuàng)始人韓松(左起)
早期的深鑒科技,充滿了學院氣息,有很多兼職學生和實習生。就算汪玉自 2007 年開始就做硬件加速研發(fā),積累了豐富的經(jīng)驗和技術。而深鑒團隊也有了一定的組織架構、產(chǎn)品形態(tài),但技術部門之間沒有形成很好的合力,產(chǎn)品進展較慢,跟不上市場需求。
單羿加入深鑒后,擔任 CTO,調(diào)整團隊成員架構,將學生替換成社招人員,提高研發(fā)標準,加速產(chǎn)品落地。
優(yōu)化后的團隊,分為算法、軟件、硬件和芯片四個方向。核心是做芯片系統(tǒng),由芯片提供算力,硬件為芯片打磨硬件系統(tǒng),同時用 FPGA 這種平臺做先期客戶的接觸和反饋。軟件把壓縮工具、量化工具、編譯器工具、部署工具穿到一起,形成一個產(chǎn)品系統(tǒng)。同時關注最新算法的演進趨勢,為芯片架構設計提供指導。
有著清華和斯坦福雙重學術背景的深鑒科技,吸引到的多是此類學術背景的人才,以電子系和微電子專業(yè)居多,更偏向工程類人才。公司員工有一半以上都來自清華。
清華幫在國內(nèi)人工智能領域可謂是“呼風喚雨”,曠視科技團隊多來自清華計算機系。地平線軟件副總裁楊銘、算法副總裁黃暢也是來自清華電子系和計算機系。商湯科技副總裁楊帆亦是清華電子系出身。
姚頌在某次采訪的時候表示,全國清華相關專業(yè)畢業(yè)的碩博一年加起來也就百余人,有 BAT、華為、商湯、曠視,以及我們在搶。所以每一家公司能夠分到幾個就已經(jīng)很不容易。
引進人才的好處也是明顯的:2017 年 10 月,深鑒一口氣推出 6 款深度學習產(chǎn)品,產(chǎn)品落地、商業(yè)化速度明顯加快。
小編插播一句,各位還在迷茫的朋友們,知道往哪里努力了吧~~~
背后的故事——融資那點事兒
對于任何一家創(chuàng)業(yè)公司,甚至已經(jīng)有點名氣的企業(yè),融資都是一件很重要的事。畢竟,錢才能將你的 ideas 一一實現(xiàn)的最好最快途徑。
從做出決定要做創(chuàng)業(yè)的那天起,姚頌就開始寫 BP,見投資人。一天見一位,白天談融資,晚上就加班加點修改 BP。一連見了十來個投資人,但都對姚頌他們表示懷疑:純學術的團隊,一位太過年輕的 CEO、一位大學老師、一位美國 PHD,到底能不能干成這件事?
講了無數(shù)遍 BP,被人質(zhì)疑,拍的死去活來。但依然得咬緊牙關接著改,接著見,接著講;再改,再見,再講 ......
若非超常的抗壓能力,或許早已經(jīng)放棄了吧,這也許就是姚頌年紀輕輕就能做 CEO 的原因。
就這樣直到 2016 年 2 月,姚頌到硅谷參加學術會議,遇到了金沙江創(chuàng)投在美國的合伙人林仁俊。兩人聊了一下午,從人工智能和半導體行業(yè)幾十年的發(fā)展,聊到后摩爾定律時代的芯片延續(xù),最后得到一個結論,交叉點一定會出現(xiàn)人工智能芯片,當場談定意向,第二周就簽了合同。
彼時的金沙江創(chuàng)投已經(jīng)在人工智能領域盤旋多時,合伙人予彤認為,人工智能初期,解決算法能力問題,建立通用的基礎設施非常重要。
當時予彤也在看國外的項目,由于同樣出身于清華大學電子系,予彤認識深鑒科技的汪玉以及韓松,金沙江創(chuàng)投比其它一線基金有更多的機會和維度去深度感知深鑒科技的基礎技術、企業(yè)氛圍等。予彤還表示,“中國有做這件事的團隊,所以我們直接投了。”
這場投資或許是異常冒險,但更多的還是姚頌表現(xiàn)出來的氣質(zhì)以及展現(xiàn)出來的東西讓投資人覺得大有可為吧。
姚頌拿到這筆融資非常激動,因為這之前他們在失敗四五十次。
技術、產(chǎn)品雙管齊下
深鑒科技成立之初,就定下了公司發(fā)展的兩條線路:一條是以芯片技術為主的純技術路線;另一條是基于技術的產(chǎn)品路線。
作為公司的 CEO,姚頌表示,搞技術研發(fā)的人,很容易鉆到技術里面出不來,但是作為一家公司,若是單純只鉆研技術,不顧產(chǎn)品化,只會被市場淘汰。
?
“拋棄”無人機,從安防“開口”
起初,產(chǎn)品上深鑒嘗試選擇做無人機和智能機器人領域的解決方案提供商。
2016 年,他們與一家無人機公司合作,推出了一款只有巴掌大小的智能無人機,在滿足尺寸、功耗、價格的條件下,通過 Zynq FPGA 平臺實現(xiàn)實時的多人檢測、姿態(tài)識別、追蹤。
芯片是一個高投入、邊際成本很低的產(chǎn)品,它前期研發(fā)成本很高,后期批量生產(chǎn)成本非常低。硅片的硬件成本和原料成本,被姚頌戲稱為“沙子錢”。芯片靠量產(chǎn)把研發(fā)成本攤薄,無人機市場顯然滿足不了量的要求。
再者當時大疆已經(jīng)在全球無人機市場占據(jù) 70%~80%的市場份額,而市場也不大,對于新創(chuàng)業(yè)者而言市場及其有限。
除非你能超過大疆。
那自動駕駛呢?三五年不會有量產(chǎn)車上路,創(chuàng)業(yè)公司拖不起。
智能家居呢?風聲大雨點小,沒有幾個家庭真正用上。
數(shù)據(jù)中心呢?英偉達打算接手英特爾的攤子,正在全面布局,直接交鋒不理智。
人工智能呢?概念太熱,卻一直在為商業(yè)化苦苦掙扎。作為人工智能的技術底層芯片供應商,深鑒科技也在摸索類似的路徑。
2016 年末,姚頌做了好幾個月的調(diào)研,他認為公司應該嘗試轉(zhuǎn)型安防領域,并且在春節(jié)前后召開核心成員的閉門會議討論最終決策。
安防的水很深,整個系統(tǒng)格局非常復雜,是一個相對封閉的環(huán)境。??低?、大華這種安防產(chǎn)品的行業(yè)巨頭,掌握了大部分的資源,而一些小的安防設備公司,也在各自的地盤有著不錯的營生。
深鑒科技知道自己“幾斤幾兩”,并且擅長做跟 AI 相關的一整套方案。因此深鑒并不想從??低暋⒋笕A口中奪食,而是轉(zhuǎn)而做他們背后的 AI 方案提供商,從而節(jié)省他們的產(chǎn)品研發(fā)時間。
眾所周知,目前 AI 市場上,最吃香的莫過于英偉達。英偉達依靠 GPU 在數(shù)據(jù)中心、自動駕駛等領域“橫沖直撞”。在安防領域,基于 GPU 的智能安防成本較高,因為 GPU 的高性能、高功耗、高成本,要求 GPU 布局在服務端,一般也只有公安能承擔這個成本。普通小區(qū)安防布置視頻監(jiān)控,不可能布置服務器在小區(qū),也不會直接連接在公安,只連到保安室讓人在電腦前盯著。
而深鑒主打低功耗??蓡?、滿足小區(qū)視頻監(jiān)控的需求,做成一個功耗十幾瓦到二十瓦的小盒子,能做八路視頻識別,攝像頭直接連接小盒子,數(shù)據(jù)再傳到電腦上看。
金溢科技,全國最大的 ETC 公司,主營公路收費、停車收費。傳統(tǒng) ETC 在地底下埋一個線圈,車通過的時候,上面的雷達探測到車輛,線圈會感應上面 ETC 的芯片卡,進行收費。
它的痛點在于線圈昂貴、易損耗,只能進口,廣泛應用在停車場,成本會非常高。此外,如果不是 ETC 的車,開到 ETC 通道,還要倒車出去換一個通道。
在傳統(tǒng)的線圈電磁感應之外,加一塊視頻作為輔助,在路邊吊個桿掛一個小攝像頭,識別車型和車牌號。在高速公路通行雷達上面加一個攝像頭,遠遠就看到車輛牌照,如果不是 ETC 的車輛,就請車輛走另外的車道。
軟件對于 AI 的芯片來說非常關鍵,英特爾之所以成功與和微軟深度綁定有關,AMD 之所以市值才百億美元,也與軟件做得很差脫不開干系。
深鑒科技開發(fā)了國內(nèi)第一個敢拿出來給客戶使用的神經(jīng)網(wǎng)絡開發(fā)軟件 DNNDK。
AI 芯片
國內(nèi)研發(fā) AI 芯片的公司,除了深鑒以外,還有寒武紀、地平線等。
寒武紀側(cè)重于通用芯片,既做訓練又做應用,首先布局在智能終端。
地平線則是提供一個閉環(huán)的封閉系統(tǒng),客戶購買算法加上硬件的全套解決方案,算法加硬件都固定在一個“黑盒子”里。
深鑒科技的芯片叫做 DPU,這是深度學習處理器。AI 分訓練和應用兩層,而深鑒選擇做深度學習應用端,不做訓練端。
所謂 DPU 既深度學習處理器,其精髓就在于使用了深度壓縮技術。這項技術不僅可以將神經(jīng)網(wǎng)絡壓縮數(shù)十倍而不影響精度,還可以使用芯片存儲深度學習算法模型,減少內(nèi)存讀取次數(shù),大大降低運行功耗。
與此同時,基于優(yōu)化協(xié)同性,深度壓縮技術對于硬件本身也提出了新的要求。為此,深鑒科技推出了兩種用于深度學習處理器的底層架構——亞里士多德架構和笛卡爾架構,以及面向 DPU 的深度神經(jīng)網(wǎng)絡開發(fā)工具包 DNNDK。
2017 年 10 月,深鑒科技推出了六款 AI 產(chǎn)品,分別是人臉檢測識別模組、人臉分析解決方案、視頻結構化解決方案、ARISTOTLE 架構平臺,深度學習 SDK DNNDK、雙目深度視覺套件。而在人工智能芯片方面,公布了最新的芯片計劃,由深鑒科技自主研發(fā)的芯片“聽濤”、“觀海”將于 2018 年第三季度面市,該芯片采用臺積電 28nm 工藝,亞里士多德架構,峰值性能 3.7TOPS/W。
姚頌認為,所有產(chǎn)品都可以分為四個層次:能用、好用、讓用戶想用、讓用戶愛用。
對 AI 芯片來說亦是如此:
能用,就是這塊芯片能夠跑 AI、能夠?qū)ι疃葘W習運算進行加速。
好用,如何讓這塊芯片支持的 AI 算法種類多一點,讓用戶開發(fā)起來更簡單。
想用,那就是用戶用你的產(chǎn)品開發(fā)起來更簡單、算法跑出來性能更好,選擇別的產(chǎn)品時開發(fā)起來更麻煩。
愛用,也就是用戶粘性高,當很多使用你的芯片的人集成在一起,形成社區(qū)與軟件生態(tài),有很多開放的項目代碼可以供人交流參考,這就不僅是能用或者好用了,而是讓用戶愛用。
在這波人工智能創(chuàng)業(yè)浪潮中,主要分為兩個方向:以算法為主,做算法研究;以硬件為主,做 AI 芯片。
而深鑒科技的選擇是:軟硬件協(xié)同發(fā)展。
核心技術
據(jù)了解,深鑒科技最為核心的就是 Deep Learning Processing Unit (DPU) 及神經(jīng)網(wǎng)絡壓縮編譯技術,甚至并被世界最大的 FPGA 芯片廠商賽靈思認為是世界深度學習硬件加速的典范。
鑒科技在體系結構領域發(fā)表的頂會論文(不完全統(tǒng)計):
NIPS 2015:神經(jīng)計算領域世界最頂級學術會議;
FPGA 2016:FPGA 領域世界最頂級學術會議;
ICLR 2016 Best Paper:深度學習領域世界最頂級學術會議;
ISCA 2016:計算機體系結構領域世界最頂級學術會議;
Hot Chips 2016:半導體工業(yè)界最頂級會議。
科學技術是第一生產(chǎn)力
在人工智能領域,科學技術依然是第一生產(chǎn)力。深鑒科技成立不到三年,推出多款產(chǎn)品,與多家廠商達成合作,順利拿到融資,成績單還是非常亮眼。隨著深度學習的發(fā)展,國內(nèi)外的企業(yè)都瞄準了 FPGA,深鑒科技卻搶先一步,前景還是值得期待。
畢竟,“缺芯”是中國半導體之痛,對數(shù)十年來一直落后的中國芯片產(chǎn)業(yè)來說,在人工智能時代,大家都處于同一起跑線上,這是一次彎道超車的難得機遇,中國能否漂亮的完成“彎道超車”,非常值得期待。
了解更多相關內(nèi)容,歡迎點擊深鑒科技繼續(xù)閱讀!
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!