2023年,國內(nèi)半導體產(chǎn)業(yè)發(fā)展面臨著很大的不確定性,這應(yīng)該是共識。
IC芯片設(shè)計公司,重度研發(fā)創(chuàng)新導向。
站在企業(yè)角度,怎么在不確定性下,組織人、財、物,面向未來,應(yīng)對市場競爭?
算命?我們是不會的。
但我們可以幫各位CEO們算一算賬。
下一步,是自建數(shù)據(jù)中心?還是選擇研發(fā)云平臺?
我們將從現(xiàn)金流、時間、人、TCO(總體擁有成本)、研發(fā)架構(gòu)五個視角來展開對比,為各位做決策判斷提供支持。
現(xiàn)金流
現(xiàn)金流:在銀行的現(xiàn)金,不包括受限制的現(xiàn)金、投資或任何被捆綁的東西。未收到的現(xiàn)金不是現(xiàn)金。
現(xiàn)金管理是CEO的首要任務(wù),他需要知道:
第一,在任何給定時間點有多少流動現(xiàn)金;
第二,未來有多少個月的跑道。
這就暗含了三個要求:
1)減少當下流動現(xiàn)金的占用,增加OpEx,減少CapEx
2)未來現(xiàn)金支出的可預測性
3)環(huán)境如果發(fā)生變化,未來支出的彈性
自建數(shù)據(jù)中心
計算、存儲、網(wǎng)絡(luò)、機房等,屬于典型固定資產(chǎn),全是CapEx,對現(xiàn)金流是一次性占用。
資源規(guī)劃幾乎是所有公司存在的痛點,未來需求很難預測:
按頂格規(guī)劃,會造成巨大浪費;按中間取值準備,當某個時間點任務(wù)量激增,就會出現(xiàn)人機不匹配,不是有人力沒機器,就是有機器沒人力。這種錯配導致資源利用率極低,影響研發(fā)進度。
不知道什么時候就需要擴建,而且只能加不能減,不需要的時候就是閑置的廢鐵。
研發(fā)云平臺
0固定資產(chǎn),全是OpEx,按需付費,現(xiàn)金流可以根據(jù)需要緩慢支出。
未來支出可控制且可預測,我們有科學的估算方法《解密一顆芯片設(shè)計的全生命周期算力需求》,專門解決算力資源規(guī)劃和現(xiàn)金流之間的平衡。配合我們的Auto-Scale功能自動伸縮,隨用隨關(guān)不浪費,資源使用盡量貼合業(yè)務(wù)
需求曲線。同時,還能在團隊內(nèi)部避免資源錯配。
未來資源使用具備彈性,隨買隨用。有需求時可擴大,需求收縮時可一并收縮,非常靈活。
時間
我們把時間分為兩種,一種可以節(jié)省的過去時間,一種需要爭搶的未來時間。
可以節(jié)省的過去時間:
1)硬件采購周期
2)機房建設(shè)周期
3)軟件功能模塊需求評估、供應(yīng)商選型及評估周期
4)本地研發(fā)環(huán)境開發(fā)、建設(shè)、測試周期
自建數(shù)據(jù)中心 VS 研發(fā)云平臺
研發(fā)云平臺是端到端的一整套IC設(shè)計研發(fā)云環(huán)境,包括算力、存儲、VPN、VDI、EDA運行環(huán)境,且能覆蓋整個芯片設(shè)計的全生命周期,是已經(jīng)經(jīng)過數(shù)百家客戶實踐與驗證的成熟產(chǎn)品。比如最近發(fā)的這篇燧原案例。
無需硬件采購、機房建設(shè),不需要從零開始進行功能模塊需求評估,一家家供應(yīng)商選型、對接、開發(fā)和測試驗證兼容性,研發(fā)環(huán)境可以快速啟動。
能節(jié)省的過去時間全節(jié)省了。
需要爭搶的未來時間:
- 1)算力需求高峰期
- 2)項目出現(xiàn)緊急突發(fā)需求
- 3)芯片TO前
- 4)研發(fā)任務(wù)高并發(fā)排隊等待期間
研發(fā)云平臺資源隨用隨開,彈性使用,可以隨時滿足各種業(yè)務(wù)突發(fā)需求,全球數(shù)據(jù)中心提供資源充足保障。
自建數(shù)據(jù)中心,任何變動都需要比較長的周期,幾乎不能應(yīng)對緊急情況。
人
企業(yè)人力資源,主要分為管理者、研發(fā)工程師、CAD、IT/運維工程師。
先說招聘難度。
成熟有經(jīng)驗有能力的研發(fā)工程師和IT/CAD,重金難求。甚至逼得國內(nèi)半導體公司不得不組建海外研發(fā)團隊來滿足部分需求。
再談關(guān)注點:人力成本和人效。
人力成本
上一點里提到自建數(shù)據(jù)中心需要的:硬件采購及后期維護,機房建設(shè),軟件功能模塊需求評估、供應(yīng)商選型及評估,本地研發(fā)環(huán)境開發(fā)、建設(shè)、測試,所有的事情都需要專業(yè)的人來完成,需要耗費大量人力成本。
人效
我們的研發(fā)云平臺不但這些事全都省了,在產(chǎn)品能力之外,還提供從IT到CAD的全方位服務(wù)支持。
管理者:釋放管理者帶寬,關(guān)注項目整體效率;
研發(fā)工程師:專注研發(fā),任務(wù)并發(fā)度高,資源適配,提升研發(fā)效率;
IT/CAD:底層資源統(tǒng)一管理,屏蔽底層技術(shù)細節(jié),全維度IT自動化,提高管理帶寬,原來一個人管十臺,現(xiàn)在一個人管一百臺。
TCO(總擁有成本)
先說一個熱知識,我們在云上使用的服務(wù)器和本地采購的服務(wù)器在物理層面上是一樣的,所以兩者之間的差異主要是構(gòu)建在物理實體之上的產(chǎn)品功能模塊與服務(wù)水平。
當然,對企業(yè)來說,最重要的差異在于:使用方式和計費模式。
我們將TCO分成兩大類,一類看得見的,一類看不見的。
自建數(shù)據(jù)中心看得見的成本包括四類:
1)計算、存儲、網(wǎng)絡(luò)等硬件設(shè)備成本+硬件維保服務(wù)成本
2)機房建設(shè)+電費等成本
3)集群調(diào)度軟件+軟件維保服務(wù)成本
4)人力成本:軟件功能模塊需求評估、供應(yīng)商選型及評估,本地研發(fā)環(huán)境開發(fā)、建設(shè)、測試
研發(fā)云平臺除了計算、存儲、網(wǎng)絡(luò)等硬件設(shè)備需要按使用時長付租賃費用以外,其他成本皆為0。我們的集群調(diào)度軟件Fsched是我們自主研發(fā)的,性能與商業(yè)調(diào)度器完全一致,我們能提供代碼級的技術(shù)支持。
看不見的成本是由兩種截然不同的使用方式帶來的。
比如下圖某無線通信芯片公司算法團隊9個月實際日平均資源用量波動總覽圖,具有需求不可測、短時間使用量波動巨大等特點。
自建數(shù)據(jù)中心先建設(shè),后使用。可能出現(xiàn)三種情況:
1)需求高峰期的任務(wù)排隊等待和項目周期拖延
2)需求低谷時的資源閑置
3)資源錯配帶來的內(nèi)部浪費。
而研發(fā)云平臺按需使用,隨用隨開,可以做到隨資源需求曲線平滑波動,利用率極高,以上情況幾乎不存在。
我們是怎么做到的?詳情戳:芯片設(shè)計五部曲之三 | 戰(zhàn)略規(guī)劃家——算法仿真
研發(fā)架構(gòu)
研發(fā)架構(gòu),聽起來比較抽象,但是是研發(fā)型企業(yè)的根基之所在。
- 自建數(shù)據(jù)中心是封閉的,自成一體,或者分成一個個的孤島。
- 對外界變化的兼容性不強,任何變動都涉及不小的建設(shè)工程量。
- 運行情況接近于黑箱,很難獲取內(nèi)部的數(shù)據(jù)和信息。
研發(fā)云平臺是開放的統(tǒng)一平臺,對現(xiàn)在與未來的兼容性與彈性極強。
資源層的兼容:支持N*本地+N*云的混合云模式,資源使用彈性極大,從0到數(shù)萬核;
地理位置的兼容:支持N*國內(nèi)研發(fā)中心+N*海外研發(fā)中心的全球化協(xié)同;
用戶層的兼容:不改變用戶使用習慣,使用人數(shù)具備彈性,可上可下,幾人到數(shù)百人;
業(yè)務(wù)層的兼容:覆蓋整個芯片設(shè)計生命周期,支持多項目組多產(chǎn)品線。
平臺內(nèi)部運行方式是透明的,團隊管理者可以監(jiān)控各個重要指標,從全局角度掌握項目的整體任務(wù)及資源情況,為未來項目規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。
比如,半導體企業(yè)特別關(guān)心的EDA License使用優(yōu)化功能,可幫助企業(yè)用戶最大化提升License的利用率,更好地規(guī)劃License的購買策略,控制整體使用成本。