又粗又大又长亚洲,看成年女人午夜毛片免费

高通在汽車領(lǐng)域快速崛起，壟斷中高端座艙領(lǐng)域，但在高通整體營收上，汽車業(yè)務(wù)所占比例很低。在其最近的財(cái)季里，高通手機(jī)領(lǐng)域收入62億美元，汽車業(yè)務(wù)收入6.03億美元，IoT業(yè)務(wù)收入12億美元。高通近期特別聚焦于AI PC領(lǐng)域，其潛在的市場規(guī)模遠(yuǎn)高于市場，看看英特爾的利潤率便知AI PC的利潤率也不會(huì)低于汽車領(lǐng)域。

高通也在2024年Computex大會(huì)上做了“PC產(chǎn)業(yè)將開始重生（Reborn）”的演講。

高通的第四代汽車SoC芯片仍然是和筆記本電腦、手機(jī)等共用核心架構(gòu)，這樣做并無不妥，如今汽車SoC芯片越來越像PC用的CPU，特別是和AI PC的CPU的要求幾乎完全一致。

高通第三代代表作SA8295實(shí)際就是筆記本電腦領(lǐng)域里的Snapdragon 8cx Gen 3，高通第四代大概率就是Snapdragon X Elite的車規(guī)版，不會(huì)有太大差異。

Snapdragon X Elite有三款芯片，主要差別是CPU的頻率。高通也罕見公開了Snapdragon X Elite的詳細(xì)架構(gòu)信息，基本上完全聚焦于CPU領(lǐng)域，花了90%的篇幅講解，對AI則一句帶過，從關(guān)鍵的存儲(chǔ)帶寬135GB/s看，雖然較第三代提升了一倍，但與2019確定設(shè)計(jì)范圍的英偉達(dá)Orin高達(dá)205GB/s的帶寬相比，仍然很低。

高通更多地考慮汽車座艙和L2級的艙駕一體，這樣的市場定位不需要太高的AI性能，45TOPS足以滿足99.9%的應(yīng)用場景，座艙領(lǐng)域所謂的大模型AI都完全依賴云端計(jì)算，端側(cè)部署成本太高，可能高達(dá)數(shù)千美元，即便端側(cè)部署，體驗(yàn)也和云端計(jì)算有很大差距。

高通Snapdragon X系列芯片架構(gòu)

高通對Snapdragon X系列芯片的Oryon CPU是這樣描述的：Oryon CPU Architecture: One Well-Engineered Core For All，能夠適用于所有領(lǐng)域。

高通采用全大核心設(shè)計(jì)，有兩個(gè)核心的頻率可以加速，這種全大核心設(shè)計(jì)也用在高通SA8775上，SA8295的四個(gè)大核心則是Kryo 695，最高頻率是2.5GHz，四個(gè)中核心是Kryo 670 Gold，最高頻率2.05GHz，SA8775的8核心完全相同，最高運(yùn)行頻率都是2.35GHz，Kryo 680 Gold Prime和Kryo 695一樣都是基于ARM Cortex-X1而來的。

Oryon采用共享L2緩存的設(shè)計(jì)，通常L2緩存都是針對每個(gè)核心的，不共享，且規(guī)模很小，如SA8775的L2緩存是512kB。一般L3緩存是幾個(gè)核心共享的，如SA8295是8MB的L3緩存，SA8775是4MB的L3緩存。Oryon的共享緩存高達(dá)12MB，每個(gè)核心可以分到3MB，這樣的規(guī)模足以和英特爾Xeon這樣的服務(wù)器芯片媲美，當(dāng)然成本也增加很多，估計(jì)車規(guī)版會(huì)減小到4-8MB。

ARM架構(gòu)的性能對比表

整理：佐思汽研

對于CPU，關(guān)鍵的參數(shù)主要有兩個(gè)，一個(gè)是IPC解碼寬度，另一個(gè)就是緩存，ARM是擠牙膏式的，每年做一次小升級，讓利潤最大化。蘋果則一步到位，性能最大化，以至于蘋果連續(xù)數(shù)年都無法升級性能，安卓手機(jī)受困于ARM的擠牙膏，性能始終無法和蘋果看齊，這也是高通拋棄ARM的主要原因。即便如此，Snapdragon x系列單核性能仍然無法和蘋果匹敵，很簡單，L2緩存僅為3MB，還是低于蘋果的4MB。IPC解碼寬度方面，Snapdragon x系列是8位，遠(yuǎn)比SA8295用的ARM X1要高。

受高通拋棄的刺激，ARM也發(fā)狠，X4和2024年宣布的旗艦X925的IPC解碼寬度都是10位，比蘋果還高，用X925的單核性能肯定可以超過蘋果。

Oryon的后段IXU兩大特色，一是對AI運(yùn)算的支持，包括128比特寬度的NEON SIMD（這個(gè)寬度屬實(shí)有點(diǎn)窄了，英特爾最高已是1024比特），每周期最高4個(gè)FP32精度的ADD/WUL/MLA的指令執(zhí)行，支持INT8INT16FP16FP32多種精度，這些基本上是常規(guī)操作，不過高通最高可以支持FP32和FP64這種訓(xùn)練才會(huì)用到的高精度。這里唯一值得注意的遺漏是BF16，這是 AI 工作負(fù)載的常見數(shù)據(jù)類型，可能BF16是NPU的工作范圍。另一個(gè)特色是超大規(guī)模的ROB重排序緩沖，超過650個(gè)微操作，相比之下ARM Cortex-X4只有384個(gè)，X1只有224個(gè)。

LSU（Load-Store Unit）方面，支持加載/存儲(chǔ)單元的 L1 數(shù)據(jù)緩存本身也相當(dāng)大。完全一致的6路關(guān)聯(lián)緩存大小為 96KB，是英特爾Meteor Lake中P核心緩存的兩倍，不過英特爾新一代產(chǎn)品也是96KB。

MMU方面，頁表緩存即TLB很強(qiáng)，TLB又稱轉(zhuǎn)址旁路緩存，為CPU的一種緩存，由內(nèi)存管理單元用于改進(jìn)虛擬地址到物理地址的轉(zhuǎn)譯速度。目前所有的桌面型及服務(wù)器型處理器皆使用TLB。TLB具有固定數(shù)目的空間槽，用于存放將虛擬地址映射至物理地址的標(biāo)簽頁表?xiàng)l目。PC領(lǐng)域的較高，手機(jī)領(lǐng)域的比較低，但目前計(jì)算全都轉(zhuǎn)向PC領(lǐng)域，需要更高的TLB，對比ARM Cortex-x3，其TLB只有4路1536個(gè)，X4估計(jì)是3072個(gè)，高通有8路，大于8000個(gè)，遠(yuǎn)比ARM 要強(qiáng)。

硬件表遍歷器也是特色。如果緩存行不在 L1 或 L2 緩存中，該單元負(fù)責(zé)將緩存行移至外圍 DRAM，最多支持 16 次并發(fā)表遍歷。完整的 Snapdragon X 芯片一次最多可以進(jìn)行 192 次表遍歷。

L3緩存不大，只有6MB，因?yàn)楦咄ǖ腖2緩存足夠大，總計(jì)有36MB，因此L3緩存可以很小，也有助于降低功耗。SA8295是8MB的L3緩存，SA8775是4MB的L3緩存，減少L3緩存是個(gè)趨勢。驍龍X 具有 128 位內(nèi)存總線，支持 LPDDR5X-8448，最大內(nèi)存帶寬為 135GB/秒。在目前的LPDDR5X容量下，驍龍 X 最多可以處理64GB的RAM。

GPU方面，與前面幾代沒什么大的變化，Adreno X1 GPU 架構(gòu)是高通公司正在研發(fā)的 Adreno 架構(gòu)系列的最新版本，其中 X1 代表第 7代，SA8295與SA8755都是第六代。Adreno 本身基于15年前從ATI收購而來（Adreno 是 Radeon的字母變位詞），多年來，高通公司的 Adreno架構(gòu)一直是安卓領(lǐng)域最強(qiáng)大的GPU。Adreno X1 GPU分為6個(gè)著色器處理器 (SP) 塊，每個(gè)塊提供256個(gè)FP32 ALU，總共1536個(gè)ALU。峰值時(shí)鐘速度為1.5GHz，這讓驍龍 X 上的集成GPU的最大吞吐量達(dá)到4.6 TFLOPS（低端SKU的吞吐量較低）。

每個(gè)uSPTP 提供128個(gè)FP32 ALU。還有一組單獨(dú)的256個(gè)FP16 ALU，這意味著Adreno X1在處理FP16和FP32數(shù)據(jù)時(shí)不必共享資源，可以用于小規(guī)模的深度學(xué)習(xí)訓(xùn)練場景。不過車規(guī)版應(yīng)該會(huì)取消FP16單元，F(xiàn)P16精度在車上基本用不到，F(xiàn)P32也可以對應(yīng)FP16。最后，有16個(gè)基本功能單元 (EFU)，用于處理超越函數(shù)，例如 LOG、SQRT和其他罕見（但重要）的數(shù)學(xué)函數(shù)。對于車載領(lǐng)域，GPU算力有1.3TFLOPS就足夠，再向上就是要在車內(nèi)玩3A游戲了，不過該芯片無法支持完整的DirectX 12 Ultimate（功能級別 12_2）功能集，顯然這不是高通擅長的，AMD和英偉達(dá)更擅長游戲領(lǐng)域。

對于AI運(yùn)算的NPU，還是高通的六角DSP，缺乏亮點(diǎn)，乏善可陳，高通一句話帶過，沒有多說。

高通的第四代芯片上車預(yù)計(jì)要到2026年，以高端目前的壟斷態(tài)勢，換句話說，高通決定了3年后的汽車座艙和艙駕一體將會(huì)是什么樣的應(yīng)用狀況。整車廠和Tier1只能被高通牽著鼻子走，環(huán)顧宇內(nèi)，亦步亦趨地跟著ARM走是遠(yuǎn)遠(yuǎn)追不上高通的，至少在座艙領(lǐng)域，高通已沒有對手。

免責(zé)說明：本文觀點(diǎn)和數(shù)據(jù)僅供參考，和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議，文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場，不具有任何指導(dǎo)、投資和決策意見。

器件型號	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
USB2514B-AEZC-TR	1	Microchip Technology Inc	UNIVERSAL SERIAL BUS CONTROLLER	ECAD模型下載ECAD模型	$3.31	查看
FT230XS-R	1	FTDI Chip	Microprocessor Circuit, CMOS, PDSO16,	ECAD模型下載ECAD模型	$2.26	查看
STM32F427VIT6	1	STMicroelectronics	High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator,FSMC	ECAD模型下載ECAD模型	$22.31	查看

器件型號

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊

ECAD模型

風(fēng)險(xiǎn)等級

參考價(jià)格

更多信息

USB2514B-AEZC-TR

Microchip Technology Inc

UNIVERSAL SERIAL BUS CONTROLLER

$3.31

查看

FT230XS-R

FTDI Chip

Microprocessor Circuit, CMOS, PDSO16,

$2.26

查看

STM32F427VIT6

STMicroelectronics

High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator,FSMC