综合国产激情久久影院午夜,无码人妻精品一区二区蜜桃,一级片免费在线观看

本文由半導(dǎo)體產(chǎn)業(yè)縱橫（ID：ICVIEWS）綜合摩爾線程夸娥智算集群可實現(xiàn)從千卡至萬卡集群的無縫擴展。

“從今天起，世界徹底改變了?！边@是GPT-3算法的發(fā)明人埃德·萊昂·克林格在GPT-3出現(xiàn)時說的一句話。這是一個AI的時代，這是一個算力的時代。今日，摩爾線程重磅宣布其AI旗艦產(chǎn)品夸娥（KUAE）智算集群解決方案實現(xiàn)重大升級，從當前的千卡級別大幅擴展至萬卡規(guī)模。

同時，摩爾線程聯(lián)合中國移動通信集團青海有限公司、中國聯(lián)通青海公司、北京德道信科集團、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司，分別就三個萬卡集群項目進行了戰(zhàn)略簽約，多方聚力共同構(gòu)建好用的國產(chǎn)GPU集群。

此外，我們從現(xiàn)場也看到摩爾線程的產(chǎn)品能力和強大的生態(tài)鏈接力。與來自清華系兩家公司無問芯穹和清程極智已經(jīng)開始深度合作，無問芯穹是由清華大學(xué)電子工程系系主任汪玉教授發(fā)起的，清程極智由清華大學(xué)計算機系鄭緯民院士發(fā)起的。還有京東、360、智平方等多家國內(nèi)企業(yè)，夸娥智算集群助力其在大模型訓(xùn)練、大模型推理、具身智能等不同場景和領(lǐng)域的創(chuàng)新。

?萬卡是最低標配

大模型自問世以來，關(guān)于其未來的走向和發(fā)展趨勢亟待時間驗證，但從當前來看，幾種演進趨勢值得關(guān)注，使得其對算力的核心需求也愈發(fā)明晰。第一，Scaling Law將持續(xù)奏效。需要單點規(guī)模夠大并且通用的算力才能快速跟上技術(shù)演進。第二，Transformer架構(gòu)不能實現(xiàn)大一統(tǒng)，和其他架構(gòu)會持續(xù)演進并共存，形成多元化的技術(shù)生態(tài)。第三，AI、3D和HPC跨技術(shù)與跨領(lǐng)域融合不斷加速，大模型的訓(xùn)練和應(yīng)用環(huán)境更加復(fù)雜多元。

隨著計算量不斷攀升，大模型訓(xùn)練亟需超級工廠，即一個“大且通用”的加速計算平臺，以縮短訓(xùn)練時間。以Llama 3為例，在它問世之際，Meta就公布了其基礎(chǔ)設(shè)施詳情：“我們在兩個定制的24K GPU集群上做訓(xùn)練。”摩爾線程創(chuàng)始人張建中提出了一個標準：“AI主戰(zhàn)場，萬卡是最低標配?！?/strong>

?國產(chǎn)萬卡萬P萬億大模型訓(xùn)練平臺

夸娥（KUAE）是摩爾線程智算中心全棧解決方案，是以全功能GPU為底座，軟硬一體化、完整的系統(tǒng)級算力解決方案，包括以夸娥計算集群為核心的基礎(chǔ)設(shè)施、夸娥集群管理平臺（KUAE Platform）以及夸娥大模型服務(wù)平臺（KUAE ModelStudio），旨在以一體化交付的方式解決大規(guī)模GPU算力的建設(shè)和運營管理問題。

基于對AI算力需求的深刻洞察和前瞻性布局，摩爾線程夸娥智算集群可實現(xiàn)從千卡至萬卡集群的無縫擴展，旨在滿足大模型時代對于算力“規(guī)模夠大+計算通用+生態(tài)兼容”的核心需求，通過整合超大規(guī)模的GPU萬卡集群、極致的計算效率優(yōu)化以及高度穩(wěn)定的運行環(huán)境，以萬卡智算集群的新超級工程，重新定義國產(chǎn)集群計算能力的新標準。夸娥萬卡智算解決方案具備多個核心特性：

超大算力，萬卡萬P。浮點運算能力達到10Exa-Flops，大幅提升單集群計算性能，能夠為萬億參數(shù)級別大模型訓(xùn)練提供堅實算力基礎(chǔ)。

超高穩(wěn)定，月級長穩(wěn)訓(xùn)練。在集群穩(wěn)定性方面，摩爾線程夸娥萬卡集群平均無故障運行時間超過15天，最長可實現(xiàn)大模型穩(wěn)定訓(xùn)練30天以上，周均訓(xùn)練有效率在99%以上，遠超行業(yè)平均水平。

極致優(yōu)化，超高MFU：實現(xiàn)大模型的高效率訓(xùn)練，MFU最高可達到60%。在系統(tǒng)軟件層面，基于極致的計算和通訊效率優(yōu)化等技術(shù)手段，大幅提升集群的執(zhí)行效率和性能表現(xiàn)。

全能通用，生態(tài)友好：可加速LLM、MoE、多模態(tài)、Mamba等不同架構(gòu)、不同模態(tài)的大模型。s同時，基于高效易用的MUSA編程語言、完整兼容CUDA能力和自動化遷移工具Musify，加速新模型“Day0”級遷移，實現(xiàn)生態(tài)適配“Instant On”，助力客戶業(yè)務(wù)快速上線。

構(gòu)建萬卡集群并非一萬張GPU卡的簡單堆疊，而是一項高度復(fù)雜的超級系統(tǒng)工程。它涉及到超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計算、長期穩(wěn)定性和高可用性等諸多技術(shù)難題。

張建中也感嘆到：“萬卡集成的難度比登喜馬拉雅山還難?！?/strong>

?共建大模型應(yīng)用生態(tài)

根據(jù)《2023~2024年中國人工智能計算力發(fā)展評估報告》，中國智能算力規(guī)模正處于高速增長狀態(tài)。預(yù)計到2027年，中國智能算力規(guī)模將達1117.4EFLOPS，2022~2027年期間的年復(fù)合增長率為33.9%。萬卡集群的建設(shè)需要產(chǎn)業(yè)界的齊心協(xié)力，為實現(xiàn)大模型創(chuàng)新應(yīng)用的快速落地，讓國產(chǎn)算力“為用而建”。

在今日的發(fā)布會線程，摩爾線程攜手中國移動通信集團青海有限公司、中國聯(lián)通青海公司、北京德道信科集團、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司，分別就青海零碳產(chǎn)業(yè)園萬卡集群項目、青海高原夸娥萬卡集群項目、廣西東盟萬卡集群項目進行了戰(zhàn)略簽約。

今年5月，摩爾線程與無問芯穹正式完成基于國產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實訓(xùn)。該模型名為“MT-infini-3B”。MT-infini-3B模型訓(xùn)練總用時13.2天，經(jīng)過精度調(diào)試，實現(xiàn)全程穩(wěn)定訓(xùn)練不中斷，集群訓(xùn)練穩(wěn)定性達到100%，千卡訓(xùn)練和單機相比擴展效率超過90%。在行業(yè)內(nèi)率先開啟了國產(chǎn)大語言模型與國產(chǎn)GPU千卡智算集群深度合作的新范式。

清程極智與摩爾線程合作的過程中，發(fā)現(xiàn)其硬件架構(gòu)、指令集、編譯器、MUSA軟件棧等設(shè)計非常優(yōu)秀，極具潛力。清程極智將與摩爾線程強強聯(lián)合，攜手打造世界水平的大模型基礎(chǔ)設(shè)施。

此外，摩爾線程還與360、京東云、智平方等多家國內(nèi)企業(yè)合作。

?結(jié)語

隨著今年“AI+”首次被寫入兩會工作報告，AI算力成為新質(zhì)生產(chǎn)力的重要引擎。智算中心不應(yīng)只是硬件的堆積，更是對軟硬一體化的GPU智算系統(tǒng)整合能力的考驗，GPU分布式計算系統(tǒng)的適配、算力集群的管理和高效推理引擎的應(yīng)用等，都是提高算力中心可用性的重要因素。

四年多的潛心發(fā)展，摩爾線程在 AI GPU 方面具備了強勁的實力，構(gòu)建起了一張包括芯片、板卡、服務(wù)器、集群和軟件棧的全棧 AI 產(chǎn)品版圖，并且已經(jīng)多點實現(xiàn)落地。正如摩爾線程創(chuàng)始人兼CEO張建中所言：“當前，我們正處在生成式人工智能的黃金時代，技術(shù)交織催動智能涌現(xiàn)，GPU成為加速新技術(shù)浪潮來臨的創(chuàng)新引擎。

夸娥萬卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖，可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力，不僅有力彰顯了摩爾線程在技術(shù)創(chuàng)新和工程實踐上的實力，更將成為推動AI產(chǎn)業(yè)發(fā)展的新起點?！?/strong>

*聲明：本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點，我方轉(zhuǎn)載僅為分享與討論，不代表我方贊成或認同，如有異議，請聯(lián)系后臺。

器件型號	數(shù)量	器件廠商	器件描述	ECAD模型	參考價格	更多信息
PIC32MX795F512LT-80I/PT	1	Microchip Technology Inc	32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100	ECAD模型下載ECAD模型	$11.46	查看
DS3231SN#	1	Maxim Integrated Products	Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO16, 0.300 INCH, SOIC-16		$11.21	查看
ATXMEGA128D4-CU	1	Microchip Technology Inc	IC MCU 8BIT 128KB FLASH 49VFBGA		$16.33	查看

器件型號

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊

ECAD模型

風(fēng)險等級

參考價格

更多信息

PIC32MX795F512LT-80I/PT

Microchip Technology Inc

32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100