來源:雷科技數(shù)碼3C組?|?編輯:冬日果醬?|?排版:LIN
2016 年 9 月 13 日,一身黑色皮衣的英偉達 CEO 黃仁勛第一次將 GTC(GPU 技術大會)帶來了中國,同時也展示了 GPU 計算不再局限于游戲,還應用在 AI(人工智能)、科學研究、自動駕駛以及 VR 等熱門領域。
但最重要的還是 AI,黃仁勛在演講中提醒所有人,「我們不再是一個半導體公司,而是一個 AI Computing Company(AI 計算公司)。」
同一年,谷歌在 I/O 大會上提出「AI 為先」的戰(zhàn)略,往后每年都要一遍又一遍地強調(diào),并將 AI 越來越多地融入自家的產(chǎn)品之中。微軟也第一次宣布攜手 OpenAI「履行普及且全民化人工智能的使命」,那篇新聞稿在開頭就寫道:「我們正處于技術發(fā)展歷程中的關鍵時刻?!?/p>
圖/微軟官網(wǎng)
這是一個時代的序幕。
七年后,生成式 AI 帶來新一輪的革命,ChatGPT 在全球范圍顛覆了大眾的認知。而伴隨著 AI 熱潮的持續(xù)爆發(fā),英偉達的股價從去年 10 月的 112.27 美元漲超 400 美元,成為了有史以來第一家萬億美元市值的芯片公司,在全球僅次于蘋果、微軟、Alphabet(谷歌)和亞馬遜這四家公司。
今日之成功非今日之功。今天 AI 領域最重要的 4 家公司,在 2016 年共同邁出了走向 AI 未來的關鍵一步,也堅定了「AI 改變世界」的決心。那一年發(fā)生了什么,大部分人都知道—— DeepMind(谷歌旗下)推出的 AlphaGo 與人類棋手李世石的世紀對決吸引了全球的目光。
AlphaGo 將 AI 重新拉回到人們的視野之中,卻沒有在實驗室之外真正改變?nèi)藗兊纳睢<幢闶?2018 年發(fā)布的 Transformer(也就是 GPT 中的「T」)深度學習模型,也要等到 ChatGPT 的橫空出世。
而現(xiàn)如今,無數(shù)人都可以斷言 AI 開始真正地改變世界:
- 研究人員利用 AI 技術快速篩選出了能殺死超級細菌的新型抗生素,上海市科委也說要圍繞 AI 藥物設計進行布局;
- 生物公司在像英偉達 CEO 黃仁勛所說的「借助 AI,學會理解蛋白質(zhì)」,晶圓代工廠也在利用 AI 提高生產(chǎn)效率;
- ChatGPT 之外,搜索、Office 文檔、筆記、社交媒體……更多的公司和開發(fā)者正在將 AI 應用于各種生活和工作場景之中。
留給 AI 的挑戰(zhàn)當然還有很多,生成內(nèi)容的歸屬、惡意濫用(比如詐騙)以及一本正經(jīng)胡說八道的「幻覺」等等。但在所有挑戰(zhàn)中,最關鍵的可能還是如何讓生成式 AI 更安全的同時,擴大使用場景,降低普通用戶的使用門檻,使得更多的人可以利用 AI 得到更高的生產(chǎn)效率,享受更好的生活。
AI 技術的擴散,或許就是下一個七年甚至幾十年的最大機會。
AI 大模型不應只「活」在云端
半個多世紀前的 1946 年,世界上第一臺電子計算機 ENIAC 誕生了,從此人類一只腳邁入了計算機時代。
但直到 PC(個人計算機)在 1982 年真正推向市場之前,普通人其實觸碰不到計算機給生活帶來的變革,而 PC 作為第一代個人計算平臺在誕生之后的幾十年,徹底改變了所有人的生活,也衍生出了一系列今天至關重要的產(chǎn)業(yè),包括但不限于互聯(lián)網(wǎng)、芯片以及智能手機。
人類的技術史不斷在證明一件事——技術創(chuàng)新很偉大,但技術擴散同樣偉大。印刷術的出現(xiàn)對于整個人類文明的重要性不言而喻,但印刷術在北宋以降的擴散,以及文藝復興時期在西方世界的擴散,一樣無比關鍵。
然而當下幾乎所有生成式 AI 應用都跑在昂貴的數(shù)據(jù)中心,比如最熱門的 ChatGPT 就跑在微軟 Azure 的全球數(shù)據(jù)中心里。與此同時,數(shù)據(jù)中心也限制了生成式 AI 在更大范圍內(nèi)的落地。
貴是一方面,就連當下最炙手可熱的 OpenAI CEO Sam Altman 也說,OpenAI 目前的首要任務是降本增效,更何況是從去年就開始喊的一眾互聯(lián)網(wǎng)公司,普遍都面臨成本的壓力。
而且隨著更多用戶更頻繁的使用,AI 的運營成本還會水漲船高,關鍵是對大部分互聯(lián)網(wǎng)的商業(yè)模式來說,企業(yè)其實很難向用戶直接收取高昂的費用。另一方面,生成式 AI 的應用并未成熟,大部分用戶也不太可能接受高昂的收費模式。
除此之外,隱私安全的重要性現(xiàn)如今越來越受到重視,很多人不再愿意把自己的照片、視頻上傳到網(wǎng)絡,反而傾向于存儲在本地,比如蘋果為代表,更多的企業(yè)都在面向用戶強調(diào)產(chǎn)品的隱私安全。而企業(yè)本身對數(shù)據(jù)安全的重視更是如此。
之前三星半導體部門的員工在使用 ChatGPT 的時候,就把一些數(shù)據(jù)上傳到云端,導致商業(yè)機密泄露,不僅是三星在內(nèi)部重新實施了 ChatGPT 禁令,也引起了不少公司對 ChatGPT 的警惕。
同時 AI 作為一種基礎設施,未來應該被所有人使用,使用場景也將極其廣泛,包括輕負載和重負載場景,也包括對延時比較敏感的場景。而從數(shù)據(jù)傳輸到云端處理,再回傳結果,其中必然會有網(wǎng)絡延時的影響,一些 AI 任務可能不需要過高的加速性能,反而要求更低的延時。
一言以蔽之,來自云端的算力無法覆蓋更多的 AI 使用場景,也滿足不了更多人的 AI 使用需求,AI 不應該只「活」在云端。
在 ChatGPT 之后,很多人就提出了一個構想——每個人都可以擁有專屬的 AI 助手以及背后的語言模型。印象研究院院長常誠之前接受雷科技采訪時就說到,印象 AI 未來一個可能的發(fā)展方向就是結合印象筆記作為知識管理產(chǎn)品的定位,讓每一個用戶可以選擇用私人語料訓練和部署自己的專有語言模型。
但從成本、隱私和延時等不同角度來看,一個云端的 AI 并不合適。而在更廣泛的 PC,以及幾乎人手一臺的智能手機上,我們還有大量的晶體管和算力,足以接下來的算力變革中創(chuàng)造一個更多元、更龐大的 AI 生態(tài)。
本地加速,AI 大模型上終端
5 月底,英偉達公布了最新一季財報,在游戲和專業(yè)可視化收入繼續(xù)大跌的背景下,數(shù)據(jù)中心收入達到創(chuàng)紀錄的 42.8 億美元。電話會議上,黃仁勛解釋說:
計算機行業(yè)正在同時經(jīng)歷兩種轉(zhuǎn)變——加速計算和生成式AI。隨著各個公司競相為生成式AI部署加速計算,價值1萬億美元的全球數(shù)據(jù)中心基礎設施將從通用計算轉(zhuǎn)向加速計算。
事實上,這種轉(zhuǎn)變不僅發(fā)生在數(shù)據(jù)中心,還發(fā)生在全世界的 PC 和智能手機上。早前的一場媒體會上,英特爾就在一臺輕薄筆記本上展示了通過本地運行 Stable Diffusion 生成圖片的過程。
英特爾客戶端計算事業(yè)部終端生態(tài)合作亞洲區(qū)總監(jiān)高源透露,新一代 Meteor Lake 處理器將會集成 CPU、GPU 以及專門面向 AI 加速的獨立計算單元 VPU。不僅如此,CPU、GPU 以及 VPU 將共同參與 AI 加速計算的過程,使得在輕薄型 PC 成為可能。
與此同時,微軟和谷歌——兩家走在時代潮頭的操作系統(tǒng)廠商也在系統(tǒng)層面引入生成式 AI。微軟先前宣布將在 Windows 11 上率先推出 Windows Copilot,成為第一個加入生成式 AI 助手的 PC 操作系統(tǒng),本月就會推出預覽版。
谷歌還要更進一步,計劃在手機上率先內(nèi)置 AI 語言模型。為此谷歌通過大模型「降參數(shù)」得到小模型,實現(xiàn)了更低的算力要求和功耗,在上月的 I/O 大會上就推出了四個版本的 PaLM 2,其中 PaLM 2「壁虎」作為羽量級版本可以直接在 Pixel 手機上離線使用,每秒處理 20 個 token。
無獨有偶,榮耀 90 系列發(fā)布的會后采訪環(huán)節(jié)上,榮耀總裁趙明也表示,相比云端的大模型,手機端 AI 更為強調(diào)個性化和安全,榮耀將在端側(cè) AI 上進行發(fā)展,「未來端側(cè) AI 與大模型會有某種程度的結合?!?/p>
說到底,終端 AI 也不是要代替云端 AI,更多是為了覆蓋所有人的所有使用場景和需求,大模型運行在手機和 PC 本地,比起云端延遲更低,離線運行也可以更好地保護用戶隱私。
在前不久結束的 Computex 上,高通資深副總裁暨運算及游戲部門總經(jīng)理 Kedar Kondap 說,考慮到延時、效率和實用性等問題,部分計算于手機、平板或電腦中、部分則在云端運行,「未來的 AI 計算是混合的?!?/p>
從芯片到終端廠商都意識到了,終端算力正在從通用計算加速轉(zhuǎn)向 AI 加速計算,不僅是 NPU(神經(jīng)網(wǎng)絡處理器)變得越來越重要,CPU 和 GPU 也可能將更多的通用算力轉(zhuǎn)向加速計算。過去更多用在圖像處理上的加速處理能力,未來將覆蓋生成式 AI 的方方面面。而全球每年賣出的數(shù)十億臺手機和 PC,也會把 AI 加速計算的能力源源不斷地帶給每一個人。
換言之,不管是英特爾演示用的輕薄本 PC,還是谷歌不久后的新 Pixel 手機,都只是一個開始。我們不難想象未來在手機和 PC 上可能都會預裝一個「小模型」,用戶可以隨時隨地安全且高效地使用專屬的 AI 助手。
而終端和云端,大模型和小模型的協(xié)同也會進一步推動 AI 的快速進化。大模型向搭載在設備端的小模型輸出能力,小模型則在大模型的基礎上負責感知、推理和執(zhí)行,再將執(zhí)行的結果反饋給大模型,讓大模型的知識與能力持續(xù)進化,形成一套有機循環(huán)的系統(tǒng)。就像阿里達摩院說的:
參與者越多,模型進化的速度也越快。
AI、人類和個體
在科幻小說《造神年代》里有一段描述:面對全世界股市發(fā)生的混亂,男主在網(wǎng)吧通過萬國寶(小說中阿里開發(fā)的翻譯 AI)向一位蘇格蘭友人大吼「活下去!奇點就要到了!」緊接著作者寫到:「就在剛才,時代已經(jīng)變了。他們還不知道。」
因為就此,強人工智能萬國寶獲得了新生,有了根指令和初始本能,接下來將以全球為戰(zhàn)場,在與谷歌(小說中另一個強人工智能巨獸)和人類的三方戰(zhàn)爭中努力「活下去」。
但在現(xiàn)實世界中,即便是公認最領先的 GPT-4 距離強人工智能(或稱通用人工智能)也還有很遠。而且技術總是充滿了兩面性,AI 或許擁有威脅人類未來的可能,也有幫助人類打造更美好世界的可能。
網(wǎng)景瀏覽器和傳奇創(chuàng)投公司 a16z 創(chuàng)始人馬克·安德里森(Marc Andreessen)過去多次寫過預言式的雄文,包括《軟件吞噬世界》《是時候開始建造了》,不久前他又寫了一篇《為什么 AI 將拯救世界》,其中一個核心的觀點是:AI 通過增強人類智能,幫助人類像過去幾千年一樣創(chuàng)造更美好的世界。
或許安德里森的觀點過于宏大和抽象,但當我們聚焦在 ChatGPT 上就會發(fā)現(xiàn),生成式 AI 技術最具革命性的部分在于自然語言輸入。
過去人類只能通過命令行與計算機進行交互,輸入指令來獲得結果,后來圖形用戶界面的出現(xiàn),與計算機的交互變得更加直觀,手機觸屏則在鼠標和鍵盤的基礎上,進一步降低了用戶的使用門檻。ChatGPT 告訴我們,人可以通過自然語言——平常和同事、親人說話的方式,與計算機進行溝通,并且計算機有能力同樣以自然語言的方式告訴我們(結果)。
另一方面,沒有人可以窮盡所有的知識,哪怕掌握再多的生產(chǎn)力工具和技巧,構建再多的「第二大腦」。但理論上計算機可以輸入人類有史以來保存的所有知識,ChatGPT 就幾乎「遍覽」了互聯(lián)網(wǎng)上所有公開知識,并且跨越社會語言文化,用最底層的邏輯關聯(lián)所有知識。
結果就是 ChatGPT 雖然還有很多「幻覺」,卻是無可爭議的博學,同時還一舉超越 NLP(自然語言處理)技術,不同語言之間的翻譯效果也甚于過往,以至于粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院-認知計算與自然語言研究中心負責人張家興博士在 ChatGPT 出現(xiàn)后感嘆:「(傳統(tǒng)的)NLP 技術不存在了。」
于人類而言,ChatGPT 最直接的意義就是提供了一位學貫中西的數(shù)字助理,幫助我們越過無數(shù)的(語言、文化、技術)障礙,直接了解散落在互聯(lián)網(wǎng)的各種信息和知識,也可以與之進行情感上的交流。但就如前文提到的,出于隱私的顧慮和使用的體驗等各種因素,如果我們想要更進一步,讓 AI 更了解每個人之后進行個性化的微調(diào),同時管理更多私人的任務和內(nèi)容,就不可能完全依賴于云端的算力和模型。
所幸過去幾十年,高性能個人計算終端—— PC 和手機飛入尋常百姓家,算力和功耗的挑戰(zhàn)當然還在,但事情已然邁出了關鍵一步。