“三芯起 萬物聲”啟英泰倫第三代語音芯片發(fā)布會如約而至。歷經(jīng)三年潛心研發(fā),啟英泰倫正式推出全新第三代智能語音芯片,相較上一代產(chǎn)品,這款芯片創(chuàng)下算力更高、高度集成和算法新高的“三高”記錄,全面覆蓋高性能、低成本端側語音和端云融合語音等應用。
離線語音AI芯片的“先行者”
近年來,隨著5G、AIoT等技術的快速發(fā)展與應用融合,人工智能產(chǎn)業(yè)及相關業(yè)務越來越受政府和產(chǎn)業(yè)界的關注與支持,在國家的“十四五”規(guī)劃中,人工智能技術已被列為前沿科技領域的“最高優(yōu)先級”,宏觀環(huán)境不斷向好發(fā)展。
在各類人工智能技術中,語音識別、自然語義理解(NLP)、機器學習居于重要地位,是人機交互技術的基礎,其中,語音識別、NLP兩項均與語音交互密切關聯(lián)。作為人機交互中最符合人類日常交流形態(tài)的技術,語音交互方式更加自然,也更為便利。
從產(chǎn)業(yè)發(fā)展的角度看,技術突破和政策利好有效刺激了智能語音行業(yè)的發(fā)展。不過,從更底層的邏輯出發(fā),人機語音交互體驗的持續(xù)改善才是市場的核心推動力。更長遠來看,智能語音的本質其實是實現(xiàn)人機之間的語音自由交互。
在智能語音識別發(fā)展早期,由于語音識別對算力的要求高,企業(yè)都是通過云端進行智能語音識別處理。然而,在主流方向如此明晰的情勢下,啟英泰倫卻選擇另辟蹊徑,率先選擇了離線語音AI芯片的方向。
?
那么,啟英泰倫為何作出這一選擇呢?對此,啟英泰倫創(chuàng)始人兼CEO何云鵬表示,這一選擇的出發(fā)點是基于對用戶真實需求的深入思考。首先,離線語音是不依賴網(wǎng)絡和云中心的真智能,既能給用戶帶來即時的靈敏響應,也能更好地保護用戶的隱私。此外,出于對用戶權益的考量,離線語音能確保用戶擁有完整的、自主的智能設備使用權和控制權。最后,除用戶體驗外,還需考慮更廣泛的用戶的成本承受能力,不僅是讓用戶體驗更好,也能用得起。
近年來,隨著智能語音技術不斷發(fā)展和應用的不斷拓展,云端處理在響應可靠性、隱私保護、成本等方面的弊端逐步暴露出來。在端云融合的趨勢之下,啟英泰倫的這一選擇也愈發(fā)凸顯出其先見之明的一面。
BNPU 3.0將語音識別推向新高點
從實際應用場景來看,智能語音的需求大致可以概括為語義理解、特征識別、語音處理、實時交互四個方面。為了更好地滿足上述用戶需求,啟英泰倫在算法攻關和芯片研發(fā)兩個方面同時發(fā)力,埋頭攻克一個又一個業(yè)內(nèi)難題。發(fā)展至今,啟英泰倫自研技術平臺BNPU(腦神經(jīng)網(wǎng)絡處理器)已迭代三次,從BNPU 1.0、BNPU 2.0,一直到今天推出的BNPU 3.0版本。
每一代BNPU的問世,都是離線語音芯片和算法的一次突破和語音應用的助推。何云鵬介紹道,第一代BNPU實現(xiàn)的是端側語音識別,是行業(yè)首款集成神經(jīng)網(wǎng)絡處理器的語音AI芯片,也是離線語音產(chǎn)業(yè)應用興起的標志。二代系列芯片CI1102/CI1103及CI1122芯片則集成了第二代BNPU,不僅實現(xiàn)了離線語音識別功能,還能實現(xiàn)離線聲紋識別和命令詞自學習等個性化的功能。如今,第三代芯片又將把整個語音識別應用推向新的高點。?
?
從芯片算力方面看,三代13系列芯片內(nèi)置BNPU 3.0和支持DSP指令擴展的RISC CPU兩大內(nèi)核,主頻高達240MHz,并具有640KB系統(tǒng)SRAM。
何云鵬指出,在實際應用中,用戶對智能語音的要求極高,對于一個能聽會說的設備,常以機器人,甚至超人的標準對待。比如,在人耳也不易聽清的嘈雜環(huán)境中,會希望語音設備能聽清;人耳很難同時聽懂兩個以上人說話,但要求語音設備能聽懂。此外,很少有人能聽懂各地的方言口音,但各地方的人會要求設備聽得懂該地方言,甚至土話。?
為了滿足上述苛刻要求,第三代BNPU作了大量技術迭代。除繼承第二代的語音識別、聲紋識別外,還支持了基于深度學習的降噪技術(深度降噪),人聲分離技術(深度分離),命令詞自學習2.0版本技術,以及行業(yè)首次突破性的離線NLP技術。?
此前,業(yè)界普遍認為只有云端才能實現(xiàn)NLP,而啟英泰倫最新的技術已經(jīng)可以采用端側智能語音芯片實現(xiàn)NLP,將語音處理放在端側,既保障了用戶的體驗感,又能降低云端搭建和運營成本,降低網(wǎng)絡帶寬消耗,也能提升用戶使用的安全性。
為了幫助下游客戶實現(xiàn)敏捷開發(fā)、快速落地的目標,啟英泰倫還推出了語音AI平臺。該平臺支持10000用戶同時開發(fā),即時生成NLP模型,提供更自然的語音交互能力。
為用戶打造專屬守護精靈
隨著互聯(lián)網(wǎng)、5G和Wi-Fi等技術的快速發(fā)展,智能行業(yè)正從“單點智能”走向“情景智能”,專業(yè)的智能語音芯片技術在這一轉變中扮演著至關重要的角色。
由于智能語音技術和NLP技術不斷加速發(fā)展,智能語音的市場空間不斷打開。目前,智能語音已在2C消費級的智能家居、智慧生活、智慧辦公、智能駕駛;2B企業(yè)級的智慧醫(yī)療、智能客服等多個領域實現(xiàn)場景應用。據(jù)IDC的統(tǒng)計數(shù)據(jù),2021年中國智能家居設備市場出貨量已超2.2億臺,2022年中國智能家居設備市場出貨量則將突破2.6億臺,同比增長為17.1%。
經(jīng)過長達近7年的發(fā)展后,啟英泰倫積累的B端客戶已超過5000名,平臺開發(fā)者則超過了1萬名,使用啟英泰倫智能語音平臺的在校AI學員則超過10萬名。離線語音方案的年裝機量則超過2000萬,并正快速向上億年裝機量發(fā)展。
?
啟英泰倫的終極目標是打造跨設備、跨時空,用戶專屬,終身守護的守護精靈。何云鵬將這一目標劃分為三個階段,第一步是讓人機交互更自然,更具普適性;然后通過更多的數(shù)據(jù),讓機器更理解人、更主動地為人類服務;最終目標是打造專屬的守護精靈,它將是用戶全方位的生活管家、健康安全衛(wèi)士、百科知識導師和給與心靈陪伴的知己朋友。
為了更快地實現(xiàn)自身目標,啟英泰倫正加強生態(tài)建設,提升應用開發(fā)平臺,和合作伙伴們一切推動生態(tài)建設,努力降低AI語音應用的門檻。對于啟英泰倫的理想,何云鵬感慨道“那些站在民族和人類立場的美好愿望,一個人的力量是微薄的,但多一份總會更好!一個人這么想,就會有更多人這么想,最終匯聚成浩浩蕩蕩一往無前的力量!”
?