近幾年來(lái),人工智能作為自互聯(lián)網(wǎng)誕生以來(lái)的第二次技術(shù)形態(tài)的體現(xiàn),隨著智能產(chǎn)品的落地應(yīng)用,不同場(chǎng)景的算法持續(xù)涌現(xiàn),計(jì)算數(shù)據(jù)呈爆炸式增長(zhǎng)。不少?gòu)S商為了追求產(chǎn)品多樣化,不斷推出新功能,在產(chǎn)品中提到的“人機(jī)交互”、“智能識(shí)別”等新鮮的概念詞匯,以此吸引消費(fèi)者的購(gòu)買(mǎi)欲望。
與此同時(shí),AI芯片作為人工智能技術(shù)的硬件基礎(chǔ)和產(chǎn)業(yè)落地的載體,吸引了眾多巨頭和創(chuàng)企入局,各類(lèi)AI芯片相繼面世。在近日胡潤(rùn)研究院發(fā)布的《2020胡潤(rùn)中國(guó)芯片設(shè)計(jì)10強(qiáng)民營(yíng)企業(yè)》榜單中,按照企業(yè)市值或估值列出了中國(guó)10強(qiáng)本土芯片設(shè)計(jì)民營(yíng)企業(yè),分別為:韋爾股份、匯頂科技、兆易創(chuàng)新、卓盛微電子、君正集成電路、圣邦微電子、比特大陸、瑞芯微、晶晨半導(dǎo)體、地平線(xiàn)、寒武紀(jì)科技。11家芯片設(shè)計(jì)企業(yè)中比特大陸、地平線(xiàn)、寒武紀(jì)科技3家都是AI芯片公司,占據(jù)了將近1/3的比重,足以見(jiàn)得AI芯片發(fā)展的重要性。
從架構(gòu)說(shuō)起,AI芯片走了怎樣一條路
其實(shí)最早AI芯片的出現(xiàn)并不是為了執(zhí)行指令,而是為了進(jìn)行大量的數(shù)據(jù)訓(xùn)練和應(yīng)用的計(jì)算。由于傳統(tǒng)CPU在解決深度學(xué)習(xí)任務(wù)時(shí)效率不夠高,且耗費(fèi)的成本昂貴,因此催生了專(zhuān)門(mén)解決特定任務(wù)的新硬件——AI芯片。
當(dāng)前AI芯片的設(shè)計(jì)方案繁多,市面上對(duì)于A(yíng)I芯片其實(shí)也沒(méi)有明確統(tǒng)一的定義,廣義上來(lái)說(shuō)所有面向人工智能的芯片都叫做AI芯片。
指令級(jí)架構(gòu)是主流
從芯片架構(gòu)來(lái)看,目前市場(chǎng)上絕大多數(shù)AI芯片都是采用傳統(tǒng)的指令集架構(gòu)。
傳統(tǒng)的指令集架構(gòu)采用馮·諾依曼計(jì)算方式,通過(guò)指令執(zhí)行次序控制計(jì)算順序,并通過(guò)分離數(shù)據(jù)搬運(yùn)與數(shù)據(jù)計(jì)算提供計(jì)算通用性。在本質(zhì)上還是所謂的“計(jì)算優(yōu)先”模式,需要通過(guò)擴(kuò)展并行計(jì)算單元來(lái)提升芯片處理性能。
目前,市場(chǎng)上傳統(tǒng)的通用指令集架構(gòu)主要包括人們熟知的X86架構(gòu)、ARM架構(gòu)、RISC-V開(kāi)源架構(gòu),以及SIMD架構(gòu)。
雖然指令級(jí)架構(gòu)憑借其通用性和廣泛的應(yīng)用,成為了AI芯片的主流架構(gòu),但是在A(yíng)I芯片進(jìn)行算法處理的過(guò)程中,涉及到大量的計(jì)算、并行處理、低時(shí)延等要求,給芯片存儲(chǔ)器帶來(lái)了巨大的挑戰(zhàn),這也就是馮·諾依曼計(jì)算方式下共享內(nèi)存模式導(dǎo)致的存儲(chǔ)性能瓶頸問(wèn)題,我們又稱(chēng)其為“數(shù)據(jù)墻”、“內(nèi)存墻”或者“馮·諾伊曼瓶頸”。
如何通過(guò)硬件體系架構(gòu)的創(chuàng)新,克服存儲(chǔ)性能瓶頸問(wèn)題,進(jìn)一步提升AI芯片深度學(xué)習(xí)算法運(yùn)算效率,成為了當(dāng)前AI芯片架構(gòu)創(chuàng)新和發(fā)展的一大難題。
![](http://m.jycsgw.cn/file/upload/202007/01/164313461.png)
(基于馮諾依曼的典型指令集架構(gòu)示意圖)
另一條路:數(shù)據(jù)流AI芯片
要想解決內(nèi)存性能跟得上計(jì)算單元算力提升的問(wèn)題,就要打破馮·諾依曼架構(gòu)的內(nèi)存墻阻礙。由此也衍生出AI芯片架構(gòu)的另一條路——數(shù)據(jù)流芯片。
相信很多人對(duì)“數(shù)據(jù)流AI芯片”了解甚少。在近日鯤云科技舉辦的新品發(fā)布會(huì)上,據(jù)鯤云科技創(chuàng)始人和CEO牛昕宇博士介紹,與傳統(tǒng)指令集架構(gòu)相比,數(shù)據(jù)流架構(gòu)沒(méi)有概念上的指令計(jì)數(shù)器,它是依托數(shù)據(jù)流流動(dòng)次序控制計(jì)算次序,采用計(jì)算流和數(shù)據(jù)流重疊運(yùn)行方式消除空閑計(jì)算單元,并采用動(dòng)態(tài)配置方式保證對(duì)于人工智能算法的通用支持,突破指令集技術(shù)對(duì)于芯片算力的限制。
數(shù)據(jù)流架構(gòu)采用了數(shù)據(jù)流引擎的計(jì)算架構(gòu),以實(shí)現(xiàn)更高的吞吐量和更低的延遲,最大優(yōu)點(diǎn)在于大幅提升芯片利用率。目前,數(shù)據(jù)流架構(gòu)在數(shù)字信號(hào)處理、網(wǎng)絡(luò)路由、圖形處理、遙感檢測(cè)、以及數(shù)據(jù)庫(kù)處理,以及當(dāng)今許多軟件體系結(jié)構(gòu)中占據(jù)著重要地位。
當(dāng)然,數(shù)據(jù)流架構(gòu)AI芯片的研發(fā)難度遠(yuǎn)遠(yuǎn)大于指令集架構(gòu),目前全球基于數(shù)據(jù)流方式研究AI芯片的企業(yè)少之又少,主要有鯤云科技、Wave Computing、Sambanova、Groq,而目前能夠?qū)崿F(xiàn)數(shù)據(jù)流AI芯片量產(chǎn)的僅有國(guó)內(nèi)的鯤云科技一家??傮w而言,數(shù)據(jù)流架構(gòu)也不失為未來(lái)AI芯片的一條重要發(fā)展路徑。
三種技術(shù)路線(xiàn),誰(shuí)是AI芯片的未來(lái)
AI芯片目前有3種主流技術(shù)路線(xiàn),分別為GPU、FPGA以及ASIC。
GPU是最早進(jìn)行并行加速計(jì)算的處理器,得益于高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面它比CPU速度更快;在結(jié)構(gòu)上,CPU大部分面積為控制器和寄存器,而GPU擁有更多ALU(邏輯運(yùn)算單元)用于數(shù)據(jù)處理,這樣的結(jié)構(gòu)更適合對(duì)密集型數(shù)據(jù)進(jìn)行并行處理。
目前,GPU已經(jīng)發(fā)展到較為成熟的階段。Google、Facebook、微軟、百度等公司都在使用GPU分析圖片、視頻和音頻文件,在無(wú)人駕駛技術(shù)上也用到很多GPU芯片。但GPU也有一定的局限性。比如深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分, GPU在算法訓(xùn)練上非常高效。但在推斷中,并行計(jì)算的優(yōu)勢(shì)就不能完全發(fā)揮出來(lái)。
FPGA是可編程器件基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物,用戶(hù)可通過(guò)多次燒錄FPGA配置文件來(lái)定義這些門(mén)電路以及存儲(chǔ)器之間的連線(xiàn)。這種方式既解決了定制電路靈活性的不足,又克服了原有可編程器件門(mén)電路數(shù)有限的缺點(diǎn)。由于FPGA可同時(shí)進(jìn)行數(shù)據(jù)并行和任務(wù)并行計(jì)算,因此在處理特定應(yīng)用時(shí)效率更高。
在功耗方面,F(xiàn)PGA每個(gè)邏輯單元的功能在燒錄時(shí)就已經(jīng)確定,不需要指令,無(wú)需共享內(nèi)存,從而可以極大的降低單位執(zhí)行的功耗。
第三種,全定制化的ASIC。這類(lèi)芯片的計(jì)算能力和計(jì)算效率都直接根據(jù)特定的算法的需要進(jìn)行定制,最大的優(yōu)勢(shì)在于體積小、功耗低、高可靠性、保密性強(qiáng)、計(jì)算性能高、計(jì)算效率高等。所以在特定領(lǐng)域,ASIC芯片是遠(yuǎn)超GPU、FPGA的。當(dāng)然,ASIC芯片的缺點(diǎn)也很明顯,因?yàn)槠涫轻槍?duì)特定算法設(shè)計(jì)的,一旦芯片設(shè)計(jì)完畢,對(duì)應(yīng)的算法就是固定的,所以一旦算法發(fā)生變化就可能將會(huì)無(wú)法使用。
AI芯片崛起的原因
AI芯片之所以能在近幾年快速崛起,無(wú)外乎以下幾個(gè)原因:
1、市場(chǎng)需求擴(kuò)張
在人工智能發(fā)展的初期,算法為王,像數(shù)據(jù)中心、大數(shù)據(jù)分析、精準(zhǔn)營(yíng)銷(xiāo)等方面成功實(shí)現(xiàn)了商業(yè)落地。隨著智能化變革深入到交通、安防、通信等領(lǐng)域,受功耗、傳輸數(shù)據(jù)、時(shí)延等條件限制,僅靠原有的云端計(jì)算解決方案難以滿(mǎn)足人工智能本地應(yīng)用落地計(jì)算需求,在終端、邊端場(chǎng)景同樣需要人工智能計(jì)算,因此催生了AI芯片新硬件的發(fā)展。
“不管有什么好的AI算法,要想最終得到應(yīng)用,就必然要通過(guò)芯片來(lái)實(shí)現(xiàn)。”清華大學(xué)微電子所所長(zhǎng)魏少軍教授曾這樣表示,作為算法的載體,芯片硬件的提升也為先進(jìn)的軟件算法帶來(lái)了更多的機(jī)會(huì),為高性能、高算力AI芯片的出現(xiàn)提供了更多保障。
2、政策支持,資本看好
人工智能正成為國(guó)際學(xué)術(shù)的新焦點(diǎn),加快新一代人工智能培養(yǎng),已成為抓住新一輪科技革命和產(chǎn)業(yè)變革機(jī)遇的戰(zhàn)略性問(wèn)題。對(duì)此,國(guó)家對(duì)人工智能的發(fā)展高度重視,并陸續(xù)出臺(tái)一系列人工智能產(chǎn)業(yè)發(fā)展政策。目前我國(guó)人工智能產(chǎn)業(yè)已基本成型,從中央到各地的政策措施陸續(xù)亮相。在政策扶持下,不僅能加快人工智能產(chǎn)業(yè)政策的落地,還能促進(jìn)產(chǎn)業(yè)深度融合,加速人工智能應(yīng)用商業(yè)化的發(fā)展。
AI芯片市場(chǎng)引發(fā)了老牌芯片廠(chǎng)商英偉達(dá)、英特爾的持續(xù)關(guān)注,像國(guó)內(nèi)的百度、阿里、華為等科技巨頭也紛紛加碼AI芯片賽道。除了巨頭的動(dòng)作,早在2014年國(guó)家多部門(mén)聯(lián)合多個(gè)企業(yè)成立了“國(guó)家集成電路產(chǎn)業(yè)投資基金”,一期投資高達(dá)1387億元,如今大基金二期完成2000億左右規(guī)模的募資,接下來(lái)將重點(diǎn)投資人工智能、5G、物聯(lián)網(wǎng)等終端應(yīng)用產(chǎn)業(yè),進(jìn)一步推動(dòng)國(guó)產(chǎn)半導(dǎo)體產(chǎn)業(yè)發(fā)展。
3、技術(shù)門(mén)檻稍低
為什么有大量廠(chǎng)商都開(kāi)始轉(zhuǎn)型研發(fā)AI芯片,很重要的一點(diǎn)原因是其技術(shù)門(mén)檻稍低。很多人工智能學(xué)習(xí)都要求的是完成簡(jiǎn)單而大量地重復(fù)輸入,且AI芯片針對(duì)某一類(lèi)特定場(chǎng)景進(jìn)行開(kāi)發(fā),不像傳統(tǒng)CPU一樣要求“十項(xiàng)全能”。其次,很多時(shí)候所謂的AI芯片并不是獨(dú)立研發(fā)的一塊芯片,不必耗費(fèi)大量精力去完成各類(lèi)IP(知識(shí)產(chǎn)權(quán))內(nèi)核,而是針對(duì)一些AI功能進(jìn)行加速優(yōu)化,以釋放更多計(jì)算資源跟其他模塊去處理復(fù)雜場(chǎng)景。這也是科技企業(yè)為什么蜂擁做AI芯片的原因之一。
AI芯片群雄逐鹿,國(guó)產(chǎn)崛起正當(dāng)時(shí)
據(jù)OFweek電子工程網(wǎng)不完全統(tǒng)計(jì),自2014年AI芯片創(chuàng)業(yè)潮以來(lái),國(guó)內(nèi)AI芯片企已超過(guò)數(shù)百家,公開(kāi)宣布推出AI芯片產(chǎn)品的企業(yè)包括傳統(tǒng)芯片廠(chǎng)商華為海思、紫光展銳、聯(lián)發(fā)科、瑞芯微等,也有憑借自己在互聯(lián)網(wǎng)領(lǐng)域深厚實(shí)力進(jìn)軍AI芯片的科技巨頭百度、阿里巴巴,還有諸如寒武紀(jì)、地平線(xiàn)、云天勵(lì)飛等大批專(zhuān)注AI芯片細(xì)分領(lǐng)域“后起之秀”。
光是在2019年,就有阿里巴巴、百度、寒武紀(jì)等多家廠(chǎng)商推出了性能領(lǐng)先的AI芯片產(chǎn)品,覆蓋圖像識(shí)別、智慧城市、云計(jì)算、自動(dòng)駕駛等多個(gè)領(lǐng)域。
![](http://m.jycsgw.cn/file/upload/202007/01/164313741.png)
縱觀(guān)全球AI芯片發(fā)展,中美兩國(guó)成為了主要競(jìng)爭(zhēng)對(duì)手。根據(jù)烏鎮(zhèn)全球人工智能申請(qǐng)專(zhuān)利數(shù)量統(tǒng)計(jì),美國(guó)、中國(guó)位列前二,且數(shù)量級(jí)接近;在知名專(zhuān)利檢索公司QUESTEL發(fā)布的《芯片行業(yè)專(zhuān)利分析及專(zhuān)利組合質(zhì)量評(píng)估》報(bào)告指出:中國(guó)近10年芯片專(zhuān)利增長(zhǎng)驚人,已成為芯片專(zhuān)利申請(qǐng)第一大國(guó)。
眾所周知,“無(wú)芯之痛”一直是國(guó)內(nèi)半導(dǎo)體產(chǎn)業(yè)發(fā)展的最大不足,AI芯片正是國(guó)內(nèi)企業(yè)發(fā)展的絕佳機(jī)會(huì),國(guó)內(nèi)企業(yè)已經(jīng)初步具備了和國(guó)際企業(yè)競(jìng)爭(zhēng)合作的技術(shù)基礎(chǔ)和知識(shí)產(chǎn)權(quán)基礎(chǔ),彰顯出中國(guó)軍團(tuán)在A(yíng)I芯片領(lǐng)域的彎道超車(chē)之勢(shì)。
但是國(guó)產(chǎn)AI芯片快速崛起的態(tài)勢(shì)也并非一帆風(fēng)順,雖然我國(guó)在在偏向于設(shè)備端的AI 芯片開(kāi)發(fā)領(lǐng)域,以及類(lèi)腦芯片領(lǐng)域都有所建樹(shù),但在FPGA、GPU領(lǐng)域依然缺乏有競(jìng)爭(zhēng)力的原創(chuàng)產(chǎn)品,大多數(shù)只是只是基于FPGA/GPU做二次開(kāi)發(fā)。這主要與我國(guó)在芯片領(lǐng)域一直缺乏關(guān)鍵核心自主技術(shù)有關(guān),想要突破技術(shù)壁壘,還要踏實(shí)走好每一步。
市場(chǎng)趨于理性,“夠?qū)嵙?rdquo;才能存活
據(jù)OFweek電子工程網(wǎng)觀(guān)察近幾年來(lái)媒體熱度以及各家公司新品發(fā)布消息,以及結(jié)合百度指數(shù)對(duì)“人工智能”、“芯片”等關(guān)鍵詞的趨勢(shì)研究來(lái)看,2017-2018年尤其是2018下半年相關(guān)的熱度達(dá)到了高點(diǎn)。
![](http://m.jycsgw.cn/file/upload/202007/01/164313721.png)
(數(shù)據(jù)源自百度指數(shù)-趨勢(shì)研究)
如同任何新興技術(shù)的發(fā)展曲線(xiàn)一樣,AI芯片行業(yè)在一輪創(chuàng)業(yè)及融資熱潮之后,也經(jīng)歷了一輪大洗牌。從信息流的角度來(lái)看,AI芯片熱潮從2019年至今已經(jīng)退卻了不少,目前保持相對(duì)平穩(wěn)的曲線(xiàn)正向發(fā)展。
早期A(yíng)I芯片概念一出,就如同iPhone10的劉海屏一般,各家友商一見(jiàn)到立馬跟風(fēng)模仿,不管本質(zhì)是不是AI芯片,總之先掛個(gè)名號(hào)上去。由于消費(fèi)者對(duì)于A(yíng)I的理解也不充分,就方便了部分不良商家渾水摸魚(yú),整個(gè)AI產(chǎn)品市場(chǎng)也受到了不少混亂影響。
隨著AI芯片細(xì)分領(lǐng)域的成熟,大批AI芯片產(chǎn)品的問(wèn)世,市場(chǎng)開(kāi)始對(duì)各廠(chǎng)商的產(chǎn)品和技術(shù)進(jìn)行檢驗(yàn),大量沒(méi)有營(yíng)收、產(chǎn)品不具備市場(chǎng)競(jìng)爭(zhēng)力的AI初創(chuàng)公司不得不退出競(jìng)爭(zhēng)。唯有真正具備核心技術(shù)研發(fā)實(shí)力的企業(yè),才有存活下來(lái)的資本。雖然如今AI芯片的熱度不像之前那么火爆,但難保接下來(lái)不會(huì)再次爆發(fā)一波行業(yè)熱潮,AI芯片的未來(lái)會(huì)是什么樣,仍然充滿(mǎn)無(wú)限可能。