現(xiàn)在使用的AI芯片的研究方式不盡相同,這些不同的研究方向都有自己的優(yōu)點和弊端。那么哪種研究方式會成為之后的主流研究方向呢?

AI芯片研究方向介紹
AI芯片的研發(fā)方向主要分兩種:一是基于傳統(tǒng)馮·諾依曼架構(gòu)的FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)芯片,二是模仿人腦神經(jīng)元結(jié)構(gòu)設(shè)計的類腦芯片。其中FPGA和ASIC芯片不管是研發(fā)還是應(yīng)用,都已經(jīng)形成一定規(guī)模;而類腦芯片雖然還處于研發(fā)初期,但具備很大潛力,可能在未來成為行業(yè)內(nèi)的主流。
這兩條發(fā)展路線的主要區(qū)別在于,前者沿用馮·諾依曼架構(gòu),后者采用類腦架構(gòu)。你看到的每一臺電腦,采用的都是馮·諾依曼架構(gòu)。它的核心思路就是處理器和存儲器要分開,所以才有了CPU(中央處理器)和內(nèi)存。而類腦架構(gòu),顧名思義,模仿人腦神經(jīng)元結(jié)構(gòu),因此CPU、內(nèi)存和通信部件都集成在一起。
兩種架構(gòu)的簡要發(fā)展史
2007年以前,受限于當(dāng)時算法和數(shù)據(jù)等因素,AI對芯片還沒有特別強烈的需求,通用的CPU芯片即可提供足夠的計算能力。之后由于高清視頻和游戲產(chǎn)業(yè)的快速發(fā)展,GPU
(圖形處理器)芯片取得迅速的發(fā)展。因為 GPU 有更多的邏輯運算單元用于處理數(shù)據(jù),屬于高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面比 CPU
更有優(yōu)勢,又因為AI深度學(xué)習(xí)的模型參數(shù)多、數(shù)據(jù)規(guī)模大、計算量大,此后一段時間內(nèi) GPU 代替了 CPU,成為當(dāng)時 AI 芯片的主流。
然而 GPU 畢竟只是圖形處理器,不是專門用于 AI 深度學(xué)習(xí)的芯片,自然存在不足,比如在執(zhí)行AI
應(yīng)用時,其并行結(jié)構(gòu)的性能無法充分發(fā)揮,導(dǎo)致能耗高。與此同時,AI技術(shù)的應(yīng)用日益增長,在教育、醫(yī)療、無人駕駛等領(lǐng)域都能看到 AI 的身影。然而GPU
芯片過高的能耗無法滿足產(chǎn)業(yè)的需求,因此取而代之的是 FPGA 芯片,和 ASIC 芯片。
FPGA 和 ASIC 芯片區(qū)別
FPGA 和 ASIC 的區(qū)別。FPGA基本原理是在芯片內(nèi)集成大量的數(shù)字電路基本門電路以及存儲器,而用戶可以通過燒入 FPGA
配置文件來來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,即用戶今天可以把 FPGA 配置成一個微控制器 MCU,明天可以編輯配置文件把同一個
FPGA 配置成一個音頻編解碼器。ASIC 則是專用集成電路,一旦設(shè)計制造完成后電路就固定了,無法再改變。
比較 FPGA 和 ASIC 就像比較樂高積木和模型。舉例來說,如果你發(fā)現(xiàn)最近星球大戰(zhàn)里面 Yoda 大師很火,想要做一個 Yoda
大師的玩具賣,你要怎么辦呢?
有兩種辦法,一種是用樂高積木搭,還有一種是找工廠開模定制。用樂高積木搭的話,只要設(shè)計完玩具外形后去買一套樂高積木即可。而找工廠開模的話在設(shè)計完玩具外形外你還需要做很多事情,比如玩具的材質(zhì)是否會散發(fā)氣味,玩具在高溫下是否會融化等等,所以用樂高積木來做玩具需要的前期工作比起找工廠開模制作來說要少得多,從設(shè)計完成到能夠上市所需要的時間用樂高也要快很多。
FPGA 和 ASIC 也是一樣,使用 FPGA 只要寫完 Verilog 代碼就可以用 FPGA 廠商提供的工具實現(xiàn)硬件加速器了,而要設(shè)計 ASIC
則還需要做很多驗證和物理設(shè)計 (ESD,Package 等等),需要更多的時間。如果要針對特殊場合(如軍事和工業(yè)等對于可靠性要求很高的應(yīng)用),ASIC
則需要更多時間進行特別設(shè)計以滿足需求,但是用 FPGA 的話可以直接買軍工級的高穩(wěn)定性 FPGA
完全不影響開發(fā)時間。但是,雖然設(shè)計時間比較短,但是樂高積木做出來的玩具比起工廠定制的玩具要粗糙(性能差)一些(下圖),畢竟工廠開模是量身定制。
AI芯片技術(shù)的現(xiàn)研究趨勢
ASIC無論是從性能、面積、功耗等各方面都優(yōu)于GPU和FPGA,長期來看無論在云端和終端,ASIC都代表AI芯片的未來,目前包括微軟、谷歌、英特爾等巨頭都重金投到ASIC領(lǐng)域,不過由于目前AI算法快速迭代,且ASIC開發(fā)周期較長、需要底層硬件編程、占據(jù)芯片成本等,因此雖然前景利好,但也只有實力雄厚的大佬才敢提前布局。
雖然ASIC成本高且難度大,但移動AI芯片設(shè)計公司仍已經(jīng)開始立足于ASIC的深度學(xué)習(xí),例如聯(lián)發(fā)科發(fā)布的Helio
P70中端設(shè)備芯片組其內(nèi)部就自帶ASIC方案專用的AI核心APU,不僅具備其他AI芯片所帶的諸如美顏、人臉識別、場景優(yōu)化等功能之外,更是大幅降低了AI芯片的功耗,使得用戶在多場景使用環(huán)境下,不再為手機電量的大幅消耗而感到擔(dān)憂。
CPU和GPU都有其專職的工作,例如CPU專注在大型運算,GPU側(cè)重于圖形繪制等,過多的功能堆疊只會虛耗電量和提高溫度,所以即便驍龍845的性能強勁,但在AI拍照這樣的應(yīng)用場景下,長時間仍會有輕微的發(fā)熱情況。所以在這樣的環(huán)境下,AI核的優(yōu)勢顯然就更加明顯了。因此由CPU和GPU配合AI專核來進行分工協(xié)作,反而可以有效提升效能,降低散熱。
以時下在圖像識別領(lǐng)域以及前沿科技產(chǎn)品中的應(yīng)用最為廣泛的AI人臉識別技術(shù)為例,常見的人臉識別其實是一個“掃描檢測”加“結(jié)果判別”的過程,而這個“掃描檢測”的過程中包括五官坐標(biāo)定位、人臉屬性識別、人臉特征提取等等,在“結(jié)果判別“中更涉及到人臉驗證、人臉識別、活體驗證等多個特性,它已經(jīng)不是一個簡單的算法,而是涉及到CPU、GPU、VPU、DLA
等多個運算單元,跨單元的運算很顯然會造成消費體驗的不佳,更別提到結(jié)果涉及的端運行或是云運行問題,所以開發(fā)與之相應(yīng)的AI人工智能神經(jīng)網(wǎng)絡(luò)算法是趨勢,而這點通過網(wǎng)絡(luò)上流出的聯(lián)發(fā)科P60人臉識別技術(shù)對比圖也能窺其一二。前者雖然定位中端,但卻擁有單獨的AI人工智能單元,人臉識別速度比同期的驍龍845和驍龍710都更勝一籌,可見高效節(jié)能的AI獨立單元,即ASIC專核專用是未來人工智能終端最基本的要求。
ASIC 芯片是針對特定需求而定制的專用芯片。雖然犧牲了通用性,但 ASIC 無論是在性能、功耗還是體積上,都比 FPGA 和 GPU
芯片有優(yōu)勢,特別是在需要芯片同時具備高性能、低功耗、小體積的移動端設(shè)備上,比如我們手上的手機。
但是,因為其通用性低,ASIC 芯片的高研發(fā)成本也可能會帶來高風(fēng)險。然而如果考慮市場因素,ASIC芯片其實是行業(yè)的發(fā)展大趨勢。
所以,隨著近幾年人工智能算法和應(yīng)用領(lǐng)域的快速發(fā)展,以及研發(fā)上的成果和工藝上的逐漸成熟,ASIC 芯片正在成為人工智能計算芯片發(fā)展的主流。
從現(xiàn)在人工智能的發(fā)展速度和應(yīng)用來看,在之后的市場ASIC會成為主要市場,而其在研究過程中的高投入也為其研發(fā)帶來了風(fēng)險,但是其仍然是最能保證人工智能利用的研究方向。