中國AI芯片有可能彎道超車
發(fā)布時(shí)間:2018-07-09 來源: 感恩親情 點(diǎn)擊:
過去數(shù)年之間,信息技術(shù)產(chǎn)業(yè)曾經(jīng)接連興起過幾大熱門領(lǐng)域,包括大數(shù)據(jù)(Bigdata)、物聯(lián)網(wǎng)(IoT)、工業(yè)4.0以及增強(qiáng)和虛擬現(xiàn)實(shí)(AR/VR)等。但直到以深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ)的人工智能技術(shù)出現(xiàn)后,這幾大熱門領(lǐng)域才第一次被整合進(jìn)人工智能這一更大的發(fā)展框架內(nèi)。
當(dāng)前,人工智能技術(shù)仍舊需要海量數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,從而使得計(jì)算機(jī)能夠代替人類從事各種數(shù)據(jù)處理與判斷。飛速發(fā)展的物聯(lián)網(wǎng)技術(shù)首先提供了大量的數(shù)據(jù)來源,經(jīng)過設(shè)計(jì)和訓(xùn)練好的人工智能系統(tǒng)則提供了工業(yè)4.0最需要的智能控制系統(tǒng),也為增強(qiáng)和虛擬現(xiàn)實(shí)場景的落地提供了數(shù)據(jù)處理的技術(shù)手段。
芯片是人工智能系統(tǒng)最關(guān)鍵的技術(shù),中國發(fā)展人工智能芯片產(chǎn)業(yè)的突破口到底在哪?這是人們普遍關(guān)心的問題。
芯片產(chǎn)業(yè)是一門具有高集成性和高成本特性的科技產(chǎn)業(yè),進(jìn)入門檻非常之高。隨著芯片制造技術(shù)進(jìn)入“x納米”(個(gè)位數(shù)納米制程)時(shí)代,每個(gè)晶圓代工廠的造價(jià)動(dòng)輒百億美元起,運(yùn)營與折舊成本驚人。
單個(gè)芯片的設(shè)計(jì)所需要的工程師數(shù)目從幾十到數(shù)百不等,開發(fā)成本少則數(shù)千萬美元,多則上億美元,周期長達(dá)1年-2年。
但是,一個(gè)成功的芯片項(xiàng)目所帶來的不僅僅是銷售芯片本身的利潤,還有伴隨芯片設(shè)計(jì)、制造以及銷售整套流程中產(chǎn)生的支撐產(chǎn)業(yè)與生態(tài)系統(tǒng),從而帶動(dòng)軟硬件發(fā)展、行業(yè)標(biāo)準(zhǔn)制定、知識(shí)產(chǎn)權(quán)銷售、甚至相關(guān)的機(jī)械制造和化工等產(chǎn)業(yè)發(fā)展。
現(xiàn)代芯片設(shè)計(jì),尤其是以“片上系統(tǒng)”(System-on-Chip,SoC)為主體的高端芯片,已經(jīng)可以影響乃至引領(lǐng)某一產(chǎn)業(yè)走向及其戰(zhàn)略發(fā)展,甚至遏制該產(chǎn)業(yè)的正常運(yùn)行。
由于人工智能應(yīng)用的場景千變?nèi)f化,而所應(yīng)用的算法更是有相當(dāng)?shù)牟町,可以預(yù)期未來各項(xiàng)應(yīng)用將有不同的定制化芯片,出現(xiàn)人工智能芯片百家爭鳴的盛況。
人工智能芯片的另一大特點(diǎn)在于它所面對(duì)的是一個(gè)全新的、還未被大公司充分定義的新的業(yè)務(wù)場景。
即使是NVIDIA,也只是在云計(jì)算這一領(lǐng)域有一定的壟斷地位。因此,人工智能芯片發(fā)展有著巨大的不確定性和機(jī)會(huì)。
人工智能芯片發(fā)展很像中國另一新興芯片產(chǎn)業(yè)——比特幣礦機(jī)上的發(fā)展歷程:比特幣礦機(jī)2010年初主要用的還是以CPU為主的芯片,但是從2012年起就逐漸過渡到以圖形處理器(GPU)為主,利用其強(qiáng)大的向量計(jì)算能力來采礦。兩年以后的 2014年,大家開始通過算法優(yōu)化并導(dǎo)入現(xiàn)場可編程邏輯陣列(FPGA)提升效能功耗比來達(dá)到更高挖礦效益。
時(shí)至今日,絕大多數(shù)的高采礦效益的礦機(jī)均是以定制化芯片為主,如比特大陸的螞蟻礦機(jī)。
依照這一類似的發(fā)展趨勢,我們可以期待2018年將是應(yīng)用導(dǎo)向人工智能芯片開始躍進(jìn)的一年。
中國可能彎道超車
GPU和CPU芯片設(shè)計(jì)注重通用性,但其高功耗、相對(duì)較低的單位效能以及高昂的價(jià)格并不適合于類似物聯(lián)網(wǎng)或工業(yè)4.0這樣的普及化應(yīng)用。
應(yīng)用導(dǎo)向的人工智能芯片是將抽象的神經(jīng)網(wǎng)絡(luò)算法以硬件方式加以固化來達(dá)到加速運(yùn)算的效果。這樣的設(shè)計(jì)有助于提升單位芯片面積上算力的密度,降低功耗和成本,從而有助于將人工智能系統(tǒng)更普遍地運(yùn)用到各個(gè)場景。
但芯片的開發(fā)一般需要高質(zhì)量的人才基礎(chǔ)并有強(qiáng)大市場的需求來攤薄芯片開發(fā)的高昂成本:通常一款芯片的生命周期大約為三年,而真正產(chǎn)生利潤的時(shí)間僅為12個(gè)-18個(gè)月。芯片企業(yè)要在這短短的時(shí)間內(nèi)完成利潤積累,進(jìn)行下一代產(chǎn)品的成功開發(fā)與研制,進(jìn)入新一輪的迭代周期。
經(jīng)過近40年的高速發(fā)展,中國已經(jīng)初步具備了一定規(guī)模的微電子人才儲(chǔ)備和巨大的市場,正符合發(fā)展人工智能芯片的兩項(xiàng)基本條件。
除此之外,中國還有一樣更為突出的優(yōu)勢:大量使用數(shù)字化設(shè)備及人口數(shù)帶來的龐大數(shù)據(jù)。在以應(yīng)用為主體的開發(fā)概念下,每一個(gè)應(yīng)用都需有各自對(duì)應(yīng)的數(shù)據(jù)集來訓(xùn)練神經(jīng)網(wǎng)絡(luò),有效數(shù)據(jù)的采集速度會(huì)是影響開發(fā)周期長短的最關(guān)鍵的因素之一。海量高質(zhì)量的訓(xùn)練數(shù)據(jù)集可以幫助工程人員快速有效地訓(xùn)練神經(jīng)網(wǎng)絡(luò),加速模型的定型,縮短人工智能芯片的設(shè)計(jì)周期。
在各國數(shù)據(jù)采集管理法規(guī)日趨收緊,尤其是歐盟最近出臺(tái)通用數(shù)據(jù)保護(hù)規(guī)范(GDPR)的大環(huán)境下,寬松的數(shù)據(jù)管理制度會(huì)讓中國在人工智能芯片產(chǎn)業(yè)上占據(jù)非常有利的位置,從而達(dá)成“彎道超車”的目標(biāo)。
面臨多重挑戰(zhàn)
人工智能系統(tǒng)可以粗分為云端和終端兩大應(yīng)用。其硬件系統(tǒng)按照功能則可相應(yīng)分為訓(xùn)練機(jī)和推理機(jī)兩種。在過去較長一段時(shí)間,人工智能應(yīng)用主要在云端,包括訓(xùn)練與推理兩部分。云端系統(tǒng)的人工智能芯片能依算法與數(shù)據(jù)形態(tài)的不同來處理各式應(yīng)用。
考慮到海量數(shù)據(jù)的處理需求,數(shù)據(jù)中心高昂的建設(shè)和運(yùn)營成本,以及應(yīng)用的多樣性,云端人工智能芯片通常要求具有高集成性、高效能,以及高密度算力等特點(diǎn),而且需要有一定的通用性。芯片對(duì)應(yīng)各種應(yīng)用場景所需的軟件支持也是一項(xiàng)設(shè)計(jì)重點(diǎn)。
云端通用型人工智能芯片主要的開發(fā)難點(diǎn)在于如何針對(duì)業(yè)務(wù)所需的神經(jīng)網(wǎng)絡(luò)模型做相應(yīng)的計(jì)算體系結(jié)構(gòu)改良并同時(shí)考量通用性與應(yīng)用導(dǎo)向設(shè)計(jì)之間的取舍。
這屬于芯片開發(fā)中門檻較高的項(xiàng)目,而且所設(shè)計(jì)的人工智能芯片的規(guī)模通常較大,技術(shù)難度也較高。除了對(duì)應(yīng)用場景有深刻理解之外,設(shè)計(jì)者也需要有長期芯片設(shè)計(jì)與流片經(jīng)驗(yàn)的累積才能夠保證拿出成熟的產(chǎn)品。
國內(nèi)公司在經(jīng)驗(yàn)上與國外其他領(lǐng)跑企業(yè)如英特爾、高通、NVIDIA等應(yīng)該說還有一段差距。但國內(nèi)頭部企業(yè)的迭代速度非常快,加上與代工廠(比如TSMC)和后端設(shè)計(jì)服務(wù)公司的緊密合作,對(duì)于先進(jìn)工藝流片經(jīng)驗(yàn)掌握的速度非常之快。國內(nèi)寒武紀(jì)和比特大陸兩家公司在未來的表現(xiàn)非常值得期待。預(yù)計(jì)再經(jīng)過一兩代的開發(fā)即能迎頭趕上世界最前沿產(chǎn)品,并可望大量使用于數(shù)據(jù)中心。
熱點(diǎn)文章閱讀