男人摸女人的胸视频,91精品国产91久久久久久最新,黄色视频性爱免费看,黄瓜视频在线观看,国产小视频国产精品,成人福利国产一区二区,国产高清精品自拍91亚洲,国产91一区二区

加急見(jiàn)刊

基于多并行計(jì)算和存儲(chǔ)的CNN加速器

李宗凌; 汪路元; 禹霽陽(yáng); 程博文; 郝梁; 張偉功 北京空間飛行器總體設(shè)計(jì)部; 北京100094; 首都師范大學(xué)信息工程學(xué)院; 北京100048

摘要:根據(jù)深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)前向推理結(jié)構(gòu)特點(diǎn),設(shè)計(jì)了基于多并行計(jì)算和存儲(chǔ)的深度卷積神經(jīng)網(wǎng)絡(luò)加速器,從運(yùn)算效率與數(shù)據(jù)重用兩個(gè)角度分析了卷積運(yùn)算的并行特征,并研究了全連接層的全并行流水實(shí)現(xiàn)方式。該加速器采用并行流水結(jié)構(gòu)提升計(jì)算效率,在卷積層運(yùn)算中,充分利用多種卷積運(yùn)算并行架構(gòu)平衡運(yùn)算效率與參數(shù)及數(shù)據(jù)載入帶寬的需求,通過(guò)三種加速方式實(shí)現(xiàn)卷積層內(nèi)全流水加速;在全連接層運(yùn)算中,將乘累加運(yùn)算設(shè)計(jì)成全流水處理架構(gòu),流水延時(shí)不超過(guò)20個(gè)處理時(shí)鐘,并通過(guò)并行計(jì)算實(shí)現(xiàn)16倍加速。在基于ImageNet公開(kāi)數(shù)據(jù)集驗(yàn)證實(shí)驗(yàn)中,該加速器每周期最多運(yùn)行2304次乘累加運(yùn)算,在150MHz的工作頻率下,峰值運(yùn)算速率達(dá)到691.2Gops,能效比為i7-6700-CPU的2700倍以上,為GTX-1050-GPU的290倍以上。該加速器在硬件資源、計(jì)算精度、速度以及功耗等多方面達(dá)到良好平衡,便于在星載嵌入式環(huán)境應(yīng)用。

注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系計(jì)算機(jī)技術(shù)與發(fā)展雜志社

相關(guān)推薦

更多