2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
現(xiàn)在,在其第28年,“熱芯片”會(huì)議是已知的,用于發(fā)布"大鐵鐵",例如世界上一些最快的系統(tǒng)背后的電源和SPARC芯片。但是這些天,處理電力的需求來(lái)自新的地方。其中一個(gè)重要的是視覺(jué)處理,由照相機(jī)的擴(kuò)散驅(qū)動(dòng);在汽車(chē)、電話和各種"事物;"中的新應(yīng)用以及用于目標(biāo)識(shí)別的神經(jīng)網(wǎng)絡(luò)的快速進(jìn)展。所有這些都需要很多馬力,在本周的會(huì)議上,有幾家公司談到了解決這一問(wèn)題的不同方法。
也許最有新聞價(jià)值的是Nvidia的Parker宣布,它的下一代TEGRA處理器是一款具有自驅(qū)動(dòng)功能的高級(jí)汽車(chē)。在采用3DFinFET晶體管的16nm工藝上通過(guò)鑄造TSMC制造,Parker有兩個(gè)CPU群集(兩個(gè)NVIDIA的自定義64位丹佛2內(nèi)核和四個(gè)現(xiàn)成ARMCortex-A57內(nèi)核),是具有公司最新Pascal圖形的第一個(gè)Telegra芯片。根據(jù)公司的博客文章,Parker能夠在半精度(FP16)下1.5個(gè)觸發(fā)器。在會(huì)議上,NVIDIA還顯示了SPECint_2000基準(zhǔn)測(cè)試的性能,與蘋(píng)果A9x、高通Snapdragon820、三星ExyNOSM1和HiSiliconKirin935相比。
NVIDIA使用標(biāo)準(zhǔn)測(cè)試的結(jié)果表明,Parker可以超過(guò)一些最強(qiáng)大的移動(dòng)處理器。(資料來(lái)源:NVIDIA)
但帕克不適合打電話。相反,它的目的是為下一代具有自動(dòng)駕駛功能的車(chē)輛提供動(dòng)力,它還包括一些專(zhuān)門(mén)的功能。它支持多達(dá)十幾臺(tái)攝像機(jī),可以以每秒60幀的速度解碼和編碼4K視頻,使用千兆位以太網(wǎng)-AVB將音頻和視頻流移動(dòng)到汽車(chē)周?chē)瑸槎噙_(dá)8臺(tái)VMs提供完全的硬件虛擬化,以安全地處理多種汽車(chē)功能,并包括一個(gè)雙CAN(控制器區(qū)域網(wǎng)絡(luò))接口,以連接到眾多的電子控制單元。它也是NVIDIA的第一個(gè)汽車(chē)級(jí)(ISO-26262)SoC,具有彈性功能和一個(gè)在模上安全管理器.
今年早些時(shí)候,NVIDIA宣布了驅(qū)動(dòng)PX2模塊,該模塊有兩個(gè)ParkerSOC(12個(gè)CPU內(nèi)核)和兩個(gè)離散GPU,總共提供8個(gè)單精度(FP32)性能。為了讓這一點(diǎn),GeForceGTX1080,NVIDIA的速度最快的臺(tái)式機(jī)圖形卡,除了1,200美元的TanX之外,還有大約9個(gè)TerapsFP32。NVIDIA表示,超過(guò)80家客戶(hù)正在使用驅(qū)動(dòng)PX2模塊開(kāi)發(fā)自主駕駛功能,而沃爾沃則表示,他們將使用它來(lái)測(cè)試明年開(kāi)始的兩個(gè)自駕駛XC90SUV。
毫無(wú)疑問(wèn),驅(qū)動(dòng)PX2是最強(qiáng)大的汽車(chē)系統(tǒng)之一。但其他公司聲稱(chēng),DSP(數(shù)字信號(hào)處理器)可以在GPU上使用幾瓦或更多的電能。
Movie談到需要在推理的邊緣上進(jìn)行更節(jié)能的處理,或者運(yùn)行用于對(duì)象識(shí)別和其他任務(wù)的模型。"如果你有一輛自駕車(chē),你就不能忍受為了處理而去云所需的延遲,"CTODavidMoloney說(shuō)。在熱芯片運(yùn)動(dòng)中,Movius演示了它在DJIPhantom4無(wú)人機(jī)中的微小的2個(gè)視覺(jué)處理單元,以及執(zhí)行對(duì)象識(shí)別和同時(shí)定位和映射。聯(lián)想最近宣布將在未來(lái)的VR產(chǎn)品中使用大量2,并且Flipr已將VPU添加到其熱成像相機(jī)上。Movieius展示了在2014年imaGenet大賽中使用的22層深層神經(jīng)網(wǎng)絡(luò)的2個(gè)對(duì)比未識(shí)別GPU的性能和效率結(jié)果。
與GPU相比,根據(jù)Movius,當(dāng)運(yùn)行用于對(duì)象識(shí)別的神經(jīng)網(wǎng)絡(luò)時(shí),大量2可以提供更高的性能。(資料來(lái)源:Movieius)
Ceva-XM4是一款高性能的視覺(jué)DSP,能夠在TSMC的28nmHPM過(guò)程中達(dá)到1.5GHz的速度,設(shè)計(jì)用于監(jiān)視攝像頭、ADAS和自主駕駛等領(lǐng)域的嵌入式視覺(jué)和AI,增強(qiáng)現(xiàn)實(shí),以及無(wú)人機(jī)。該公司聲稱(chēng),它的Ceva深度神經(jīng)網(wǎng)絡(luò)2(CDNN2)軟件可以?xún)?yōu)化在流行的CAFFE或Tensorflow框架中構(gòu)建的任何神經(jīng)網(wǎng)絡(luò),使得它能夠在DSP上運(yùn)行。Ceva演示了運(yùn)行Alexnet庫(kù)的CevaXM-4,實(shí)時(shí)使用Milli瓦特的電源進(jìn)行對(duì)象識(shí)別。像NVIDIA的Parker一樣,XM-4認(rèn)證用于汽車(chē)使用,而Ceva說(shuō),從RockChip、NovatekBrite、Inupluger等。
最新增加的Cadence的Tensilica視覺(jué)線處理器,VisionP6,提供了兩到四倍的性能,在卷積神經(jīng)網(wǎng)絡(luò)上,由于額外的MACS(倍累積)支持半精度和單精度浮點(diǎn)(以及8位、16位和32位定點(diǎn)數(shù)據(jù)),并增強(qiáng)了內(nèi)存并行性和數(shù)據(jù)移動(dòng)??ǖ撬寡菔玖艘曈X(jué)P6識(shí)別交通標(biāo)志,人和臉。今年早些時(shí)候在嵌入式視覺(jué)峰會(huì)上宣布,視覺(jué)P6將從10月開(kāi)始提供。
TensilicaDSP的一個(gè)客戶(hù)是Microsoft。在主旨演講中,微軟的尼克貝克首次展示了芯片的一些細(xì)節(jié),這些芯片為"混合現(xiàn)實(shí)"應(yīng)用提供全鏡頭耳機(jī),例如3D設(shè)計(jì)、通信和協(xié)作、游戲、在線學(xué)習(xí)、產(chǎn)品修復(fù)和維護(hù)以及在線購(gòu)物。除了運(yùn)行Windows10的14nm英特爾原子櫻桃軌跡處理器外,全息鏡頭還包括自定義全息處理單元(HPU1.0)傳感器集線器、2GB內(nèi)存和64GB閃存。該HPU在28nm的工藝上由TSMC制造,具有24個(gè)Ten硅DSP內(nèi)核和8MB高速緩存,能夠每秒處理1萬(wàn)億浮點(diǎn)操作。Baker說(shuō),微軟嘗試將任務(wù)卸載到管芯上的GPU,或者使用CPU或圖像信號(hào)處理器的陣列,但是它們都沒(méi)有提供將可編程的x86CPU內(nèi)核和固定功能硬件與DSP相結(jié)合的混合解決方案的性能。
在邊緣運(yùn)行神經(jīng)網(wǎng)絡(luò)時(shí),數(shù)字信號(hào)處理器可以提供更好的每瓦性能。(資料來(lái)源:cadence)
NVIDIA的TeslaGPU用于服務(wù)器顯著縮短了培訓(xùn)模式所需的時(shí)間,導(dǎo)致精度突破,但在推理方面仍有很多工作要做。自主車(chē)輛、無(wú)人機(jī)、增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)、視頻監(jiān)控以及其他智能設(shè)備都需要嵌入式處理器,這些嵌入式處理器可以處理大量的數(shù)據(jù)而不使用大量的電源。今年熱芯片上提出的視覺(jué)處理技術(shù)表明,我們正在接近,在未來(lái)幾年中,他們應(yīng)該為一些令人興奮的應(yīng)用提供構(gòu)建塊。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。