邊緣計算七大核心技術(shù)之體系結(jié)構(gòu)
無論是高性能計算等傳統(tǒng)計算場景,還是邊緣計算等新興計算場景,未來的架構(gòu)應(yīng)該是通用處理器和異構(gòu)計算硬件的共存。異構(gòu)硬件犧牲了一些通用計算功能。使用專用加速裝置減少一種或多種負(fù)載的運(yùn)行時間,并大大提高性能比。邊緣計算平臺通常為特定類型的計算場景設(shè)計,以處理相對穩(wěn)定的負(fù)載類型,因此邊緣計算平臺架構(gòu)用于特定的計算場景。
ShiDianao首次將AI處理器放置在圖像傳感器附近。處理器建議直接從傳感器讀取數(shù)據(jù),以避免由于訪問DRAM中的圖像數(shù)據(jù)而導(dǎo)致的能耗。同時,卷積神經(jīng)網(wǎng)絡(luò)(CNN)將模型完全放置在SRAM中,以分配權(quán)重并避免由于訪問DRAM中的權(quán)重數(shù)據(jù)而導(dǎo)致的能耗。
計算效率(60倍)EIE:它將稀疏矩陣和權(quán)重共享方法并行化。它是一種高效的稀疏神經(jīng)網(wǎng)絡(luò)演示器,可以加速稀疏神經(jīng)網(wǎng)絡(luò)在移動設(shè)備上的實(shí)現(xiàn)。它使用異構(gòu)多核結(jié)構(gòu)來實(shí)現(xiàn)深度學(xué)習(xí)任務(wù)和通用計算任務(wù)(實(shí)時操作系統(tǒng))。并行處理本地AI是物聯(lián)網(wǎng)場景中深度學(xué)習(xí)應(yīng)用程序的自動增量計算框架和架構(gòu)。通過數(shù)據(jù)診斷,選擇最小化數(shù)據(jù)移動的計算模式,并在物聯(lián)網(wǎng)的計算節(jié)點(diǎn)上執(zhí)行深度學(xué)習(xí)任務(wù)。
除了設(shè)計特殊的計算硬件外,在邊緣計算場景中,ESE[6]還負(fù)責(zé)探索FPGA的應(yīng)用。通過FPGA,ESE[6]提高了移動設(shè)備上價格合理的短期存儲網(wǎng)絡(luò)(LSTM)的運(yùn)行效率。FPGA用于加速語音識別應(yīng)用。通過負(fù)載平衡減少和壓縮LSTM,提高硬件利用率,并在多個硬件計算單元中規(guī)劃LSTM數(shù)據(jù)流。使用Xilinx XCKU060 FPGA設(shè)計和實(shí)現(xiàn)硬件。它是CPU和GPU的40倍和11倍。Bioo Kagazadeh等人比較了FPGA和GPU在特定負(fù)載下的吞吐量靈敏度、結(jié)構(gòu)適應(yīng)性、計算功率效率等指標(biāo),表明FPGA更適合邊緣計算場景。
邊緣計算體系結(jié)構(gòu)系統(tǒng)架構(gòu)的設(shè)計仍然是一個新的領(lǐng)域,如何有效地管理邊緣計算異構(gòu)硬件。如何公平、全面地評估這些系統(tǒng)架構(gòu),還有許多問題需要解決。在第三屆邊緣計算大會(SEC2018)上,邊緣計算架構(gòu)研討會ArchEdge首次成立。鼓勵學(xué)術(shù)界和工業(yè)界在這一領(lǐng)域進(jìn)行討論和交流。