亚洲精品欧美另类,国产写真无码福利导航,人人看人人干人人射

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

超強通用編譯器優(yōu)化工具！MIT打造，準(zhǔn)確率是傳統(tǒng)方法5倍

新代碼在自家芯片上運行狀況如何？英特爾自己都沒有別人家的新工具清楚。

站在用戶的角度思考問題，與客戶深入溝通，找到河池網(wǎng)站設(shè)計與河池網(wǎng)站推廣的解決方案，憑借多年的經(jīng)驗，讓設(shè)計與互聯(lián)網(wǎng)技術(shù)結(jié)合，創(chuàng)造個性化、用戶體驗好的作品，建站類型包括：成都網(wǎng)站設(shè)計、成都網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣、申請域名、虛擬空間、企業(yè)郵箱。業(yè)務(wù)覆蓋河池地區(qū)。

這就是MIT耗時一年提出的研究成果，名為Ithemal，核心功能也非常簡單：

能夠分析數(shù)以百萬計自動描述的基本塊（計算指令的基本片段），來確切了解不同的芯片機構(gòu)如何執(zhí)行計算。

效果也非常驚艷。

MIT News透露，傳統(tǒng)基于人工設(shè)計的模型，預(yù)測代碼在芯片上的運行速度，與實際運行速度之間的錯誤率高達50%。

就算是芯片供應(yīng)商，比如英特爾預(yù)測代碼在自己芯片上的運行速度，錯誤率也達到20%。而Ithemal，錯誤率僅為10%。

性能是傳統(tǒng)方法的5倍，英特爾的2倍。

整個過程都是自動化的，不需要人為干預(yù)，就能夠快速分析數(shù)十萬或數(shù)百萬個基本塊。

并且通用，它可以快速學(xué)習(xí)代碼在任何新的芯片架構(gòu)的性能速度，無論是機器學(xué)習(xí)煉丹，還是加密技術(shù)上鏈、還是編譯器優(yōu)化等等，都能hold住。

研究人員分享了這樣的一個使用場景：

如果你想在一個新的芯片架構(gòu)上訓(xùn)練一個模型，比如谷歌的TPU，你只需要從這個架構(gòu)中收集數(shù)據(jù)，經(jīng)過分析器運行后，去訓(xùn)練Ithemal，你可以得到一個可以預(yù)測其性能的模型。”

對于充分發(fā)揮芯片性能，讓代碼運行更有效率，這是具有突破性意義的一項進展。

基于神經(jīng)網(wǎng)絡(luò)，避開“盲人摸象”

通常情況下，為了讓代碼能夠在芯片上高效地運行，開發(fā)者會結(jié)合編譯器設(shè)計一個性能模型，模擬代碼在芯片架構(gòu)上的運行情況。

開發(fā)者會根據(jù)這些信息進一步優(yōu)化代碼，進一步提高代碼運行效率，突破芯片的性能瓶頸。

這種思路雖然沒什么問題，麻煩出在如何設(shè)計性能模型上，傳統(tǒng)的方法是一小部分專家來人工設(shè)計。

面對錯綜復(fù)雜的芯片架構(gòu)，這多少有些“盲人摸象”的感覺，就英特爾一家，描述其芯片架構(gòu)的文檔，多達3000頁。

而且這些內(nèi)容也不一定完整，考慮到商業(yè)競爭以及技術(shù)保密上的考慮，英特爾也會去刻意忽略一些內(nèi)容，這無疑又加大了困難——盲人摸到的象，可能缺胳膊少腿。

[[312658]]

更別提現(xiàn)代的芯片架構(gòu)設(shè)計了，不僅不透明，而且及其復(fù)雜，難以理解。想要得到一個性能模型，很難；想要得到一個更精確的性能模型，更難。

MIT的方法中，一開始就繞開了“盲人摸象”的困境，而是建立神經(jīng)網(wǎng)路，從“數(shù)據(jù)”中學(xué)習(xí)。

這個數(shù)據(jù)，就是芯片執(zhí)行“基本塊”所需的平均周期數(shù)，不需要手動添加任何特征。

就算輸入之前沒有“看到”過的基本塊和芯片架構(gòu)，訓(xùn)練好的模型也能夠給出數(shù)字，來更準(zhǔn)確地預(yù)測芯片執(zhí)行代碼的速度。

正所謂冰凍三尺，并非一日之寒。

MIT這款強大工具的誕生也是Step By Step。

第一步：用“基本塊”訓(xùn)練標(biāo)記數(shù)據(jù)

首先，研究人員提出了一種神經(jīng)網(wǎng)絡(luò)工具——以“基本塊”的形式訓(xùn)練標(biāo)記數(shù)據(jù)。

這樣做的目的就是可以自動預(yù)測給定芯片中，執(zhí)行基本塊所需要的時間。

結(jié)果表明，比起傳統(tǒng)的手工調(diào)整模型，精確度上要高得多。

這個工具叫做Ithemal，研究還發(fā)表在了ICML 2019上。

Ithemal的全名叫做“Instruction THroughput Estimator using MAchine Learning”。

受深度神經(jīng)網(wǎng)絡(luò)的靈感，它采用了一種新型的數(shù)據(jù)驅(qū)動方法來預(yù)測一條指令塊的吞吐量。

Ithemal將吞吐量估計問題建模為一個回歸任務(wù)，并利用DNN使用大量標(biāo)記數(shù)據(jù)集將序列映射為實際值的吞吐量，以此來學(xué)習(xí)如何預(yù)測。

更具體點來說，Ithemal使用分層多尺度RNN，讓每條指令生成一個獨立的嵌入，然后依次結(jié)合指令嵌入來預(yù)測吞吐量。

在所有基準(zhǔn)測試中，平均絕對百分誤差(MAPE)降低了50%以上，同時仍然提供了較快的估計速度。

在生成高質(zhì)量的預(yù)測時，Ithemal只需要訓(xùn)練數(shù)據(jù)和ISA的規(guī)范，包括指令規(guī)范及其顯式和隱式操作數(shù)。

并且與分析模型不同，Ithemal不需要任何明確的規(guī)范或建模，只需要學(xué)習(xí)有助于提高吞吐量的任何顯著的微體系結(jié)構(gòu)細節(jié)即可。

研究人員還將Ithemal相關(guān)資源開源在了GitHub上：
https://github.com/psg-mit/Ithemal

第二步：推出性能模型驗證套件

接著，在去年11月的IEEE International Symposium on Workload Characterization大會上，研究人員提出了一個基準(zhǔn)測試套件。

這個套件由來自不同領(lǐng)域的基本塊組成，包括機器學(xué)習(xí)、編譯器、密碼學(xué)和圖形，可以用來驗證性能模型。

值得注意的是，這項研究是和谷歌合力完成。

他們將30多萬個數(shù)據(jù)塊匯集到了BHive，這是對x86-64基本塊的性能模型進行系統(tǒng)驗證的基準(zhǔn)。

研究人員使用BHive評估了四個現(xiàn)有的性能模型：IACA，llvm-mca，Ithemal和OSACA。

△基本塊和它們的預(yù)測吞吐量

在他們的評估中，Ithemal預(yù)測英特爾芯片運行代碼的速度，要比英特爾自己建立的性能模型還要快。

并且，研究人員的數(shù)據(jù)集很好地捕捉了兩個Google應(yīng)用程序的基本屬性：Spanner和Dremel。

到了這一步，開發(fā)人員和編譯器可以使用該工具來生成代碼，這些代碼可以在多樣化“黑盒子”芯片設(shè)計上更快，更高效地運行。

電子工程與計算機科學(xué)(EECS)系助理教授Michael Carbin表示：

現(xiàn)代的計算機處理器不透明，復(fù)雜得可怕，難以理解。編寫對這些處理器執(zhí)行得盡可能快的計算機代碼也面臨著巨大的挑戰(zhàn)。
這個工具是朝著對這些芯片的性能進行完全建模，以此來提高效率的重要一步。

第三步：自動生成編譯器優(yōu)化

最后，在去年12月份的NeurIPS 會議上，研究人員提出了一種自動生成編譯器優(yōu)化的新技術(shù)。

具體來說，他們自動生成一個算法，稱為Vemal，將特定的代碼轉(zhuǎn)換為向量，可用于并行計算。

相對于 LLVM 編譯器(業(yè)界流行的編譯器)中使用的手工矢量化算法，Vemal 的性能要更好。

這項主要就是探討了擬合一個圖神經(jīng)網(wǎng)絡(luò)策略來模擬由其(整數(shù)線性規(guī)劃)ILP解所做出的最優(yōu)決策是否可行。

結(jié)果表明，該策略生成的矢量化方案在靜態(tài)度量和運行時性能上都優(yōu)于行業(yè)標(biāo)準(zhǔn)的編譯啟發(fā)式算法。

來自MIT計算機科學(xué)與人工智能實驗室

這三篇論文，都是出自MIT人工智能研究重地——計算機科學(xué)與人工智能實驗室，簡稱CSAIL。

核心人物為Charith Mendis，三篇論文中，有兩篇他是一作。

[[312659]]

他出生于斯里蘭卡，讀碩士的時候來到麻省理工，是ACM Fellow、CSAIL學(xué)術(shù)帶頭人Saman Amarasinghe的關(guān)門弟子——最后一名博士生。

2015年名稱在微軟雷蒙德研究院實習(xí)，主要的研究方向就是編譯器、程序分析與機器學(xué)習(xí)。

他希望，未來大多數(shù)編譯器優(yōu)化將自動生成和學(xué)習(xí)，而不是手動編寫。它們不僅會產(chǎn)生更快的代碼，而且將更易于開發(fā)和維護。

而現(xiàn)在一系列的工作，就是在朝著這個方向發(fā)展。

而眼前的下一步，他們將會發(fā)力研究使模型可解釋的方法，來弄清楚為什么特定的模型會做出預(yù)測。

傳送門

博客地址：
http://news.mit.edu/2020/tool-how-fast-code-run-chip-0106

Ithemal論文地址：
http://proceedings.mlr.press/v97/mendis19a/mendis19a.pdf

BHive論文地址：
http://groups.csail.mit.edu/commit/papers/19/ithemal-measurement.pdf

自動生成編譯器優(yōu)化論文地址：
http://papers.nips.cc/paper/9604-compiler-auto-vectorization-with-imitation-learning.pdf

本文標(biāo)題：超強通用編譯器優(yōu)化工具！MIT打造，準(zhǔn)確率是傳統(tǒng)方法5倍
文章轉(zhuǎn)載：http://www.5511xx.com/article/cciscpj.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

基于神經(jīng)網(wǎng)絡(luò)，避開“盲人摸象”

第一步：用“基本塊”訓(xùn)練標(biāo)記數(shù)據(jù)

第二步：推出性能模型驗證套件

△基本塊和它們的預(yù)測吞吐量

第三步：自動生成編譯器優(yōu)化

來自MIT計算機科學(xué)與人工智能實驗室

傳送門

其他資訊

新聞中心

基于神經(jīng)網(wǎng)絡(luò)，避開“盲人摸象”

第一步：用“基本塊”訓(xùn)練標(biāo)記數(shù)據(jù)

第二步：推出性能模型驗證套件

△基本塊和它們的預(yù)測吞吐量

第三步：自動生成編譯器優(yōu)化

來自MIT計算機科學(xué)與人工智能實驗室

傳送門

其他資訊

基于神經(jīng)網(wǎng)絡(luò)，避開“盲人摸象”