標簽:服務器,人工智能,IBM,
IBM昨日(8月7日)發布了一項新技術,該技術可以通過應用大量強大的硬件來完成分布式深度學習(DDL)系統的訓練。它的工作原理是優化運行深度神經網絡的硬件組件之間的數據傳輸。
IBM試圖解決的關鍵問題是分布式深度學習系統中的網絡瓶頸問題。雖然有可能將計算負載分散到許多計算機上,但由于在實際計算中硬件之間的高延遲連接,這個過程會變得越來越低效。
PowerAI DDL是一種新的通信庫,它與一篇解釋性研究論文聯合發布,目的是為了提高效率,確保運行中的系統能夠充分利用所有可用的高性能連接。通過使用PowerAI DDL,IBM能夠在50分鐘內,使用64臺具有4個GPU的服務器,在ImageNet數據集上訓練流行的Resnet-50深度神經網絡。
擁有足夠硬件的組織能夠充分利用PowerAI DDL的能力,可以明顯看到,數據科學家們等待實驗運行結果的時間會大大縮減。實驗運行得更快,科學家們就可以做更多實驗,也將會產生更好的結果。
IBM的通信庫正在作為其PowerAI軟件包的一部分發布,它允許數據科學家和工程師在該公司的高性能Power Systems服務器上執行機器學習任務。為進行測試,該公司使用了64臺Power8 S822LC服務器,每臺都有4個Nvidia Tesla p100-sxm2 GPU。
這是套硬件很昂貴,但對于那些非常需要高性能人工智能計算而且不怕燒錢的企業來說,這算不了什么。或許,這可能正是醫療行業所需要的。
這項技術通過PowerAI發布,可以讓人們更容易地獲得IBM的研究成果,因為它與現有的一款軟件集成在一起,該軟件需在Power Systems硬件上運行。
不過,:IBM只是為自己的硬件發布了PowerAI DDL,且不會將系統的代碼作為開放源碼項目來使用,因此它無法在其他平臺上實現。
|