云海麒麟深度學(xué)習(xí)平臺(tái)Cloudkirin Deeplearning 2017支持分布式的深度學(xué)習(xí)算法產(chǎn)品。在CPU和GPU混布計(jì)算集群上,深度學(xué)習(xí)算法產(chǎn)品進(jìn)一步提升高性能計(jì)算的分布式能力,海量數(shù)據(jù)得以在多機(jī)多卡間并行處理,大幅提升訓(xùn)練收斂速度。
產(chǎn)品特性:
?B/S架構(gòu)圖形界面,支持中英文界面
?通過(guò)Web GUI實(shí)現(xiàn)硬件監(jiān)控,配置資源管理,實(shí)時(shí)監(jiān)控CPU負(fù)載、內(nèi)存使用率和網(wǎng)絡(luò)流量等狀態(tài)
?快速網(wǎng)絡(luò)自動(dòng)部署整個(gè)集群系統(tǒng)
?多種服務(wù)(DHCP, NTP, NIS, DNS等)配置
?系統(tǒng)備份和恢復(fù)節(jié)點(diǎn)到默認(rèn)設(shè)置
?智能化任務(wù)調(diào)度,實(shí)現(xiàn)資源預(yù)留,任務(wù)回填,動(dòng)態(tài)優(yōu)先級(jí)和集群分區(qū)等功能
?全面的錯(cuò)誤報(bào)告和日志
?具有安全機(jī)制的并發(fā)工具,方便集群的管理和使用
?支持多網(wǎng)絡(luò)配置
?提供更加強(qiáng)大的命令行接口(CLI)
?提供優(yōu)化的并行編程環(huán)境:MPICH, LAM,openmpi
?按需開(kāi)關(guān)機(jī)
?由于計(jì)算節(jié)點(diǎn)硬件故障導(dǎo)致的作業(yè)中斷可以重新提交作業(yè)
?支持用戶定制化開(kāi)發(fā)
?支持并行GPU計(jì)算,能夠?qū)崿F(xiàn)GPU并行作業(yè)調(diào)度管理。
平臺(tái)版本說(shuō)明:
系統(tǒng)架構(gòu)說(shuō)明:
免責(zé)說(shuō)明:此方案中軟件部分非本公司品牌,由第三方合作伙伴提供。若您所使用的軟件并非從本公司或經(jīng)軟件廠商官方授權(quán)的第三方獲取,本公司將無(wú)法保證軟件的合法正常使用,您因此遭受的損失與本公司無(wú)關(guān)。