阿里云
   共有圖片4張,您正瀏覽第1 點擊圖片可直接翻頁看下一幅圖  

[新聞圖片]阿里云發布全棧AI負載高可用 與用戶共建AI時代云上IT新治理

阿里云 上一張 上一張 [簡介]
      在高可用模型訓練方面,阿里云AI基礎設施高可用能力融入云服務整體架構設計,基于AI算法的故障預測,實現訓推環節的性能瓶頸分析和潛在故障分析,GPU故障預測準確率達92%,同時將異常預測接入自愈鏈路,訓練恢復自愈率超90%、千卡規模集群連續訓練有效時長大于99%,實現秒級模型自動保存、分鐘級故障恢復;同時,CPFS 高性能存儲集群,在...
下一張 阿里云 下一張