第三媒體
首頁
> 阿里云> 新聞圖片
阿里云發布全棧AI負載高可用 與用戶共建AI時代云上IT新治理
共有圖片
4
張,您正瀏覽第
1
張
點擊圖片可直接翻頁看下一幅圖
[新聞圖片]阿里云發布全棧AI負載高可用 與用戶共建AI時代云上IT新治理
上一張
[簡介]
在高可用模型訓練方面,阿里云AI基礎設施高可用能力融入云服務整體架構設計,基于AI算法的故障預測,實現訓推環節的性能瓶頸分析和潛在故障分析,GPU故障預測準確率達92%,同時將異常預測接入自愈鏈路,訓練恢復自愈率超90%、千卡規模集群連續訓練有效時長大于99%,實現秒級模型自動保存、分鐘級故障恢復;同時,CPFS 高性能存儲集群,在...
下一張