通信電纜 網絡設備 無線通信 云計算|大數據 顯示設備 存儲設備 網絡輔助設備 信號傳輸處理 多媒體設備 廣播系統 智慧城市管理系統 其它智慧基建產品
成都萬緯信息技術有限公司
隨著AI科學計算的技術突破
隨著AI科學計算的技術突破,人工智能已經廣泛應用于各行各業,如醫療、金融、汽車、法律、工業、教育等等,其中AI科學計算服務中心化也成為眾望所歸的選擇,雖然AI 深度學習目前的門檻有所降低,但是對于專業的數據科學家,依然是需要為了環境搭建,并行運算,分布式存儲,作業調度等基礎設施和服務耗費較多的人力和成本,為此,H3C AIOS人工智能平臺應運而生,提出軟硬件一體化方案,從基礎硬件的部署和軟件安裝,到交互式開發環境的一鍵啟動,從模型的深度訓練和調優,到多機多卡GPU作業靈活調度,H3C AIOS人工智能平臺,提供了十分簡潔的使用方式,實現了資源的整合/彈性擴容縮容和合理調度,同時也提供豐富的可自定義的軟件和鏡像和二次開發的API接口,可方便的集成進入原有SaaS平臺。
針對圖像處理、語音識別、自然語言處理等深度學習場景下,需要搭建大規模的GPU集群,針對不同的算法模型、不同的深度學習框架,用戶如何統一調度與管理GPU集群的計算資源、存儲資源,分配給不同的租戶使用,是需要解決的問題。
對于TensorFlow、Caffe、MxNet等深度學習框架,如何快速部署,提供開發鏡像環境,滿足不同用戶在不同場景下的框架需求、算法需求與開發需求,也是數據科學家難以逾越的一道門檻。
面對不同用戶同時進行模型訓練、在線推理,采用什么策略對各個任務進行調度,是搶占模式還是先出,以及每個訓練任務利用哪個GPU加速卡,每個卡的運行狀態如何,都需要統一的監控與管理。
針對以上問題,為用戶提供一體化的軟硬件部署和管理服務,減少系統安裝維護工作量;優化分布式訓練部署模型,實現多機多卡GPU資源與訓練作業靈活調度;提供豐富的可自定義軟件和鏡像庫,充分滿足客戶對AI計算環境的需求。
• 靈活的資源調度機制:提供強大的資源調度策略,以及資源實時監控,使企業可以有效、合理的使用各種計算資源。
• 完善的API接口服務:系統所有核心業務,都對外提供完善的API接口,用戶可以通過這些接口,實現人工智能平臺服務與用戶已有SaaS平臺的深度集成。
• 靈活的權限管理策略:系統通過對人員角色權限的劃分,以及資源的使用規劃,使得平臺中不同的用戶的計算資源都能很好的隔離,滿足企業對權限管理的各種要求。
• 豐富的性能監控服務:AIOS平臺提供完善的性能監控服務,能實時監控系統所有服務的健康狀況和硬件/網絡利用率情況,并針對各種日常運維工作,提供可視化的操作界面,提高系統運維管理者的工作效率。
特性及優勢
AIOS平臺為用戶提供了強大的全流程可視化管理平臺:交互學習平臺,集群管理平臺,性能監控平臺,審計平臺這四大模塊又同時對外提供豐富的接口組件,使得用戶既可以通過我們的平臺進行常規業務操作,又可以利用我們提供的接口組件,將核心服務集成到自己現有系統中。
AIOS平臺提供了一系列的函數庫,方便用戶在建模編寫腳本的過程中,快速調用這些函數而無需關心這些業務無關的技術細節;同時我們在系統不同功能模塊中,提供了不同的工作集,方便用戶在具體場景中快速操作。所有這些,都大大加速了用戶在開發人工智能解決方案時的速度。
統一的集群管理:負責整個系統計算資源的集中管理、統一分配與作業調度,包括GPU資源池的集中管理與分配、多租戶方式隔離計算資源、以作業方式動態分配計算資源以及計算資源回收等。
統一的監控運維:實時監控管理集群資源使用情況和集群狀態,包括作業狀態、GPU使用率、集群健康度等,并分析每一類的資源占用情況,提供觸發預警機制。
統一的開發環境:支持拖拽式和編碼式建模,提供一站式的交互開發操作界面,幫助用戶完成模型腳本在線編輯、模型訓練、模型驗證以及模型推理等核心功能,并結合硬件資源可視化、作業調度器,提高系統硬件資源的利用率。
您感興趣的產品PRODUCTS YOU ARE INTERESTED IN
智慧城市網 設計制作,未經允許翻錄必究 .? ? ?
請輸入賬號
請輸入密碼
請輸驗證碼
請輸入你感興趣的產品
請簡單描述您的需求
請選擇省份