秒建工作環境
Matrix Fusion在云端預安裝主流深度學習框架、數據科學資料庫和GPU驅動,用戶無需耗費時間搭建開發環境,可在一分鐘內通過簡單的鼠標點擊完成開發環境設置,可以迅速靈活調用CPU和GPU資源。
智能化資源調度
Matrix Fusion 支持各類硬件及操作系統,提供端到端的基礎設施軟件解決方案,管理基礎CPU和GPU計算資源,能夠自動進行工作負載資源調配。深度學習是同時利用CPU和GPU處理工作負載的典型應用,Matrix Fusion通過整合用戶所有的硬件資源(集群亦或是單機)成為CPU+GPU資源池,再將資源根據開發者需要重新分配CPU和GPU到開發者的虛擬環境下,管理員也可以將多余的計算資源靈活分配給其他用戶或更為嚴苛的工作負載。
用戶在不同的虛擬環境中可以選擇在CPU資源上開發,然后在GPU資源中測試,需要擴展訓練到更多GPU上時,可立即調用虛擬環境中任意數量的GPU資源。
容器管理
Matrix Fusion 構建于強大的計算硬件和GPU虛擬化的基礎上,搭載了全方位的容器管理方案。核心負載引擎容器化,是作為極大簡化深度學習和AI工作流程的最新技術,在金錢、人力、時間上投資不菲。而Matrix Fusion無需進行個性化調整,用戶只需登錄操作界面,就可以直接調用專業化容器解決方案。 Matrix Fusion容器管理層包括1個內置資源庫,可以管理預配置容器(包括了每一種部署場景或個性化生成容器): 預配置環境:Matrix Fusion預配置最新的深度學習框架和數據科學數據庫,用戶可以直接使用TensorFlow、Caffe、Torch以及其他社區的最新技術版本。 DIY開發環境:用戶可以利用“工作區快照”或“調入容器”來修改并保存容器環境,DIY一個更貼合自己使用習慣的開發環境。Matrix Fusion “調入容器”可以為用戶提供一個簡約的容器(僅含操作系統、最低配置的數據庫和驅動要求),用戶自行修改環境,然后上載作為標準環境進行后續開發。 用戶可以通過“工作區快照”利用“Docker保存”工作流程來復制環境,修改后保存到資源庫中,以便于下一次的開發工作。 容器導出:容器可導出,作為推理或其他生產部署要求用。
Fusion Core
Matrix Fusion強大的靈活性來源于Fusion Core計算虛擬化引擎。Fusion Core控制應用和基礎GPU計算之間的API調用指示,允許GPU負載靈活分布于本地GPU內存、網絡附加GPU、擴展至高達64個GPU,提供強大的整體性能。
因為Fusion Core采用的是“透明”模式而非虛擬層或其他虛擬化方式,所以不需要對基礎硬件或虛擬機環境做任何改變,也不需要改變應用編程本身。這意味著AI開發者和數據科學家可以無縫利用GPU虛擬化的優勢,且將成本和集成需求降至最低。
數據卷
深度學習和AI工作負載所需數據通常來源廣泛,既有線上也有線下,既有外部也有內部,既有批量文件也有文件系統等等。Matrix Fusion能夠簡化處理工作數據,讓管理員明確網絡附加存儲位置并映射到容器中。只要主機能夠訪問數據地址,容器就可以訪問數據,這讓AI開發者和數據科學家的工作大幅簡化. 此外,系統還支持靈活、無限制的數據映射,Matrix Fusion支持每個節點的本地NFS文件系統。這一默認選項提供了工作負載的標準地址,無論運行多大的深度學習工作負載(包括運行在多服務器之間的),都可以快速獲取運行任務所需的數據