產品--自主研發
應對大量計算,提高計算性能,降低計算能耗,簡便部署,統一管理
RJMS作業調度管理系統
產品概述
RJMS作業調度管理系統負責計算資源統一管理和作業調度,幫助用戶合理使用計算資源。它提供靈活多樣的調度策略、穩定可靠的計算服務、簡潔易用的可視化界面,不僅支持大規模異構集群的作業調度,還可以對多個集群實現統一管理。RJMS可大幅度提高集群的計算性能,加速數據分析處理進程。
產品優勢
-
穩定
RJMS已運行18年 -
強大
可管理超過20,000 CPU 核心的超大規模計算集群 -
靈活
策略實時調整 -
專業
資深研發團隊
業務挑戰
一個大型計算集群系統需要支持上千個用戶同時操作,以及上萬個作業同時運行。這對計算集群的穩定性、可靠性提出極其苛刻的要求。
RJMS根據集群運行情況實時調整作業調度策略,并對每個作業進程實時監視,保證集群高效穩定運行。RJMS提供基于Web頁面的系統管理圖形界面,幫助管理員隨時隨地了解運行狀態,修改調度策略,增強了計算集群的可用性。RJMS提供細粒度的隊列管理功能,將異構資源劃分成隊列實現資源管理調度,保證系統對不同體系結構資源的支持性。
產品功能
· 調度策略
提供多個隊列的個性化配置,支持GPU計算加速調度
支持“多級搶占”、“預約回填”、“動態作業優先級”、“節點獨占”等多種調度策略
· 計算服務
計算節點自檢功能,實時故障點排隊。
對作業異常行為快速響應并提供多種容錯處理方案。
· 計費管理
支持CPU核*時、GPU個*時、內存GB*時維度進行作業計費。
· 統一管理
支持多個集群系統統一管理
支持異構集群統一管理
· 可視化界面
提供腳本、命令行、Web界面等多種用戶交互方式。
提供方便的工具對用戶、隊列、節點等屬性和權限進行設置。
提供豐富的作業運行統計分析報表。
應用場景
| 動漫渲染 | 圖像處理、高清視頻、三維渲染 |
| 石油勘探 | 地震資料處理、地震資料解釋、油藏模擬 |
| 氣象環境 | 中尺度、中長期預報、海洋、環境預報 |
| 生命科學 | 序列對比、分子對接、份子動力學 |
| 物理化學 | 量子力學、分子力學、蒙特卡羅分析 |
| CAE仿真 | 結構分析、流體分析、電磁場分析 |