OGSP( Ongineer Service Platform )是奧工科技自主研發的面向終端計算用戶的、安全、可進化的密集計算服務平臺。OGSP秉承云原生設計理念,搭建密集計算場景中基礎側、平臺側、應用側的生態服務架構,謀求基礎側的穩定、健康、可擴展性;平臺側的高效、動態、易用性;應用側的專業、交互、場景化。將服務產品化、產品場景化,為用戶提供基于實際生產場景的一站式密集計算服務。
OGSP廣泛應用于泛氣象、泛生命科學、教科研、工業制造、人工智能、軍工等關鍵領域
一鍵部署
維護簡易
功能豐富
應用全面
管理專業
運營精細
穩定可靠
安全可控
滿足萬核以上的大規模并行計算場景。賦能氣象研究、災害預警、航空航天、精尖制造等高精尖項目,解決其對計算資源和性能的極致追求。
( 不同云微做物理過程參數化方案的模式降水預報敏感性測試 )
滿足Windows和Linux兩種系統環境下圖形交互作業資源的調度,優化CAE、EDA等前后處理場景中對資源的利用率。賦能芯片制造、工業仿真、生物制藥等對計算性能和經濟性兼顧的需求。
( 手機揚聲器的模型處理 )
滿足Al的模型訓練場景下,實時快速進行人工智能算法模擬與優化,以擴大Al訓練的規模、加速迭代的效率。賦能自動駕駛、智慧醫療等Al場景在高性能計算集群中的最佳實踐。
( 使用jupyter調整AI模型 )
為用戶提供命令行的執行環境,并能夠實時快速監測到WEBSHELL中的可疑內容,進行智能的攔截和提醒。解決各類計算場景命令差異化和安全性的矛盾。
( 使用WEBSHELL登錄login節點 )
提供基于高性能計算場景的工作流引擎,串聯前后處理的全流程,以提升各專業部門、應用、數據之間的協作,加速成果的轉化。賦能氣象研究、芯片制造、基因測序等復雜業務場景的流程化需求。
內存 CPU
GPU 負載
使用率
空間使用率
磁盤狀態
節點掛載
用戶配額
節點狀態
隊列明細
隊列核數
實時作業情況
機時匯總
環境溫度
硬件告警
節點警告
郵件通知
公眾號顯示
A無縫對接OGCR智能監控
支持webhook、api等方式的告警接入。
BAl智能降噪算法,快速識別并歸并異常事件告別告警風暴。
C自動任務觸發,告別重復運維。
D運維知識庫積累,助力團隊持續優化。
物理拓撲
資產登記
配置與管理

支持CPU、GPU、存儲用量、存儲配額、內存、License等多種資源的計費,可按用戶的實際計算場景進行計費資源選型。
實時感知資源的使用和消耗情況,將資源計費的及時性提高到秒級以內,真正實現資源的實時計費。
提供多級資源套餐,支持賬號托管費、設備托管費等多種計費場景;增加滿額返充、資源包年等方案,充分滿足計算用戶的經濟性需求。
提供海量的經過實際檢驗的計算作業模板
通過容器快速構建應用的計算環境
海量的本地行業數據源,告別漫長的下載等待與更新

輔助客戶進行集群的標準化建設和優化,提供應用軟件與硬件的適配,集群組件工具的完善,集群配置和管理的標準確立。

提供一鍵安裝包和升級包,進行OGSP的快速部署和版本升級,減少因為系統升級對用戶帶來的影響。

在新老平臺的割接過程中,提供用戶數據、賬號、應用環境的無損遷移,保障業務的連續性。

提供應用軟件的集成服務,快速部署應用軟件并提供計算腳本和界面化的作業模板。