晶創主機共有21部H100AI計算節點,單節點規格如下
硬體元件 | 描述 | 數量 |
---|---|---|
CPU | Intel® Xeon® Platinum 8480 | 2 |
GPU | NVIDIA H100 80GB HBM3 | 4 |
GPU to GPU Network | Infinoband NDR 400Gbps |
8 Port |
GPU to WekaFS | Infinoband NDR 200Gbps | 2 |
Memory | 64 GB DDR5 4800 RDIMM | 2TB |
- 服務簡介 1.系統架構 2.登入與檔案傳輸節點 - 登入方式 1.登入節點 2.檔案資料傳輸 - Lmod 使用 1.基本說明及常用指令
Apr 14, 2025您可透過 「Singularity」 包裝您所需的套件與程式,建立在 晶創主機 (命令列介面) 服務中,執行運算工作的環境。 操作範例1 : 在晶創主機中已有建立好的singularity映像檔案。 1.映像檔.sif路徑 系統上已打包好一個.sif映像檔在此路徑上,無須安裝。 [user@cbi-lgn01 ]$ /work/hpc_sys/sifs/pytorch_22.09-py3_horovod.sif Nvidia 官方網站 : 提供的範例是Nvidia官方所release的版本(22.09) 2.Horovod 的 benchmark script
Apr 14, 2025目前可用的Job 佇列如下表: 佇列名稱 每個計劃最多可用GPU總數 每個Job最大執行時間 每個計畫同一時間 最多可執行job的數量
Apr 7, 2025使用者需使用核可的主機帳號、密碼與一次性密碼 (OTP) 登入系統,請確認您在開始遠端連線至晶創主機前,完成下列設定: :::success 至iService 會員網站,申請會員帳號並加入計畫。 於iService 會員網站註冊主機帳號密碼與OTP載具。 透過手機使用 IDExpert 手機 APP( APP OTP 或 Push ) 進行登入節點雙因子(2FA) 驗證作業 IDExpert下載說明。 ::: :::danger :warning:重要:請勿於登入節點上執行計算工作,系統超過負載將影響其他使用者於登入節點執行指令。為避免影響到其他使用者的權益,系統管理員會依照事情嚴的嚴重程度,砍掉job或是鎖帳戶。請使用者注意,避免影響您的權益。
Apr 1, 2025