<div style="text-align: right; background-color: #f5f5f5; padding: 4px 12px; border-radius: 5px; display: inline-block; float: right; font-size: 1.4rem;"> Last Updated:2025/07/01 </div> # Slurm 佇列 (Partition) [TOC] <br> 本章說明創進一號目前提供支援的 Slurm 佇列(Partition)環境,不同佇列具備不同的運算資源配置與執行時間限制,建議用戶應依需求選擇適當的佇列執行作業。 ## X86 架構 CPU 計算環境 <div style="text-align: right; color: gray;"> (表格更新日期為 2025/07/01) </div> <table> <tr> <td>佇列名稱</td> <td>可用<br>核心數範圍</td> <td>最長<br>可執行時間 (hour)</td> <td> 每位<br>用戶<br>可同時<br>執行<br>工作數</td> <td> 每位<br>用戶<br>可排隊<br>工作數</td> <td> 計算工作派送節點</td> </tr> <tr> <td>vscode </td> <td>1~112 </td> <td>2 </td> <td>1 </td> <td>1 </td> <td rowspan=4 white-space:pre-wrap class="cell-breakWord"> 限制從<br>Open OnDemand Portal派送,<br>即 stn[01-02] </td> </tr> <tr> <td>jupyter</td> <td > 1~112</td> <td>2 </td> <td>1 </td> <td>1 </td> </tr> <tr> <td>rstudio</td> <td > 1~112</td> <td>2 </td> <td>1 </td> <td>1 </td> </tr> <tr> <td>desktop</td> <td > 1~112</td> <td>2 </td> <td>1 </td> <td>1 </td> </tr> <tr> <td>development</td> <td>1~1120 </td> <td>8 </td> <td>1 </td> <td>1 </td> <td rowspan=7 white-space:pre-wrap class="cell-breakWord"> 限制從登入節點、<br>互動式繪圖節點派送,<br>即 ilgn[01-02] <br>與 intgpn[01-02] </td> </tr> <tr> <td>ct112</td> <td > 1~112 </td> <td> 96 </td> <td> <font color="red">16 </font></td> <td> 32 </td> </tr> <tr> <td>ct448</td> <td >113~448 </td> <td> 96 </td> <td> <font color="red">12</font> </td> <td> 32 </td> </tr> <tr> <td>ct1k</td> <td >449~1120 </td> <td> 64 </font></td> <td> 3 </font></td> <td> 6 </td> </tr> <tr> <td>ct2k</td> <td > 1121~2240 </td> <td> 48 </td> <td> 2 </font></td> <td> 4 </td> </tr> <tr> <td>ct4k</td> <td > 2241~4480</td> <td> 48 </td> <td> 1 </font></td> <td> 2 </td> </tr> <tr> <td>ct8k</td> <td > 4481~8960</td> <td> 48 </td> <td> 1 </td> <td> 1 </td> </tr> <tr> <td>visual-dev</td> <td >1~112 </td> <td> 2 </td> <td> 1 </td> <td> 1 </td> <td rowspan=2 white-space:pre-wrap class="cell-breakWord">限制從<br>互動式繪圖節點派送,即 intgpn[01-02] </td> </tr> <tr> <td>visual</td> <td > 1~448 </td> <td> 48 </td> <td> 1 </td> <td> 1 </td> </tr> </table> <div style="text-align: right; color: gray;"> (表格更新日期為 2025/08/07) </div> <table> <tr> <td>QOS名稱</td> <td>搭配的佇列<br>(Partition/Queue)</td> <td>最長<br>可執行時間 (hour)</td> <td> 優先權</td> <td> 使用方式 </td> </tr> <tr> <td>medium </td> <td>ct2k, ct4k </td> <td>96 </td> <td>2000 </td> <td>申請後使用 </td> </tr> <tr> <td>large </td> <td>ct8k </td> <td>96 </td> <td>1000 </td> <td>申請後使用 </td> </tr> <tr> <td>express </td> <td>ct112 </td> <td>48 </td> <td>10000 </td> <td> </td> </tr> <tr> <td>medium-exp </td> <td>ct2k, ct4k </td> <td>48 </td> <td>100 </td> <td>申請後使用 </td> </tr> <tr> <td>large-exp </td> <td>ct8k </td> <td>48 </td> <td>1 </td> <td>申請後使用 </td> </tr> <tr> <td>long </td> <td>ct112 </td> <td>192 </td> <td>20000 </td> <td> </td> </tr> <tr> <td>medium-long </td> <td>ct2k, ct4k </td> <td>192 </td> <td>100 </td> <td>申請後使用 </td> <tr> <td>large-long </td> <td>ct8k </td> <td>192 </td> <td> </td> <td>每季開放一次 </td> </tr> <tr> <td>large-dev </td> <td>ct8k </td> <td>4 </td> <td> </td> <td>申請後使用 </td> </tr> </table> <br> --- <br> ## ARM 架構 CPU 計算環境 :::danger <i class="fa fa-exclamation-triangle" aria-hidden="true"></i> **注意:** ARM 架構為「先導型測試平台」,屬於非穩定環境,系統管理員會不預期地因應內部主管要求的測試,而微調下表的設定值。 ::: <br> <div style="text-align: right; color: gray;"> (表格更新日期為 2024/09/03) </div> <table> <tr> <td>佇列名稱</td> <td>可用<br>核心數範圍</td> <td>最長<br>可執行時間 (hour)</td> <td> 每位用戶<br>可同時執行<br>工作數</td> <td> 每位用戶<br>可排隊<br>工作數</td> <td> 計算工作派送節點</td> </tr> <tr> <td>arm-dev</td> <td >1~1440 </td> <td> 2 </td> <td> 1 </td> <td> 1 </td> <td rowspan=4 white-space:pre-wrap class="cell-breakWord">限制從<br>登入節點派送,<br>即 nlgn[01-02]</td> </tr> <tr> <td>arm144</td> <td > 1~144 </td> <td> 48 </td> <td> 6 </td> <td> 6 </td> </tr> <tr> <td>arm576</td> <td >145~576 </td> <td> 48 </td> <td> 4 </td> <td> 4 </td> </tr> <tr> <td>arm1440</td> <td > 577~1440 </td> <td> 48 </td> <td> 2 </td> <td> 2 </td> </tr> </table> <br> --- <br> ## 實作範例教學 <font color="blue">**範例 1. 選擇使用** `partition-develpoment` **派送三次 Job 的範例:**</font> ``` [user@ilgn01 ]$ cat example.sh #!/bin/bash ... #SBATCH --partition=development # Partition Name ... [user@ilgn01 ]$ sbatch example.sh Submitted batch job 241784 [user@ilgn01 ]$ sbatch example.sh Submitted batch job 241788 [user@ilgn01 ]$ sbatch example.sh sbatch: error: QOSMaxSubmitJobPerUserLimit sbatch: error: Batch job submission failed: Job violates accounting/QOS policy (job submit limit, user's size and/or time limits) ``` - 當出現 `QOSMaxSubmitJobPerUserLimit` 錯誤時,表示當前用戶**已超過該佇列允許的最大同時作業數**,因此派送不出 Job。 <br> <font color="blue">**範例 2. 可下指令** `squeue` **查看目前 Job 派送任務的狀態:**</font> ``` [user@ilgn01 ]$ squeue -u $user JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 241784 developme test_mpi user R 0:00 24 icpnp[307-330] 241788 developme test_mpi user PD 0:00 24 (QOSMaxJobsPerUserLimit) ``` <br> <font color="blue">**範例 3. 可下指令** `scancel` **取消已派送的任務 或是等待 Job 完成後再派送 Job:**</font> ``` [user@ilgn01 ]$ scancel 241788 ``` <!-- QoS 表格資訊 (TBD) -->