###### tags: `Taiwania 3` `test` `twnia3` `HPC` <!-- # 台灣杉三號(Taiwania 3) 測試期說明 --> # 台灣杉三號(Taiwania 3) 使用說明 ## 零、公告 <font size=3 color="#f00"> ## 110/06/18 台灣杉三號(Taiwania III)計算主機開放上線服務通知 </font> 台灣杉三號將於110年6月21日起正式開放上線服務,不限產官學研,各行各業工作者對電腦運算資源有需求者,均可提出申請使用。 <font size=3 color="#f00"> <!-- **Beta 測試將於 6/19 08:00 AM 結束,同時將停止現有服務,中止所有工作,並禁止登入,直至06/21 08:00 AM。後續若要繼續使用,請您與在本中心的窗口聯繫申請計畫啟用Taiwania 3,我們會協助您在 iService 計畫中設定台灣杉三號。6/19後將會清空用戶在GOV109199的錢包,請用戶以您自己的計畫Submit Job。** --> **請注意!!! 若您在測試期間有申請擴充磁碟Quota,請於8/31前將檔案搬回,我們會於 9/1 開始清理檔案,並將您的Quota還原為100GB。但若您有繼續使用檔案的需求,請參閱 [磁碟配額設定方式](https://man.twcc.ai/q7ulSyVnTc2tjlswlLm2Gg),將HFS使用的計畫,改為您自己的計畫(計費方式請參閱[iService 計價說明](https://man.twcc.ai/@twccdocs/SJWlN3YDr?type=view#%E9%AB%98%E9%80%9F%E6%AA%94%E6%A1%88%E7%B3%BB%E7%B5%B1-Hyper-File-System-HFS))。** </font> 申請主機使用方法 1. 目前已有iService計畫且該計畫在有效期限者,請聯繫iService帳號申請服務信箱(iservice@narlabs.org.tw),告知您的計畫名稱以及代號,由我們代為啟用。 2. 已有iService帳號但還未擁有iService計畫者或是計畫過期者,請至iService( https://iservice.nchc.org.tw/nchc_service/index.php )申請計畫,並於申請服務時勾選台灣杉三號,待計畫審核完成後,會立即通知您。 3. 尚未申請iService 帳號者請先申請帳號後,再申請計畫。 收費標準 110年6月21日起迄110年8月31日止,於此期間,僅記錄用戶在台灣杉三號的資源用量,暫不收費。自110年9月1日起,將依科技部核定之費率收費。 台灣杉三號初期(110年6月21日至110年8月31日)使用注意事項 * 用戶雖無額度使用上限,但用戶工作(Job)仍須依照系統排程規則排隊。 * 不適用服務層級協議(SLA)當中之抵免額相關條款。 * 用戶不得於本中心提供之服務中涉及比特幣等虛擬貨幣、武器研發、網路攻擊或其他非法行為等與科研計算無關之運用,若是違反此項,本中心將依狀況中止或取消您的使用權。 * 計畫核可後須遵守NCHC iService相關使用規定,依標準程序操作,必要時須配合簽署相關書面聲明。 聯絡方式: 歡迎各界申請使用,使用上若有任何問題或有其他特殊申請需求與合作 iService帳號申請服務 Email:iservice@narlabs.org.tw 技術支援服務 Email:isupport@narlabs.org.tw 免付費客服專線 0809-091-365 服務期間:因應防疫分流上班措施,若因人員忙碌未能接聽您的來電,請來信至 isupport@narlabs.org.tw,留下您的姓名、電話並敘述您的問題,我們會在24小時內回覆您。 <!-- 2. HFS額度,由於目前用戶如果有HFS空間的需求,都是使用GOV109199為計畫來申請,如果已經停止使用,需請用戶自行搬移所需的檔案回去,我們將於8/31後將Quoda還原。如果用戶會繼續使用,須至iService 中,將使用HFS的計畫,改為用戶自己的計畫,並開始計算費用。 --> </font> <!-- --- 06/04 本系統預計於6/7(一) 14:00 ~ 15:00 進行 ldap 改接(第二次),預估時間 1 HR,請各位用戶,改接期間勿嘗試登入,本作業完成後,系統將直接開放。 造成您的不便,還請見諒 --- 05/26 台灣杉三號的使用環境設定,採用 Lmod 管理,目前登入後的 MODULEPATH 預設為 **<code>/opt/ohpc/Taiwania3/modulefiles</code>** 與 **<code>/opt/qct/ohpc/pub/modulefiles</code>** **<code>/opt/qct/ohpc/pub/modulefiles</code>** 為系統建置廠商測試時所設立,其 modulefile 設定與目前的檔案系統架構有些許差異,且因其 module 命名方式不易顯示相依性關係、架構扁平單一, Lmod 無法做相依性管理,在少數情況下可能會造成環境設定錯誤。 因此我們將於 **6/1** 把 MODULEPATH 的預設變數中移除 **<code>/opt/qct/ohpc/pub/modulefiles</code>** ,若您有使用 **<code>/opt/qct/ohpc/pub/modulefiles</code>** 中的 module file ,請告知我們您使用的 module 名稱,我們將視實際需求作適當的改寫並納入 **<code>/opt/ohpc/Taiwania3/modulefiles</code>** 中。 --> <!-- --- 05/21 親愛的用戶您好,若您目前無法使用密碼登入 T3,請至iService 變更主機帳號密碼,變更密碼後1~2min,使用新密碼登入。如果還是有登入失敗的問題,請通知我們。造成您的不便還請見諒。 --- --> ## 03/23 10:00 系統已開放使用 <font size=3 color="#f00"> 03/23 10:00 系統已修復並開放使用,造成不便,還請見諒</font> ## 03/22 緊急停機 03/22 11:00 系統發生 GPFS 檔案系統障礙,用戶無法執行任何程式,系統需要緊急修復,因此將停止服務。預估修復時間未定,待修復完成後立即開放,造成您的不便請見諒。 謝謝 ### Beta Test 進程 04/01 09:00 開放全系統全測試用戶使用 ### 台灣杉三號驗證測試報告同意書 [下載同意書](https://drive.narlabs.org.tw/navigate/s/EC6F5F68291F442AA9F30ED618CAD625GUY) [空白驗證測試報告](https://drive.narlabs.org.tw/navigate/s/6E330517B72F4BD7B4EB248EB6892B5DGUY) [驗證測試報告範本](https://drive.narlabs.org.tw/navigate/s/AA3FA45CE6454183ADC1C9A45ABFC43DGUY) ### 注意事項 <font size=3 color="#f00">請注意, 1.各 Test 階段不保證資料能留至下一階段以及正式運轉階段,請用戶自行備份重要資料。 2.所有用戶都需要有iService帳號,才能登入使用,若是您之前並未申請iService機帳號,請至[iService網站](https://iservice.nchc.org.tw/nchc_service/index.php?lang_type=)申請。 3.檔案空間配額(Qouta)修改,請參閱 [台灣杉三號測試期間,磁碟配額設定方式](https://man.twcc.ai/q7ulSyVnTc2tjlswlLm2Gg), 4.請優先使用位於 */opt/ohpc/Taiwania3/modulefiles* ~~以及 */opt/qct/ohpc/pub/modulefiles*~~ 下的module。 5.Submit Job 時,Job Script 中的 acconnt 請使用GOV109199,若Submit Job有問題,請聯繫[我們](mailto:gavin@narlabs.org.tw)。 例如 `#SBATCH --account=GOV109199` </font> <!-- ### Alpha Test 進程 <font color="#f00">03/17更新 </font>========================================== 更新各期間資源及queuing policy <font color="#f00">03/16更新 </font>========================================== Phase 5:<font color="#f00">2021-03-21</font>至 2021-03-31 開放所有測試用戶,開放所有核心 02/15 ========================================= Phase 4:2021-02-15 至 2021-03-15 用戶分組進行全系統執行單一(大型)計算工作測試,限制可以用全機求解單一job的七位用戶試 Run,開放所有核心(獨占試跑) |測試團隊| 開始時間 | 結束時間 | |------|------|------| |許晃雄老師團隊 | 02/15 AM 01:00 | 02/17 PM 11:59 | |尤禎祥老師團隊 | 02/18 AM 01:00 | 02/20 PM 11:59 | |林明楷老師團隊 | 02/21 AM 01:00 | 02/23 PM 11:59 | |羅敏輝老師團隊 | 02/24 AM 01:00 | 02/28 PM 11:59 | |陳仕宏老師團隊 | 03/01 AM 01:00 | 03/06 PM 11:59 | |羅友杰老師團隊 | 03/07 AM 01:00 | 03/09 PM 11:59 | |曾于恒老師團隊 | 03/10 AM 01:00 | 03/15 PM 11:59 | 02/04========================================== 台灣杉三號測試期間,磁碟配額設定方式,請參閱[這邊](https://man.twcc.ai/@twnia3/S1OitBIgO) 01/29========================================== Alpha Test Phase 2 時段安排如下,時間有限,請各團隊把握時間 |測試團隊| 開始時間 | 結束時間 | |------|------|------| |清大 江老師團隊| 02/01 AM 10:00 | 02/02 PM 11:59 | |交大 陳老師團隊| 02/03 AM 01:00 | 02/04 PM 11:59 | |交大 朱老師團隊| 02/05 AM 01:00 | 02/06 PM 11:59 | |彰師大 周老師團隊| 02/07 AM 01:00| 02/08 PM 11:59| |交大 周老師團隊| 02/09 AM 01:00 | 02/10 PM 11:59| 因GPFS還有問題待處理,於 Phase 2時先開放 720 計算節點 (40,320 Cores),其餘節點待問題解決後,再行開放(暫定於 phase 3時開放)。 ============================================= --> ## 一、[簡介] <!-- <font color="salmon">(Done)</font>==(https://man.twcc.ai/lRoe8PboTUGL0U79VxPAHg/) --> <!-- ### 台灣杉系統示意圖 ![台灣杉系統示意圖](https://i.imgur.com/dlApAo1.png) 台灣杉三號全系統共計 50,848 個計算核心(Cores)、與台灣杉二號共用平行檔案系統總容量約為 9.4PB,搭配InfiniBand HDR100 100Gbps高速網路,整體效能可達2.7千兆次浮點運算(PFLOPS)。 =========================== ==嵌入[可用計算資源](https://man.twcc.ai/g6EAXhVjSNGLpHLcxbQweA)== =========================== --> ### 硬體架構 台灣杉三號共有900部CPU計算節點、12部GPU計算節點以及4部第大記憶體節點,硬體規格如下 #### CPU計算節點 * 2顆 Intel® Xeon® Platinum 8280 2.7GHz CPU (28 Cores/CPU) * 192GB 主記憶體 <!-- #### ==GPU計算節點 <font color="salmon">(Done)</font>== * 2顆 Intel® Xeon® Platinum 8280 2.7GHz CPU (28 Cores/CPU) * 192GB 主記憶體 * 8張 Nvidia V100 SXM2 32GB GPU 卡 --> #### 大記憶體計算節點 * 4顆 Intel® Xeon® Platinum 8280L 2.7GHz CPU (28 Cores/CPU) * 6TB 主記憶體 #### 網路系統 * 每個計算節點具1張 ConnectX-6 VPI adapter card, 100Gb/s(HDR100) 網路卡,同時提供MPI平行計算與平行檔案存取使用 * Leaf Layer 交換器(Mellanox QM8790,40個 HDR埠,每個埠提供 200Gb/s的全雙向頻寬)。每部 Leaf 交換器透過 IB HDR 200Gb/s to 2x100Gb/s 纜線,串接至所有計算節點 ![](https://cos.twcc.ai/SYS-MANUAL/uploads/upload_d82fa36c433412047d7f861fb9f1548b.png) * Spine 交換器(Mellanox QM8790,40個 HDR埠,每個埠提供 200Gb/s的全雙向頻寬)間採Fat -Tree 架構,提供更通暢的網路環境 ![](https://cos.twcc.ai/SYS-MANUAL/uploads/upload_aa4c24de05a75f3fef16b7dc894578cd.png) <!-- ========================== ==嵌入[可用計算資源]== ============================ --> ### 現有軟體列表 <!-- | 類別 | 軟體 | Module| | -------- | ------------------------------------- |----- | | 作業系統 | Centos Linux 7.8 x86_64 | 無 | | 編譯器 | Intel Parallel Studio XE 2020 <br> Nvidia HPC SDK v20.11 (PGI Compilers)| intel/19.1.3.304 <br> nvidia/nvhpc/20.7 | | 排程系統 | Slurm | 無 | --> <table> <tr> <td>類別</td><td>軟體</td><td>Module</td> </tr> <tr> <td>作業系統</td><td>Centos Linux 7.8 x86_64</td><td>None</td> </tr> <tr> <td rowspan=11>編譯器</td><td>AMD Compiler</td> <td>compiler/aocc/2.3.0</td> </tr> <tr> <td rowspan=4>GNU Compiler</td><td>compiler/gcc/4.8.5</td> </tr> <tr> <td>compiler/gcc/7.5.0</td> </tr> <tr> <td>compiler/gcc/8.3.0</td> </tr> <tr> <td>compiler/gcc/10.2.0</td> </tr> <tr> <td rowspan=3>Intel Compiler</td><td>compiler/intel/2020u2</td> </tr> <tr> <td>compiler/intel/2020u4</td> </tr> <tr> <td>compiler/intel/2021</td> </tr> <tr> <td rowspan=2>Nvidia HPC SDK</td><td>compiler/nvhpc/20.11</td> </tr> <tr> <td>compiler/nvhpc/21.5</td> </tr> <tr> <td>PGI Compiler</td><td>compiler/pgi/2018</td> </tr> <tr> <td>排程系統</td><td>Slurm</td><td>None</td> </tr> </table> ### 檔案系統 共用台灣杉二號 GPFS 平行檔案系統 | 目錄 | 容量 |Quota| | ----- | ----- |-----| | /home | 1.8PB |100GB| | /work | 7.6PB |100GB| ### 連線資訊 SSH 登入節點:twnia3.nchc.org.tw port 22 Thinlinc 登入節點:t3-c3.nchc.org.tw port 22 使用者須先至 [NCHC iService](https://iservice.nchc.org.tw/nchc_service/index.php?lang_type=) 取得主機帳號 ## 二、登入方式 [註冊 iService 帳號](https://man.twcc.ai/@TWCC-III-manual/SypVJCWcO) [查詢主機帳號與使用 OTP 載具取得認證碼](https://man.twcc.ai/@TWCC-III-manual/SJwbCxzqO) [登入/登出主機](https://man.twcc.ai/@TWCC-III-manual/Hy4lIKidu) [ThinLinc Login](https://man.twcc.ai/@TWCC-III-manual/rJ2RH77cO) [檔案資料傳輸](https://man.twcc.ai/@TWCC-III-manual/Bk-pE62jd) ## 三、Module使用 [環境操作(Lmod)說明](https://man.twcc.ai/@twnia3/BJxhYk2CD) ## 四、排程系統 [Job Script 建立](https://man.twcc.ai/@TWCC-III-manual/Sy9-QqHiO) [排程系統基本操作 ](https://man.twcc.ai/@twnia3/SJDW5J3Rv) ## 五、常用 MPI 範例 [各Compiler差異對照表](https://man.twcc.ai/@TWCC-III-manual/SkgZUHhi_) [IntelMPI 使用範例](https://man.twcc.ai/@TWCC-III-manual/H1Vyiuos_) [OpenMPI 使用範例](https://man.twcc.ai/@TWCC-III-manual/BJJYo_joO) [Hybrid MPI / OpenMP 使用範例](https://man.twcc.ai/@TWCC-III-manual/BJcHhOjs_) ## 六、系統政策 <!-- 1. Beta Test期間: 2021-4-01 09:00 ~ 2. Beta Test 期間開放範圍如下: * 開放計算節點數:CPU 900節點。 * 開放的partition(Queue)以及政策如下表 --> | Queue 名稱 | 可用 CPU 核心數 | 最長執行時間 (Hours) | 每位用戶最多可 同時執行工作數 | 系統最多可 執行工作數 | |:----------:|:---------------:|:--------------------:|:-----------------------------:|:---------------------:| | serial | 1 | 96 | 10 | 224 | | ctest | 1 ~ 1120 | 0.5 | 2 | 80 | | ct560 | 2~560 | 168 | 4 | 100 | | ct2k | 561~2240 | 72 | 4 | 22 | | ct8k | 2241~8960 | 48 | 1 | 4 | | large | 8961~ | | | | <!-- | ct224 | 2~224 | 168 | 5 | 200 | --> <!-- | ct1k | 561~1120 | 96 | 4 | 20 | --> <!-- | ct4k | 2241~4480 | 48 | 2 | 8 | --> <!-- <font color="#f00">***Beta Test 階段不保證資料能留至正式運轉階段,請用戶自行備份重要資料***</font> --> <!-- 1. Alpha測試期間: Phase 1:2021-01-14 至 2021-01-31 Phase 2:2021-02-01 至 2021-02-10 Phase 3:2021-02-11 至 2021-02-14 Phase 4:2021-02-15 至 2021-03-15 <font color="#f00">系統調整:2021-03-16 至 2021-03-20 </font> Phase 5:<font color="#f00">~~2021-03-16~~ 2021-03-21 </font>至 2021-03-31 2. Phase 1期間系統開放範圍如下: * 開放計算節點數:CPU 64節點、GPU 12節點。 * 開放的partition(Queue)為test。 * 排程系統政策 * 每個用戶每個job的核心數上限是840個(15 nodes) * 每個job最長時間是4小時。 * 每個用戶執行中job數上限3個。 * 每個用戶等待job數限制是3個。 3. Phase 2 全系統小型分散式平行計算工作測試 * 開放計算節點數:CPU 900節點、GPU 12節點。 * 開放的partition(Queue)為Phase_2, gpu。 * 排程系統政策 * 特定用戶專屬時段 5. Phsae 3 開放所有測試用戶使用 * 開放計算節點數:CPU 900節點、GPU 12節點。 * 開放的partition(Queue)為Phase_3, gpu。 * 排程系統政策 * 每人最多可用核心數為10000 * 每個job最長時間是4小時。 * 每個用戶執行中job數上限3個。 * 每個用戶等待job數限制是3個。 6. Phase 4 全系統執行單一(大型)計算工作測試 * 開放計算節點數:CPU 900節點、GPU 12節點。 * 開放的partition(Queue)為Phase_4, gpu。 * 排程系統政策 * 特定用戶專屬時段 8. Phase 5 開放所有測試用戶使用 * 開放計算節點數:CPU 900節點。 * 開放的partition(Queue)為Phase_5。 * 排程系統政策 * 每人最多可用核心數為10000 * 每個job最長時間是12小時。 * 每個用戶執行中job數上限3個。 * 每個用戶等待job數限制是3個。 9. <font color="#f00">***各 Alpha Test 階段不保證資料能留至下一階段以及正式運轉階段,請用戶自行備份重要資料***</font> 10. 各階段實施細節將另行訂定。 --> ## 七、問題與建議 若使用本系統遇到問題或有其他相關的建議,歡迎您隨時與敝中心的客服團隊聯繫,我們今盡快為您處理與回應。 帳號申請服務 Email : iservice@narlabs.org.tw 電話 : 03-5776085 #442 技術支援服務 Email : isupport@narlabs.org.tw 電話 : 03-5776085 #214 免付費客服專線 0809-091-365 服務時間 : 週一至週日 09:00~17:00 ### 附錄、[NCHC HPC系統硬體架構](https://man.twcc.ai/5guhSlpgRBallhC3lZI-kg) ## FAQ