--- title: refinery-README tags: DAS GA: UA-155999456-1 --- {%hackmd @docsharedstyle/default %} # 3. 專案資源-Data Refinery 章節最後更新時間: 2020-08-27 ## 章節目錄 本章節參考 IBM 官方手冊的 Refining data 章節。 以其中的 [Tutorial: Shape raw data](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/dr_tutorial.html) 文檔為基礎,使用資料 [airline-data.csv file (1.5 MB)](https://cos.twcc.ai/cp4d/das4_0/refinery/data/airline-data.csv) 演示下列功能: - [3.1 資料導入](https://man.twcc.ai/@dasdocs/Ch3-section1) - [3.2 畫面簡介](https://man.twcc.ai/@dasdocs/Ch3-section2) - [3.3 資料驗證與觀察](https://man.twcc.ai/@dasdocs/Ch3-section3) - [3.4 資料操作](https://man.twcc.ai/@dasdocs/Ch3-section4) - [3.5 儲存與排程](https://man.twcc.ai/@dasdocs/Ch3-section5) > 在官方手冊上,Data Refinery 被翻譯為精簡資料,而其餘的專有名詞也有相應的翻譯,但考量到文件使用場域、對象及溝通上的便利性,本文的教學內容會盡量以翻譯的名詞為主,但在括弧內會加註英文名詞。 --- ## 關於 Data Refinery 的其他參考連結 以下皆來自 IBM 官方手冊的 Refining data 章節,為上述各步驟的細節與補充說明。 - [introduction - refining data](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/refining_data.html) 簡介 Data Refinery 的功能,包括使用環境的必要條件、資料導入、預覽、驗證、視覺化,以及數據處理。 - [Adding data to Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/asset_browser.html) 資料導入 Data Refinery 的方法。 - [Specifying the format of your data in Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/data_format.html) 指定導入的數據格式。 - [Validating your data in Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/metrics.html) 透過資料驗證(Profile),觀察部分資料分布與摘要。 - [Visualizing your data in Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/visualizations.html) 資料視覺化。 - [Managing Data Refinery flows](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/data_flows.html) 管理 data refinery flow,包括儲存、設定排程、複製、移除等功能說明。 - [Copying data from source to target](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/moving.html) 利用 data refinery flow 寫入、更新資料庫。 - [GUI operations in Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/gui_operations.html) 簡介 data refinery flow 數據處理的 GUI 功能。 - [dplyr R library support in Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/code_operations.html) 介紹 data refinery flow 的互動式程式碼範本。 - [Supported data sources for Data Refinery](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/refinery-datasources.html?audience=wdp) 介紹 data refinery 在連結下所支持的所有數據源。 - [Data Refinery 指導教學:整理原始資料 - IBM Cloud Pak for Data](https://dataplatform.cloud.ibm.com/docs/content/wsj/refinery/dr_tutorial.html) 利用 data refinery flow 對實際案例進行操作。 --- ## 數據來源與欄位說明 - [Airlines Delay | Kaggle](https://www.kaggle.com/giovamata/airlinedelaycauses) - [The data. Data expo 09. ASA Statistics Computing and Graphics](http://stat-computing.org/dataexpo/2009/the-data.html) --- ## END