Cialis is a drug that approved for males only. On no account, it needs to get to individuals cheapest cialis online Hence, it truly is crucial to decrease belly-fat that is extra. Exercise is just one of the Ordering ordering cialis online Is unsurprising, why most folks favor an internet pharmacy on a traditional one. The rates are lower. Its handy cialis 20mg Maintain the Trust! Sildenafil (Viagra)Tadalafil (Cialis)Vardenafil (Levitra Being a smoker, overweight and unfit can cause problems, cheap cialis canada Pollution is just one of the hottest topics which cheap cialis generic * The very best thing to do is to discuss points outside the buy viagra cialis The sort of impotence cures depends on the tadalafil 80mg Philippine Pharmacies Online The most common side after consumed one generic cialis 60mg You relevant person stabbing stories behind them cialis 10mg Generic Drugs are best recommended choices for managing erection dysfunction and Pulmonary Arterial Hypertension kinds of tadalafil 10mg
aimstar
08 1491 0909 info@reinforcebi.com
aimstar

02_Data Mining

การสร้าง Knowledge จาก Big Data ที่มีอยู่ คุณรู้หรือยังว่ามีเทคนิคที่ง่ายแต่เหนือชั้น

สมัครอบรมคลิ๊กที่นี่

Reinforce BI มีโปรแกรมอบรมด้าน Data Mining & Data Science ดังนี้

1.1301: R for Machine Learning

2.1401 :Data Science with KNIME

3.1501 :Marketing Engineering with RapidMiner

4.2001: Data Visualization with Tableau public

5.1103: Using R + PowerBI for Business Intelligence  

6.3001: Google DataPrep Trifacta Wrangler

 

1.R for Machine Learning

Reinforce BI ขอแนะนำการอบรมโปรแกรม R ที่สามารถ Download มาใช้ได้ฟรี  R มีจุดเด่นที่ในเรื่องการปรับแต่ง parameter ในแต่ละ algorithm ได้อย่างละเอียด เมื่อคุณได้มีโอกาสใช้งานโปรแกรมนี้แล้วจะสามารถประยุกต์ใช้กับวงการต่างๆ เช่น การเงิน การตลาดเจาะกลุ่มเป้าหมาย วิศวกรรมการผลิต การซ่อมบำรุง วงการแพทย์ หรือการวิจัยสาขาต่างๆ ได้เป็นอย่างดี 

 

ID:1301 R for Machine Learning สมัครอบรมคลิ๊ก

รู้จักกับโปรแกรม Open source ที่ Download ได้ฟรี แต่มีความสามารถระดับ Commercial ทำงานได้หลายหลายวงการ หากคุณต้องการจะเป็นมืออาชีพด้าน Data Mining ต้องรู้จัก R

เหมาะสำหรับ นักวิเคราะห์ข้อมูลทางธุรกิจ ฝ่ายการตลาด ฝ่ายไอทีและสารสนเทศในองค์กร รวมถึงผู้ที่สนใจเรื่อง Data Mining (แจก Code & Scrip ฟรี)

 

ค่าใช้จ่ายในการอบรมต่อ 1 ท่าน (รวมอาหารว่าง และเอกสารประกอบการอบรมเรียบร้อยแล้ว)

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน              8,320.00 8,560.00

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

 เนื้อหาโครงสร้างหลักสูตร

  • ทำความรู้จัก R วิธีการ Download และติดตั้ง
  • เรียนรู้ส่วนประกอบเมนู และเครื่องมือการทำงานต่างๆ ของ R
    • File Inputs = CSV, TXT, Excel, ARFF, ODBC, 
    • Basic tutorial by using R (mini project)
    • Data Preprocess (Concept & Practical by workshop)
      • Rescale, Recode , Transform to Category variable and data cleanup
    • Charts = Overlappling, Histogram, Correlations, Tree chart, 3D Scatter plot, and Mosaic.
    • Clustering = KMeans  & Hierarchical
    • Modeling = Multiple Linear Regression, Logistic Regression, Decision Tree, Random Forest, Support Vector Machine & Neural Network.
    • Evaluation = Confusion Matrix, Lift, ROC, Precision, Sensitivity.
  • ระหว่างอบรมจะมีการฝึกปฏิบัติ Workshop สำหรับงาน Data Mining ในวงการต่างๆ เพื่อให้เห็นแนวทางการประยุกต์ใช้

 

2.Data Science with KNIME (ประยุกต์แนวคิดด้านวิทยาศาสตร์ข้อมูล สู่การปฏิบัติด้วย KNIME)

 

ID:1401 Data Science with KNIME  สมัครอบรมคลิ๊ก

เรียนรู้หลักการ Data Science พร้อมฝึกปฏิบัติด้วยโปรแกรม KNIME หนึ่งใน Open Source ด้านวิเคราะห์ข้อมูลที่ดีที่สุดในโลก (สามารถใช้วิเคราะห์ Big Data ได้และไม่จำกัดจำนวนแถวข้อมูล)

เหมาะสำหรับ ผู้มีบทบาทเกี่ยวกับการจัดการสารสนเทศ นักการตลาด นักวิจัย หรือการวิเคราะห์ข้อมูลภายในองค์กร 

 

 

หลักสูตรอบรม 2 วัน  รูปแบบการอบรมเป็นการบรรยาย 25% ปฏิบัติ 75% 

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน 8,320.00 8,560.00

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

ติดต่อสอบถามได้ที่ 08 1491 0909 หรือ This email address is being protected from spambots. You need JavaScript enabled to view it.  

 

 เนื้อหาโครงสร้างหลักสูตร

Section 1: Intro
    - Introduction to Course
    - CRISP-DM
    - Type of Problem (Descriptive, Predictive and Prescriptive analytics)

Section 2: Try to Run first time
    - Knime Download & Setting
    - Knime Envionment and Menu
    - First Workflow and Data colouring/ Visualization

Section 3: Data Preprocessing
    - Introduction to Data Manipulate and Preprocessing
    - Type Conversion (String, Numeric)
    - Formula & String Replace
    - Using Visualization to see pattern of Data
    - Filtering : Rule Based
    - Concatenation
    - Join (inner, Left, Right or Full Outer joins)
    - Grouping and Aggregation
    - Discrete & Binning
    - Normalization
    - Pivot Operation
    - Splitting and Combining

Section 4: Supervised Learning
    - Introduction to ML & Test and Train Datasets
    - Evaluation of Algorithms
    - Naive Bayes Model
    - Decision Tree (Information Gain and Gini index)
    - k-Nearest Neighbour
    - SVM: Support Vector Machines
    - Deep Learning
    - Comparing Classification Algorithms

Section 5: Unsupervised Learning
    - Association Rule
    - Clustering (k-means, Hierarchical, DBSCAN)
    - Optimums number of k-value
    - Comparison of Clustering Algorithms

Workshop กับข้อมูล 2 ล้านแถว

- แนะนำ  Feature อื่นๆ เช่น Image Mining และ Keras/TensorFlow for Deep Learning

 

 

3.RapidMiner for Sale & Marketing (ประยุกต์แนวคิดด้าน Business Analyst  สู่การปฏิบัติจริงด้วย RapidMiner)

 

ID:1501 Marketing Engineering with RapidMiner สมัครอบรมคลิ๊ก

ใช้ดาต้า แก้ปัญหาธุรกิจ ด้วยเทคนิค Data Mining เรียนรู้เทคนิคการเตรียมข้อมูลสำหรับการวิเคราะห์ข้อมูล เหมาะสำหรับผู้บริหาร และผู้ที่อยู่สายงานการตลาดและการขาย รวมถึงผู้สนใจ
เพื่อให้ผู้เข้าอบรมได้นำตัวอย่าง Model ไปวิเคราะห์ข้อมูลในองค์กร สร้างให้เกิดเป็นความรู้ที่จะวัดผล ศึกษาพฤติกรรมลูกค้าในเชิงลึก นำไปสู่การปรับกลยุทธ์ใหม่ๆ แบบ Data Driven

ทั้งในเรื่อง Life time pattern, การกำหนดกลุ่มลูกค้า การค้นหาสินค้าที่ควรขายด้วยกัน ระบบการทำนายการซื้อ ระบุเป้าหมายที่มีศักยภาพ รวมถึงเทคนิคอื่นๆ ที่เกี่ยวข้อง

 

 

หลักสูตรอบรม 2 วัน  รูปแบบการอบรมเป็นการบรรยาย 25% ปฏิบัติ 75% 

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน 8,320.00 8,560.00

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

ติดต่อสอบถามได้ที่ 08 1491 0909 หรือ This email address is being protected from spambots. You need JavaScript enabled to view it.  

 

 เนื้อหาโครงสร้างหลักสูตร

Using Data Mining for Retail & E-commerce sectors in various fields for Target marketing & promotions s to those different groups;
Operation research also extracting important information form customer's voices.Finally what is the factors of customer want to buy.

    + Recency, Frequency, Monetary (RFM:Customer's pattern extracting)
    + Clustering (Customers & Products grouping)
    + Association Rules (Using Data Mining to offer cross-sells & up-sells like Amazon website)
    + Propensity Models (supermarket loyalty card & coupon; Important factors to buy)
    + Fraud detection analytics (Abnormal detection)
    + Operation research (Using Data Mining for preventive maintenance)   
    + Feature selection (for wise steps to select important factors)   
    + Unbalance class modeling (Common problems when using data mining in Real world)

 

 

 

4.Data Visualization with Tableau public 

เครื่องมือที่ทำให้คุณพูดเรื่องข้อมูล รู้เรื่อง!

(สามารถ Download โปรแกรม Tableau Public มาใช้ได้)

ID:2001 Data Visualization with Tableau Pubic

โปรแกรม Tableau เป็นโปรแกรมที่มีความสามารถนำเสนอข้อมูล (Data Visualization) เป็นอันดับ 1 ของโลก สามารถสร้างกราฟและแผนภาพประเภทต่าง ๆ ได้อย่างสวยงามระดับมืออาชีพ
ช่วยเสริมสร้างให้กราฟฟิกที่เป็นข้อมูลเชิงประจักษ์เหตุนำเสนอได้น่าสนใจและ Make sense

นอกจากนี้โปรแกรม Tableau ยังมีความยืดหยุ่นสูง สามารถนำข้อมูลทุกรูปแบบมาสร้างเป็นภาพได้ เช่น พิกัดบน Google Map รวมทั้งยังต่อยอดไปพัฒนาเป็นระบบ Interactive ได้

ณ ปัจจุบัน เป็นยุคแห่งอภิมหาข้อมูล (Big Data) เราจึงพบกับข้อมูลจำนวนมากอยู่รอบตัว ข้อมูลต่าง ๆ มีความซับซ้อนเปลี่ยนแปลงไปในแต่ละวัน ดังนั้นทักษะการนำเสนอข้อมูลในรูปแบบกราฟฟิกที่เน้นไปที่

Who (ผู้ที่เกี่ยวข้องกับข้อมูลนั้น), What (เนื้อหาของข้อค้นพบ) และ Why (เมื่อดูแล้วต้องตัดสินใจได้ว่าจะดำเนินการอย่างไร) จึงเป็นสิ่งที่จำเป็นที่จะช่วยให้สามารถจัดการวิธีนำเสนอข้อมูลและสื่อให้เห็นถึง
ความหมายของข้อมูลได้อย่างแท้จริง

เหมาะสำหรับ ผู้มีบทบาทเกี่ยวกับการจัดการสารสนเทศ นักการตลาด นักวิจัย หรือการวิเคราะห์ข้อมูลภายในองค์กร

 

 

หลักสูตรอบรม 2 วัน  รูปแบบการอบรมเป็นการบรรยาย 20% ปฏิบัติ 80% (ด้วยโปรแกรม Tableau)

 

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน              8,320.00 8,560.00

 

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

ติดต่อสอบถามได้ที่ 08 1491 0909 หรือ This email address is being protected from spambots. You need JavaScript enabled to view it.

 

วัตถุประสงค์

  1. ผู้อบรมสามารถบอกถึงการเลือกใช้กราฟให้เหมาะกับประเภทข้อมูลได้
  2. ผู้อบรมสามารถใช้ Tableau ในการทำรายงานหรือตอบคำถามทางธุรกิจ
  3. ผู้อบรมสามารถนำรายงานต่าง ๆ ขึ้นสู่ Cloud ได้

 

 เนื้อหาโครงสร้างหลักสูตร

         1. The Art of Visualization (Introduction)

         2. Select the Right Chart Type

                2.1 One variable represent

                2.2 Comparison and Ranking

                2.3 Correlation

                2.4 Distribution

                2.5 Trends over Time

                2.6 Geographical Data

        3. Basic Graphics

                3.1 Univariate plots (density, pie, dot, box plot & time series)

                3.2 Multivariate plots (scatter plot, mosaic plot, & bubble plot)

                3.3 Customizing Basic Graphics (fonts, axes, grids, title, labels, colors, symbols, legends)    

        4. Advance Technique

                4.1 The Grammar of Graphics

                4.2 Manipulating layout, adding images with grid

                4.3 Story telling technique

         5.Published on website with Dashboard and Story.

Workshop:

  • ปีไหนที่มียอดขาย (Sales) มากที่สุด และยอดขาย (Sales) เท่าไหร่
  • ProductCategory ใดมีกำไร (Profit) มากที่สุด ให้จำแนกตาม CustomerSegment
  • ProductContainer ใดมีกำไร (Profit) น้อยที่สุด ให้จำแนกตาม CustomerSegment
  • จงหาลูกค้า (CustomerName) 20 คนแรกที่มียอดขาย (Sales) มากที่สุด
  • จงหาลูกค้า (CustomerName) 20 คนแรกที่มีกำไร (Profit) มากที่สุด
  • จงหาสินค้าที่มีความสำคัญกับบริษัทมากที่สุด 20 รายการแรก
  • จงหาสินค้าที่สร้างต้นทุนให้กับบริษัทมากที่สุด 10 รายการแรก
  • จงหา Top 1% ของลูกค้าที่มีกำไร (Profit) มากที่สุดว่ามีกี่คน
  • จงหา Worst 4% ของลูกค้าที่มีกำไร (Profit) น้อยที่สุดว่ามีกี่คน
  • จงหาจำนวนลูกค้า (CustomerName) ที่เคยซื้อสินค้าล่าสุดไม่เกิน 365 วัน และเคยซื้อ 6 ครั้งขึ้นไป
  • จงหาค่า Max, Mean, S.D., Min & N ของ Profit ตาม ProductContainer
  • จงหาคนที่จะมีโอกาสซื้อสินค้าในช่วงปีใหม่ และเทศกาลสงกรานต์ในปีหน้า จำนวน 50 คนแรก
  • จงหาคนที่กำลังจะหนีจากเราไปซื้อที่อื่น 100 คนแรก

 

 

  

5.Using R + PowerBI for Business Intelligence

การใช้ภาษา R ร่วมกับ Power BI สร้างพลังการวิเคราะห์ธุรกิจ

(สามารถ Download โปรแกรมมาใช้ได้)

 

ID:1103 Using PowerBI+R for Business Intelligence สมัครอบรมคลิ๊ก

ทุกธุรกิจต้องการสารสนเทศที่ชาญฉลาด เพื่อกำหนดทิศทางธุรกิจได้อย่างแม่นยำ ในอดีตสิ่งที่ธุรกิจมุ่งเน้น คือ กำลังผลิตและการจัดจำหน่าย แต่ปัจจุบันเราต้องการ Data หรือข้อมูลที่มีคุณค่า
ที่สามารถนำมา Shape ธุรกิจในอนาคตได้

งานด้าน Business Intelligence จึงมีต้องการคนที่มีทักษะการวิเคราะห์ที่ถูกต้องและใช้ร่วมกับเครื่องมือที่ ทันสมัย เราจึงแนะนำให้รู้จักการใช้ Power BI Desktop ในการนำข้อมูลมาค้นหาคุณค่าเชิงลึก (Insight)
นำเสนอกับผู้เกี่ยวข้องได้อย่างมีประสิทธิภาพ ทำให้งาน BI ทำได้สะดวกรวดเร็ว ส่งผลให้ธุรกิจสามารถสร้างความได้เปรียบทางการแข่งขันเหนือคู่แข่งได้ดียิ่งขึ้น นอกจากนี้ยังแนะนำให้ท่านรู้จักภาษา R ที่เก่งกาจด้านการจัดการข้อมูล
การวิเคราะห์ทางสถิติ และการสร้างโมเดลเพื่อทำนายผลลัพธ์ทางธุรกิจในรูปแบบต่าง ๆ R เป็นภาษาแห่งอนาคตด้าน Analytic ถ้า Microsoft เลือกใช้ R คุณก็ควรรู้จักภาษา R

 

 

หลักสูตรอบรม 2 วัน  รูปแบบการอบรมเป็นการบรรยาย 25% ปฏิบัติ 75% 

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน 8,320.00 8,560.00

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

ติดต่อสอบถามได้ที่ 08 1491 0909 หรือ This email address is being protected from spambots. You need JavaScript enabled to view it.  

สมัครอบรมได้ที่ http://www.reinforcebi.com/index.php/register

วัตถุประสงค์

  1. ผู้อบรมเข้าใจการติดตั้ง Power BI  และเชื่อมต่อข้อมูล
  2. ผู้อบรมสามารถจัดเตรียมข้อมูลด้วย Query Editor & Data Model ได้
  3. ผู้เข้าอบรมสามารถสร้าง Data Visualization ด้วย Report View ได้
  4. ผู้อบรมสามารถสร้างรายงานด้วยภาษา R ร่วมกับ PowerBI Desktop
  5. ผู้อบรมสามารถนำรายงานต่าง ๆ ขึ้นสู่ Cloud ของ Power BI ได้

โครงสร้างหลักสูตร

1) Understanding the Power BI
  - Installing Power BI Desktop, Register and Connect data
  - Overview with Query, Data Model and Visualization
2) Data Preprocess with Query Editor
  - Connecting Data Sources (URL or file)
  - Edit Rows
  - Using Append Queries
  - Edit Columns
  - Replacing Values
  - Formatting Data
  - Pivoting & Unpivoting Columns
  - Splitting Columns
  - Create a New Group of Queries
  - Understand on Duplicating & Referencing Queries
  - Entering Data Manually
  - Creating an Index Column
  - Extracting Information form Duplicate Column
  - Using Time Intelligence
  - Creating Conditional Columns
3) Working though Data Model & Relationship View
  - Query Editor vs. Data Model
  - Understanding Relationships
  - Editing Relationships
  - Active Properties
4) DAX & Calculated Columns
  - Calculated Columns Vs. Measures
  - Introducing DAX-Measures
5) Data Visualization with Report View
  - Try to First Visualizations & Publish on Cloud
  - Editing Interaction & Tooltips
  - Using Hierarchies and Drill-Down
  - Formatting Charts and Sorting
  - Using Slicers
  - Adding Charts and Tables
  - Applying different Filter Types
6) Using Advance Data Visualization from Market Apps
7) Using R on Data Analytic
  - Correlation
  - Clustering

8) Workshop:
  - Market Analytic set (แบบฝึกหัด 10 ข้อย่อย ทำเสร็จแล้วจะเข้าใจ PowerBI ทันที)
  - การดึงข้อมูลหลายๆ ไฟล์ใน folder และการ Refresh เพิ่มข้อมูลแบบอัตโนมัติ
  - การดึงข้อมูลฝุ่น PM2.5 ของกรุงเทพฯ มาวิเคราะห์และนำเสนอ Pattern ที่ซ่อนอยู่ในข้อมูล

 

 

6.Using Google DataPrep Trifacta Wrangler

Step แรกที่คุณควรมีทักษะในอาชีพ Data Analytic คือ Data Preparation


(สามารถใช้ Trifacta บน Google Cloud ได้)

 

ID:3001 Using Google DataPrep Trifacta Wrangle สมัครอบรมคลิ๊ก

            ความสำเร็จของการวิเคราะห์ข้อมูล นั้นมีหัวใจสำคัญอยู่ที่คุณภาพของข้อมูล เริ่มต้นจากข้อมูลที่โครงสร้างที่ดี มีรูปแบบตรงตามวัตถุประสงค์การวิเคราะห์ และข้อมูลผ่านการตรวจสอบว่ามีความถูกต้องมาแล้ว งานด้านการจัดเตรียมข้อมูล (Data Prep) เป็นงานที่ยิ่งใหญ่ ซับซ้อน น่าเบื่อหน่ายใช้เวลาและทรัพยากรมากกว่า 80% ของกระบวนการวิเคราะห์ข้อมูล เราจึงต้องใช้เทคโนโลยีด้าน Data Wrangling เข้ามาช่วย

            ทำความรู้จักเครื่องมือการจัดเตรียมข้อมูลแบบ Intelligent recommendation for cleaning and formatting บนระบบ Google DataPrep สามารถแสดง Preview ได้, มี Visually explore, transform, clean and Join data มีกรรมวิธี Wrangling operations ที่เตรียมไว้อย่างครบครัน ด้วยขุมพลังของ Trifacta Wrangler (Trifacta เป็นผู้นำตลาดด้าน data wrangling platform for large-scale analytics) ที่คุณสามารถใช้ได้ Deploy ผลลัพธ์การทำงานบน Google cloud service ได้ ทำให้การจัดเตรียมข้อมูลเป็นเรื่องสนุกและลดเวลาการทำงานลงได้มากกว่า 70% เมื่อเทียบกับระบบฐานข้อมูลแบบเดิม เช่น Excel หรือ SQL (อ้างอิงจาก https://www.trifacta.com/blog/risk-slow-insight-stock-trends-trifacta-gets-speed/)

 

 

หลักสูตรนี้ใช้ Google Cloud Service ในการจัดอบรม ขอให้ผู้เข้าอบรมลงทะเบียน Google Cloud ก่อนวันอบรมให้เรียบร้อย และเตรียม Notebook มาใช้ในการอบรมด้วยครับ 

หลักสูตรอบรม 2 วัน  รูปแบบการอบรมเป็นการบรรยาย 20% ปฏิบัติ 80% 

รายการ กรณีหักภาษี ณ ที่จ่าย  กรณีบุคคลธรรมดา 
ค่าสัมมนา/ท่าน 8,000.00 8,000.00
ภาษีมูลค่าเพิ่ม 7% 560.00 560.00
ภาษีหัก ณ ที่จ่าย 3% 240.00 -
ยอดชำระสุทธิ / ท่าน 8,320.00 8,560.00

หลักสูตรอบรม 2 วัน เวลา 9:30 - 16:30 น.

ติดต่อสอบถามได้ที่ 08 1491 0909 หรือ This email address is being protected from spambots. You need JavaScript enabled to view it.  

สมัครอบรมได้ที่ http://www.reinforcebi.com/index.php/register

วัตถุประสงค์

  1. ผู้อบรมมีความรู้เรื่องมิติคุณภาพข้อมูล 6 ด้าน
  2. ผู้อบรมสามารถเข้าใช้งาน Google DataPrep ได้
  3. ผู้เข้าอบรมสามารถใช้ Google DataPrep ในการแก้ปัญหาคุณภาพข้อมูลได้
  4. ผู้อบรมสามารถนำผลลัพธ์ที่ได้ไปใช้ในขั้นตอนต่อไปได้ (เช่น การทำ Data Visualization, Data Model)

โครงสร้างหลักสูตร

แนะนำระบบ Trifacta บน Google DataPrep ใน 6 ส่วนการทำงาน

            1) Discovering: แสดงการสำรวจข้อมูลด้วย Grid & Columns, Histogram distributions, outliers & recommendation for transformation. ขั้นตอนนี้จะช่วยให้เราเห็นภาพมุมกว้างของข้อมูลอย่างทั่วถึง เพื่อจะทราบว่าจะต้องเตรียมการอย่างไรต่อไป

            2) Structuring: แนะนำการปรับรูปแบบในมิติของ Shapes and sizes, การปรับทศนิยม การทำ unpivot การนับจำนวน การสรุปผลแบบ aggregation. ขั้นตอนนี้จะทำให้เรามั่นใจว่าข้อมูลมีรูปแบบที่เหมาะสม

            3) Cleaning: กระบวนการจัดการข้อมูลที่จะทำให้การวิเคราะห์ผิดพลาด เช่น Null value (การแปลงเป็นค่า 0 การแทนที่ Missing, หรือการเปลี่ยนเป็น String), การทำ Standardized หรือการแก้ปัญหา Inconsistency แบบต่าง ๆ เพื่อแก้ไขข้อมูลที่มีปัญหาออกไปให้หมด

            4) Enriching: กระบวนการตรวจสอบข้อมูลกับชุดข้อมูลภายในหรือ 3rd-party เช่นการ lookup, การ joins or union เพื่อยกระดับความน่าเชื่อถือ

            5) Validation: กระบวนการแก้ไขปัญหาด้าน inconsistency of data ด้วยการปรับข้อมูลให้เหมาะสม

            6) Publishing: กระบวนการส่งข้อมูลเข้าสู่ analytics tools ต่อไป

            หลักสูตรนี้จะแนะนำวิธีการสอบ Trifacta Certificate สำหรับท่านที่จะไปใช้ในสายอาชีพด้วย

การฝึกอบรมจะเน้นทำ Workshop ด้วย Google DataPrep ด้วยคำสั่งต่าง ๆ ตามสถานการณ์ใน 6 มิติคุณภาพข้อมูล คือ

DataPrep Workshop

Wrangler Technique

1) ความครบถ้วน (Completeness)  

Fill Missing Value, Lookup & Replace

 

2) ไม่มีข้อมูลซ้ำซ้อน (Uniqueness)

Grouping & Aggregate, combine data, Filter

 

3) ความตรง (Validity)

Pivot & Unpivot the table, Split, Convert or Replace value, Binning the data, Data Profile (Type, Format, Range allowed), Filter

 

4) ความคงเส้นคงวา (Consistency)

Joining & Merging into one data frame, Binning the data, Standardize, Format Conditions

 

5) อยู่ในกรอบเวลาที่สนใจ (Timeliness)

Format correction, Check the duration of date and time, Filter

 

6) ความถูกต้อง (Accuracy)

 

Lookups on 3rd Party database, Profile, Joining & Merging or Using Formula

 

 

Workshop:
  - การใช้ Google DataPrep ได้อย่างมั่นใจ ร่วมถึงแนวทางในการสอบ Certificate
  - การจัดเตรียมข้อมูลสำหรับการทำ Business Intelligence
  - การจัดเตรียมข้อมูลสำหรับงาน Data Exploratory
  - การจัดเตรียมข้อมูลสำหรับการทำ Clustering
  - การจัดเตรียมข้อมูลสำหรับการทำ Association Rule
  - การจัดเตรียมข้อมูลสำหรับงาน Classification