國立中興大學教學大綱
課程名稱 (中) 資料探勘概論(2160)
(Eng.) Introduction to Data Mining
開課單位 資管系
課程類別 必修 學分 3 授課教師 蔡孟勳
選課單位 資管系 / 學士班 授課使用語言 中文 英文/EMI 開課學期 1122
課程簡述 資料探勘(Data mining),是資料庫知識發現(knowledge-discovery in databases , KDD)中的一個重要步驟,是指運用特定的演算法從大量的資料庫,以可接受的計算頻率內中去萃取有意義,具有潛在價值的資訊、規則或是pattern進而做出正確的決策的一個步驟。本課程內容介紹數種具有代表性的演算法,幫助學生了解如何運用資料分析技術與統計方法,尋找資料的關聯性、擷取隱藏的資訊規則與進行預測。

【注意】 請在第一次上課前,透過課程平台入口,申請好學校的 smail。且第一堂課務必實體抵達課堂,以便後續課程教學平台操作,如第一堂課程未能前往教室,請務必事前寄信通知課程 TA。
先修課程名稱
課程含自主學習 N
課程與核心能力關聯配比(%) 課程目標之教學方法與評量方法
課程目標 核心能力 配比(%) 教學方法 評量方法
基本與進階之資料探勘技術介紹、應用實例以及軟體工具的使用和專案實作
Basic and advanced introduction to data mining techniques, applications, software usage and implementation
1.專業知識與應用
2.獨立分析
3.創意
4.英語
30
30
20
20
授課內容(單元名稱與內容、習作/每週授課、考試進度-共18週)
週次 授課內容
第1週 1. Introduction

第2週 2. Introduction to Data mining & Knowledge discovery

第3週 3. Data warehouse & OLAP technique
第4週 4. Use of Kaggle and UCI network database & Metaverse

第5週 5. Data Preprocessing 1-Data Cleaning & Data integration

第6週 6. Data Preprocessing 2-Data Transformation & Feature selection

第7週 7. Classfication: Decision Tree (C4.5,CART),Random Forest, Chaid Bayes 1

第8週 8. Classfication: Decision Tree (C4.5,CART),Random Forest, Chaid Bayes 2

第9週 9. pre-final report

第10週 10. Associations: Apriori , FP-growth


第11週 11. Clustering: K-Means, Hierarchical Cluster

第12週 12. Midterm Exam


第13週 13. Self-Learning(report example demonstration)

第14週 14. Final report presentation

第15週 15. Final report presentation

第16週 16. Final report presentation

第17週 17. 6/10 holiday


第18週 18. Final report presentation

學習評量方式
1.課堂練習 20%

2.期中考 30%

3.期末報告 40%

4.出席率 10%
教科書&參考書目(書名、作者、書局、代理商、說明)
主要必備書目:
1.Fundamentals of Machine Learning for Data Analytics(Algorithms,Worked Examples,And Case Studies),Second Edition,著.John D.Kelleher,Brian Mac Namee,Aoife D’Arcy

2.Introduction to Data Mining (GE),著.Pang-Ning Tan,Michael Steinbach,Anuj Karpatne,Vipin Kumar


參考書目:
1.資料挖礦與大數據分析, 簡禎富, 許嘉裕, ISBN:978-9865774257, 前程文化事業有限公司

2.王者歸來:WEKA機器學習與大數據聖經,2015,袁梅宇,佳魁資訊出版

3.Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems) 3rd Edition, Jiawei Han, Micheline Kamber, Jian Pei, ISBN:978-9380931913, Morgan Kaufmann

4.資料探勘,Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著,施雅月,賴錦慧 譯, ISBN:978-9861546575, 臺灣培生教育出版股份有限公司

5. Data Mining : Practical Machine Learning Tools and Techniques, Ian H. , Eibe Frank , Mark Hall ,
Christopher Pal

6. R資料採礦與數據分析,何宗武,碁峯圖書

7. R 語⾔資料分析活⽤範例詳解,⽅匡南,朱建平,姜葉⾶,碁峰圖書

8. Python⼤數據特訓班:資料⾃動化收集、整理、分析、儲存與應⽤實戰,文淵閣⼯作室編著,碁峰
圖書

9. Python機器學習,Sebastian Raschka著,劉立⺠,吳建華譯,博碩文化

10. 機器學習:使⽤Python進⾏預測分析的基本技術 Machine Learning in Python: Essential Techniques
for Predictive Analysis,Michael Bowles,碁峰圖書

11. Python機器學習(第三版)-上, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化

12. Python機器學習(第三版)-下, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化

13. 統計學與Excel資料分析之實習應用〈第七版〉[培養大數據分析力一定要會的統計分析與資料處理工具], 王文中、錢才瑋, ISBN: 9789864348497 ,博碩文化

14. 統計學 (第11版), Gerald Keller, ISBN: 9789579282369 ,新加坡商聖智學習亞洲私人有限公司台灣分公司

15. 機器學習入門:使用Scikit-Learn與TensorFlow, 黃健庭, ISBN: 9786263240285, 碁峰資訊

16. Python Data Science Bible資料科學自學聖經, 文淵閣工作室, ISBN: 9786263241657, 碁峰資訊

17. Python 機器學習超進化:AI影像辨識跨界應用實戰, 文淵閣工作室, ISBN: 9789865026196, 碁峰資訊
課程教材(教師個人網址請列在本校內之網址)
http://mht.mis.nchu.edu.tw/moodle/
課程輔導時間
請與課程 TA 預定課程輔導時間。
聯合國全球永續發展目標
提供體驗課程:N
請尊重智慧財產權及性別平等意識,不得非法影印他人著作。
更新日期 西元年/月/日:2024/01/26 18:35:25 列印日期 西元年/月/日:2024 / 11 / 21
MyTB教科書訂購平台:http://www.mytb.com.tw/