國立中興大學教學大綱
課程名稱 (中) 大數據分析與應用(3006)
(Eng.) Analysis and Application of Big Data
開課單位 資管系
課程類別 選修 學分 3 授課教師 蔡孟勳
選課單位 資管系 / 學士班 授課使用語言 中文 英文/EMI 開課學期 1121
課程簡述 本課程將利用 Problem Based Learning (PBL) 的教學風格,培養學生掌握大數據(big data)處理中最重要的技術:知識發現(knowledge discovery in databases, KDD)。我們每週都會有知識與實作的教學,引導同學們透過 Python 將習得的知識應用到真實世界的資料,進而真正掌握自主發現新知識,解決真實世界問題的能力。

P.S.
✨ 請同學於選課後參考 ilearning3.0 完成 google classroom 課程登入。
✨ 本課程為非同步遠距課程,一般來說不需要到校上課,然而請注意,第一週(因颱風停課關係改為第二週)和期中考週是「實體課程」,請記得到教室!
✨ 課程難度設計上,同學每週約需花 4 小時完成課程任務。若基礎較差的話,可利用比較輕鬆的前三週課程來練習課程提供的「基本功補充教材」。
✨ 欲加簽的外系同學請留意,建議修課者需具備基本的程式能力,以確保能夠順利完成期末報告。由於第一週受颱風影響停班停課,加簽時間改為9/7(四)上午11點,在社管大樓sc680進行,課堂人數上限為50人,額滿即停止加簽。若有其他疑問,請先聯絡TA,勿直接寄信給老師:
聯絡Email:g111029016@smail.nchu.edu.tw
先修課程名稱
課程含自主學習 Y
課程與核心能力關聯配比(%) 課程目標之教學方法與評量方法
課程目標 核心能力 配比(%) 教學方法 評量方法
1.掌握KDD的精神。
2.學會使用python去實踐KDD。
3.利用PBL培養學生主動利用專業解決真實世界的問題之能力。
4.培養出足以滿足學界與業界的大數據人才。
1.專業知識與應用
2.獨立分析
3.創意
40
30
30
網路/遠距教學
習作
討論
講授
專題探討/製作
測驗
實作
作業
口頭報告
出席狀況
授課內容(單元名稱與內容、習作/每週授課、考試進度-共18週)
週次 授課內容
第1週 加退選週
第2週 Data Science Intro
Python basics, Colab Basics, Pandas, Pyplot
第3週 Statistics Basics
chi square, covariance, correlation, anova, T-test
第4週 Data Preprocessing A
data loading, normalization library utilization
第5週 Data Preprocessing B
imputation, label encoding
第6週 國慶連假(9/23補課 Self-learning: Report Preparation)
第7週 期末報告提案(期中預報)
第8週 Data Preprocessing C
Data Visualize, Discretize, Partition, PCA, Feature Selection
第9週 Decision Tree
info gain, gain ratio, gini index
第10週 Random Forest & Bayes
conditional probability
第11週 ANN for Classification
back propagation
第12週 Association Rule
association rules, support, confidence, lift
第13週 Cluster
k-means, Euclidean distance, Manhattan distance, Weighted Euclidean distance
第14週 Self-learning: Midterm Exam & Final Report Preparation

第15週 期中考
第16週 期末報告_1
第17週 期末報告_2
第18週 期末報告_3
學習評量方式
1.課堂練習: 30%
2.期中考試: 30%
3.期末報告: 40%
教科書&參考書目(書名、作者、書局、代理商、說明)
1. Data Mining : Practical Machine Learning Tools and Techniques, Ian H. , Eibe Frank , Mark Hall , Christopher Pal
2. Big-Data Analytics: for Cloud, IoT and Cognitive Computing, Kai Hwang, Min Chen, WILEY
3. R資料採礦與數據分析,何宗武,碁峯圖書
4. R 語言資料分析活用範例詳解,方匡南,朱建平,姜葉飛,碁峰圖書
5. Python大數據特訓班:資料自動化收集、整理、分析、儲存與應用實戰,文淵閣工作室編著,碁峰圖書
6. Python機器學習,Sebastian Raschka著,劉立民,吳建華譯,博碩文化
7. 機器學習:使用Python進行預測分析的基本技術 Machine Learning in Python: Essential Techniques for Predictive Analysis,Michael Bowles,碁峰圖書
8. Python機器學習(第三版)-上, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化
9. Python機器學習(第三版)-下, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化
10. 統計學與Excel資料分析之實習應用〈第七版〉[培養大數據分析力一定要會的統計分析與資料處理工具], 王文中、錢才瑋, ISBN: 9789864348497 ,博碩文化
11. 統計學 (第11版), Gerald Keller, ISBN: 9789579282369 ,新加坡商聖智學習亞洲私人有限公司台灣分公司
12. 機器學習入門:使用Scikit-Learn與TensorFlow, 黃健庭, ISBN: 9786263240285, 碁峰資訊
13. Python Data Science Bible資料科學自學聖經, 文淵閣工作室, ISBN: 9786263241657, 碁峰資訊
14. Python 機器學習超進化:AI影像辨識跨界應用實戰, 文淵閣工作室, ISBN: 9789865026196, 碁峰資訊
課程教材(教師個人網址請列在本校內之網址)
第一堂課程將會公告GC(Google Classroom)金鑰,屆時請同學加入。
課程輔導時間
加入GC後,可透過信件或平台與助教聯繫預約時段。
聯合國全球永續發展目標
01.消除貧窮   02.消除飢餓   03.健康與福祉   04.教育品質   05.性別平等   06.淨水與衛生   07.可負擔能源   08.就業與經濟成長   09.工業、創新基礎建設   10.減少不平等   11.永續城市   12.責任消費與生產   13.氣候行動   14.海洋生態   15.陸地生態   16.和平與正義制度   17.全球夥伴提供體驗課程:N
請尊重智慧財產權及性別平等意識,不得非法影印他人著作。
更新日期 西元年/月/日:2023/09/04 00:16:40 列印日期 西元年/月/日:2024 / 5 / 19
MyTB教科書訂購平台:http://www.mytb.com.tw/