國立中興大學教學大綱
課程名稱 (中) 大數據分析與應用(3006)
(Eng.) Analysis and Application of Big Data
開課單位 資管系
課程類別 選修 學分 3 授課教師 蔡孟勳
選課單位 資管系 / 學士班 授課使用語言 中文 英文/EMI 開課學期 1141
課程簡述 本課程將利用 Problem Based Learning (PBL) 的教學風格,培養學生掌握大數據(big data)處理中最重要的技術:知識發現(knowledge discovery in databases, KDD)。我們每週都會有知識與實作的教學,引導同學們透過 Python 將習得的知識應用到真實世界的資料,進而真正掌握自主發現新知識,解決真實世界問題的能力。

P.S.
✨ 請在第一次上課前,透過課程平台入口,申請好學校的 smail,以便後續課程教學平台操作,如第一堂課程未能前往教室,請務必事前寄信通知課程 TA。
✨ 本課程為非同步遠距課程,一般來說不需要到校上課,然而請注意,第一週和期中考週是「實體課程」,請記得到教室!
✨ 課程難度設計上,同學每週約需花 4 小時完成課程任務。若基礎較差的話,可利用比較輕鬆的前三週課程來練習課程提供的「基本功補充教材」。
✨ 外系欲加選同學請注意,因加選同學眾多,請先聯絡TA,勿直接寄信給老師:
✨ TA 聯絡 Email:wsh28503@smail.nchu.edu.tw
先修課程名稱
課程含自主學習 Y
課程與核心能力關聯配比(%) 課程目標之教學方法與評量方法
課程目標 核心能力 配比(%) 教學方法 評量方法
本課程將利用 PBL 課程設計,配合 Google Classroom 線上學習平台,藉此統整學習資源,並提供海量補充資料,提供學子學習,在輔以線上提出問題模式,讓問題不侷限於課程現場解決。在首堂課程即宣達學子需配合SDGs 17 項永續指標,尋找議題資料並提供解決方案,藉此提供有效、精準方案,且達到現實問題解決。課程中將鼓勵學子參與國內外競賽,如教育部 AI CUP 人工智慧競賽、AI Junior Award 2024 : AI For Green 及Kaggle 數據分析競賽,屆時將依照競賽題目與時程給予學生參賽項目的選擇建議。透過競賽學以致用,並熟捻其所學與公共議題之連結,培養學子在基本與進階的大數據技術應用,以及軟體工具和專案實作,提升自主學習動機。
1.專業知識與應用
2.獨立分析
3.創意
40
30
30
網路/遠距教學
習作
討論
講授
專題探討/製作
測驗
實作
作業
口頭報告
出席狀況
授課內容(單元名稱與內容、習作/每週授課、考試進度-共16週加自主學習)
週次 授課內容
第1週 Course Overview
第2週 Data Mining / KDD
第3週 Statistics / Business Value
第4週 Data Exploration and Visual Analysis
第5週 Data Preprocessing 1
第6週 Data Preprocessing 2
第7週 Decision Tree
第8週 Midterm report ( 5 minutes )
第9週 Ensemble Learning & Bayes
第10週 ANN for Classification
第11週 Association Rule
第12週 Cluster
第13週 Midterm Exam
第14週 Final Report_1
第15週 Final Report_2
第16週 Final Report_3 Self-learning Self-learning
自主學習
內容

學習評量方式
1.課堂練習: 30%
2.期中考試: 30%
3.期末報告: 40%
教科書&參考書目(書名、作者、書局、代理商、說明)
1. Data Mining : Practical Machine Learning Tools and Techniques, Ian H. , Eibe Frank , Mark Hall , Christopher Pal
2. Big-Data Analytics: for Cloud, IoT and Cognitive Computing, Kai Hwang, Min Chen, WILEY
3. R資料採礦與數據分析,何宗武,碁峯圖書
4. R 語言資料分析活用範例詳解,方匡南,朱建平,姜葉飛,碁峰圖書
5. Python大數據特訓班:資料自動化收集、整理、分析、儲存與應用實戰,文淵閣工作室編著,碁峰圖書
6. Python機器學習,Sebastian Raschka著,劉立民,吳建華譯,博碩文化
7. 機器學習:使用Python進行預測分析的基本技術 Machine Learning in Python: Essential Techniques for Predictive Analysis,Michael Bowles,碁峰圖書
8. Python機器學習(第三版)-上, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化
9. Python機器學習(第三版)-下, Sebastian Raschka、Vahid Mirjalili, ISBN: 9789864345182, 博碩文化
10. 統計學與Excel資料分析之實習應用〈第七版〉[培養大數據分析力一定要會的統計分析與資料處理工具], 王文中、錢才瑋, ISBN: 9789864348497 ,博碩文化
11. 統計學 (第11版), Gerald Keller, ISBN: 9789579282369 ,新加坡商聖智學習亞洲私人有限公司台灣分公司
12. 機器學習入門:使用Scikit-Learn與TensorFlow, 黃健庭, ISBN: 9786263240285, 碁峰資訊
13. Python Data Science Bible資料科學自學聖經, 文淵閣工作室, ISBN: 9786263241657, 碁峰資訊
14. Python 機器學習超進化:AI影像辨識跨界應用實戰, 文淵閣工作室, ISBN: 9789865026196, 碁峰資訊
課程教材(教師個人網址請列在本校內之網址)
第一堂課程將會公告GC(Google Classroom)金鑰,屆時請同學加入。
課程輔導時間
加入GC後,可透過信件或平台與助教聯繫預約時段。
聯合國全球永續發展目標(連結網址)
01.消除貧窮   02.消除飢餓   03.健康與福祉   04.教育品質   05.性別平等   06.淨水與衛生   07.可負擔能源   08.就業與經濟成長   09.工業、創新基礎建設   10.減少不平等   11.永續城市   12.責任消費與生產   13.氣候行動   14.海洋生態   15.陸地生態   16.和平與正義制度   17.全球夥伴提供體驗課程:N
請尊重智慧財產權及性別平等意識,不得非法影印他人著作。
更新日期 西元年/月/日:無 列印日期 西元年/月/日:2025 / 7 / 05
MyTB教科書訂購平台:http://www.mytb.com.tw/