週次 |
授課內容 |
第1週 |
Introduction |
第2週 |
Review of basics: dplyr vs Pandas |
第3週 |
Review of basics: caret vs scikit-learn |
第4週 |
Bigmemory vs Modin |
第5週 |
Introduction to database: dbplyr vs Ibis |
第6週 |
Distributed dataframe: sparklyr vs Koalas |
第7週 |
Big data visualization |
第8週 |
Distributed computing by Apache Spark: PySpark vs sparklyr |
第9週 |
Linear regression for big data |
第10週 |
Linear regression for big data |
第11週 |
Model selection instead of inferencing |
第12週 |
Generalized linear models |
第13週 |
Dimension reduction |
第14週 |
Missing data imputation |
第15週 |
Robust methods |
第16週 |
Nonparametric regression |
第17週 |
Nonparametric regression |
第18週 |
Term project presentation |