國立中興大學教學大綱
課程名稱 (中) 巨量資料分析(5108)
(Eng.) Big Data Analysis
開課單位 統計所
課程類別 選修 學分 3 授課教師 陳律閎
選課單位 應數系 / 學士班 授課使用語言 中文 開課學期 1142
課程簡述 本學期以主題式課程方式進行:
隨著全球氣候監測網絡(如 ERA5, GFS)產生的數據量以幾何級數增長,傳統基於靜態矩陣分解的降維技術在面對即時、連續變化的流式數據(Streaming Data)時,面臨著巨大的記憶體與計算開銷挑戰。同時,經典的神經網路架構在處理球體表面(如地球)的物理場時,往往會忽略極點附近的幾何畸變,導致預測準確度下降。

本課程專為具備扎實數學基礎的研究生設計,旨在探討 Streaming Multivariate Functional Principal Component Analysis (SMFPCA) 與 Spherical Fourier Neural Operator (SFNO) 的理論耦合。SMFPCA 提供了一個強大的數學框架,將多變量氣象特徵視為希爾伯特空間(Hilbert Space)中的連續函數,並透過在線更新機制(Incremental Updates)捕捉非平穩過程中的特徵演化。隨後,這些降維後的關鍵特徵將饋送至 SFNO,利用其在頻域內捕捉全局相關性的能力,實現物理一致性(Physics-consistent)的預測。

我們將課程目標設定在「學術與實戰」的平衡點:學生需掌握從變分推導到分佈式串流架構(Bytewax/Polars)的整合,並能針對單台 GPU 進行顯存優化,最終產出符合國際會議(如 PAKDD, ACML)標準的學術論文。
先修課程名稱
課程與核心能力關聯配比(%) 課程目標之教學方法與評量方法
課程目標 核心能力 配比(%) 教學方法 評量方法
1. 如何利用AI協助學習、研究與撰寫論文
2. 介紹大數據分析與串流資料分析工具
3. 論文撰寫技巧
3.統計分析專業知識
4.計算科學專業知識
5.資訊科學專業知識
7.數學及統計軟體能力
25
25
25
25
網路/遠距教學
專題探討/製作
習作
討論
講授
作品
測驗
書面報告
口頭報告
作業
授課內容(單元名稱與內容、習作/每週授課、考試進度-共16週加自主學習)
週次 授課內容
第1週 Introduction
第2週 Out-of-memory weather and climate data processing (NetCDF and Xarray)
第3週 Functional data basics
第4週 Principal component analysis (PCA)
第5週 Functional PCA
第6週 Streaming PCA
第7週 Streaming multivariate FPCA
第8週 Fourier neural operator (FNO) and spherical FNO
第9週 Integration: Streaming MFPCA and SFNO
第10週 How to write a research article
第11週 GPU memory optimization: mixed precision training
第12週 GPU memory optimization: gradient checkpointing
第13週 GPU memory optimization: ZeRO-offload
第14週 SFNO with physical constraints
第15週 FPCA for spatial-temporal data
第16週 期末報告
自主學習
內容
   01.參與專業論壇、講座、企業分享等產官學研相關交流活動
   03.製作專題報告
   04.產官學機構參訪與實務體驗

學習評量方式
作業: 30%
期中報告: 10%
期末報告: 60%
教科書&參考書目(書名、作者、書局、代理商、說明)
課程教材(教師個人網址請列在本校內之網址)
iLearning
課程輔導時間
TBA
聯合國全球永續發展目標(連結網址)
提供體驗課程:N
請尊重智慧財產權及性別平等意識,不得非法影印他人著作。
更新日期 西元年/月/日:2026/02/04 16:30:44 列印日期 西元年/月/日:2026 / 5 / 06
MyTB教科書訂購平台:http://www.mytb.com.tw/