Share on FacebookShare on LinkedIn

輔大統計資訊系從學術到實務全面深耕大數據

看好大數據及相關的工業 4.0、金融 4.0 等主流趨勢,輔仁大學統計資訊系兼顧教學研究及產業合作,成立「巨量資料分析中心」,並採用 Microsoft Azure 公有雲服務解決硬體建置和維運人力的負擔。
</>
輔仁大學統計資訊系主任侯家鼎(圖中)”看準未來統計預測分析工具與資訊技術的結合在各個應用領域的重要性,我們很早就投入大數據,也寄望公有雲服務能為系上在大數據的教學與研究帶來助益。”

看好大數據及相關的工業 4.0、金融 4.0 等主流趨勢,輔仁大學統計資訊系兼顧教學研究及產業合作,發展符合實務需求的大數據應用,而且早在 2015 年下旬就成立「巨量資料分析中心」。

但大數據應用對於運算資源、資料處理環境及分析工具的需求,遠高於傳統的統計及分析應用。為了克服資源有限的挑戰,統計資訊系決定採用 Microsoft Azure,以公有雲服務解決硬體建置和維運人力的問題。

巨量資料分析中心擔負新應用重任

統計資訊學系的前身是統計學系,2001 年正式改名,更為著重在統計預測分析工具和資訊技術的結合,培植專業統計資訊科學人才,強調理論與實務並重、做中學,協助學生瞭解統計資訊的未來發展趨勢。學生畢業後多從事財務金融、資料採礦、統計應用雲端服務、生物資訊、營運人管、行銷CRM、社經統計、品管製程、醫學分析等各種和大數據分析有關之工作。

侯家鼎主任指出,大數據時代是統計、分析、預測和 IT 的整合,光只有資料庫和分析工具是不夠的。因此,統計資訊系不自限於研究,而是更著重於新工具在實務面的應用,像是金融、房地產等。

做為資料採礦(Data Mining)的延伸,統計資訊系早在 2015 年下旬就成立巨量資料分析中心,為系上老師提供教學研究所需的服務及平台。對於需要龐大計算能量的統計分析應用而言,使用公有雲服務的系統延展性比自建更大。

舉辦教育訓練、進行產學合作,亦是巨量資料分析中心的重要使命。統計資訊系與大型企業簽約,協助進行商業智慧、大數據的規劃及實習合作,合作對象包括科技業、零售業、金融業與出版業,重視實務及與產業的結合,正是統計資訊系的特色。

以公有雲克服系統建置及維運挑戰

統計資訊系對電腦的需求主要在資料分析,除了學校原本共用的系統資源,統計資訊系也採購了一台硬體配備足以因應研究分析需求的伺服器搭配虛擬平台運作,專供系上師長與學生依其計畫使用。考慮到目前運算平台的多樣化,以及便於配合學生未來投身業界與課程發展的需要,系上也儘量利用 R 及 Python 等開放原始碼之免費軟體來支援。

但因為資源有限,一旦執行較為複雜的分析可能需用時間來交換,例如:單一分析可能要執行三至五天才能完成。更棘手的是若沒有專門的 IT 人員負責維運系統時,通常是訓練學生或研究生來協助維運工作。雖然相關的管理與維護經驗對於學生都是難得的學習機會,但這些助手必然都有畢業的一天,結果就是可能每年都在重新或反覆訓練新助手,同時可能會造成系統所提供的服務穩定性受到影響。

輔仁大學統計資訊系助理教授兼巨量資料分析中心主持人李鍾斌表示:「我們過去不曾使用過公有雲服務,因而先向資管系諮詢合適方案,再考量未來學生熟悉的工具及微軟的高市占率,最後決定採用 Microsoft Azure。」

對統計資訊系而言,Azure 主要以資料量計費,資源設定完全取決於經費預算,百分之百可自行掌控。同時,人力維運成本大幅降低,只需協助系上的老師們進行公有雲的教育訓練,之後使用就能透過 Web 介面自行設定及操控,無需再由專人協助。

結合多元化技術,拓展大數據的新可能

目前,統計資訊系使用的 Azure 服務元件包括虛擬機器、Web Server 和 SQL Database。李鍾斌說明,考慮專門人力負責 IT 環境之成本較高,未來硬體到達報廢年限之後,計劃可能將往公有雲服務移動。

Azure 豐富的服務元件可提供額外助力,例如:即時串流分析,就是大數據很重要的元件之一。機器學習也是可以嘗試的方向之一,藉此找出比現有工具或一般統計軟體功能更好、效率更佳的應用方式。

值得一提的是,統計資訊系在大數據的教學及研究都相當積極,系上已有多位老師深入研究大數據相關議題如 Hadoop、資料探勘、文字探勘等,並在國際期刊發表數十篇相關論文,系上也開設大數據產業智慧學分學程,研究所也有金融大數據、大數據講座等大數據模組的課程。此外,像是深度學習、機器學習等新興應用,亦已涵蓋在系上老師的研究主題。

雖然統計資訊系是初次使用公有雲服務,但已達成滿足系上課程需求和老師需求的實質成果。侯家鼎主任表示:「 大數據雖然仍在起步階段,但大家都看好它的重要性,不僅大學課程裡已有許多相關的主題規劃,同時也有許多統計學者著手發展大數據的統計方法論。隨著資訊科技的進步,萬物聯網的時代來臨,未來大數據分析會越來越重要。為了符合時代的需要,輔仁大學統計資訊系課程設計涵蓋大數據分析模組,系所專業教育的目的,就在致力於打造學生成為一流的數據科學家。」透過 Azure 提供的公有雲服務,大專院校教育單位就能專注在大數據平台的教學與研究應用,

Share on FacebookShare on LinkedIn