統計學專業教學在大資料時代的改革探討論文
隨著網際網路的發展及各領域數字化的提高,大資料時代已經到來,這對傳統的統計資料收集、處理與分析方法帶來巨大的衝擊,給統計學專業的教學帶來了挑戰。為了適應大資料時代的變革,統計學專業的教學需要在課程設計、實踐教學以及畢業生就業導向上進行改革。
2011年2月,國務院學位委員會進行了學科調整,統計學完全從數學和經濟學中獨立出來,上升為一級學科,設在理學門類中,編號為0714。統計學上升為一級學科後,下設的二級學科包括數理統計學、社會經濟統計學、生物衛生統計學、金融統計、風險管理和精算學、應用統計學。統計學上升為一級學科對統計學專業的教學帶來巨大影響。
同時,隨著大資料時代的到來,使得傳統的統計資料收集、處理與分析方法面臨新的挑戰,從而推動統計學的發展進入了一個全新的階段。在統計學上升為一級學科以及大資料時代已經到來的大背景下,統計學專業的課程教學也面臨著新的挑戰,需要進一步改革與調整。
一、大資料時代的到來
(一)大資料的生成
伴隨著人類對客觀世界各領域數字化程度的不斷提高,每天都有大量的資料產生,並且其產生的速度也越來越快。這些資料來源廣泛,其中最主要的來源有:科學研究(如天文學、生物學、高能物理等實驗資料)、社交網路、電子商務、物聯網、行動通訊等。
(二)大資料的定義
為了應對資料大規模增長帶來的機遇和挑戰,美國《Nature》雜誌在2008年9月4日率先提出了“大資料”的概念。國際資料中心IDC 是研究大資料及其影響的先驅,在2011年的報告中定義了大資料:“大資料技術描述了一個技術和體系的新時代, 被設計於從大規模多樣化的資料中透過高速捕獲、發現和分析技術提取資料的價值”。但是大資料是一個新興而且內涵不斷髮展的概念,尚沒有統一公認的定義,只能從其特點上加以認識。
(三)大資料的特點
與傳統資料相比,大資料的特徵可以用五個“V”來表示,即Volume(容量大)、Variety(種類多)、Velocity(時效性強)、Value(價值高)、Visualization(視覺化呈現)。大資料容量大是個相對的概念,受時間、行業和資料型別等因素的影響;種類多是指資料集的結構異質性,科技進步導致了結構化、半結構、非結構化資料的日益增多;時效性強是指大資料被生成、處理、移動的速度相當快,是區別於傳統資料最顯著的特徵,這也增加了對即時分析、加工資料的需求;價值高是指大資料潛在的高價值能為評價和決策提供依據。視覺化是大資料分析的關鍵步驟,是對有價值資訊加以提煉並顯示的過程。
(四)大資料的應用
大資料具有5Vs(Volume、Velocity、Variety、Value、Veracity)特點,蘊含著巨大的社會價值、經濟價值和科研價值,已引起了產業界、學術界、政府部門和其他組織的'高度關注和重視。
近年來,世界發達國家相繼佈局大資料戰略,諸如聯合國“資料脈動”計劃、美國大資料戰略、英國“資料權”運動,大力推動大資料發展和應用。大資料已納入我國國家發展戰略,國務院2015年8月31日印發了《促進大資料發展行動綱要》的通知(國發[2015]50號),指出:“大資料成為推動經濟轉型發展的新動力,大資料成為重塑國家競爭優勢的新機遇,大資料成為提升政府治理能力的新途徑。以資料流引領技術流、物質流、資金流、人才流,將深刻影響社會分工協作的組織模式,促進生產組織方式的集約和創新。探索發揮大資料對變革教育方式、促進教育公平、提升教育質量的支撐作用”
二、大資料給傳統統計學帶來的衝擊
(一)資料收集方法上
不同於傳統的調查抽樣方法獲取資料,大資料的收集來源渠道通常為現代網路渠道,如網際網路、物聯網等。不同的資料來源的資料採集需要專用資料採集技術, 如包含格式文字、影象和影片的網站資料,通常需要web爬蟲技術。
(二)資料儲存上
大資料的儲存不同於傳統的資料儲存方式,有固定的格式和結構,對於大資料的資料庫來說,可以直接將所探測到的訊號自動容納到其中;大資料需要有先進的儲存裝置,傳統的儲存裝置已經不能容納如此大量的資料。
(三)資料分析上
傳統的統計分析方法,難以勝任對非結構化的大資料的分析。當前大資料分析技術的研究可以分為6個重要方向:結構化資料分析、文字資料分析、多媒體資料分析、web資料分析、網路資料分析和移動資料分析。
(四)資料展示上
資料視覺化的目標是以圖形方式清晰有效地展示資料的資訊。一般來說,圖表和地圖可以幫助人們快速理解資訊。但是,當資料量增大到大資料的級別,傳統的電子表格等技術已無法處理海量資料。大資料的視覺化展示需要專業的軟體來完成。
三、大資料時代統計學專業教學改革
大資料時代的到來對統計學也帶來了新的機遇和挑戰,特別是大資料對於資料分析人才產生了巨大需求,同時也要求統計專業學生掌握更為複雜統計軟體的程式設計和操作。大資料背景下,統計學要適應新的形勢,需要對課程教學進行有針對性的改革。
(一)大資料時代統計學專業畢業生就業方向定位
大資料時代的到來,使各行各業,包括政府、企業、個人都希望能從大資料這座金礦中挖掘出對自己有價值的金子,從而增加了對統計專業畢業生的需求。一直以來,我國統計工作領域主要是政府統計、部門統計、民間統計。傳統意義上,政府及各個部門是統計學學生就業的首選。然而,隨著大資料時代的來臨,越來越多的畢業生選擇發展空間更為廣闊的民間統計。民間統計相對於政府統計來說,涉及範圍十分廣泛,包括各類統計諮詢公司、統計調查公司、統計研究院等,介於市場和企業、行業之間。民間統計的發展前景十分廣闊,可以預見,隨著大資料時代的來臨,統計學作用的提高,民間統計必會成為統計專業畢業生選擇就業的主要渠道之一。
(二)大資料時代統計學專業課程設定改革
大資料時代,在對統計資料分析人才需求增加的同時,也對統計專業畢業生的大資料處理能力提出了更高的要求,這就需要統計學專業在課程設定上,增加大資料處理與分析方法課程,如《大資料分析方法》、《資料探勘》等,培養學生能夠使用專業統計軟體(R/SAS/Python)進行大資料的挖掘、清洗、分析等。
(三)大資料時代統計學專業學生實踐能力培養改革
在課堂教學之外,透過廣泛舉辦大資料技術創新大賽、大資料技術創新與創業大賽、資料探勘挑戰賽,支援學生成立大資料研究協會,舉辦大資料相關講座論壇等方式,增強學生分析和處理大資料的能力。另外,還要加強校外大資料實踐教學基地建設,透過與通訊、網際網路、電子商務等企業大資料開發中心以及大資料研究諮詢機構合作,為學生提供給更多的實習、實踐機會。
四、總結
總之,面對大資料時代的到來,統計學專業需要積極改革與調整課程的設定,注重學生實踐能力的培養,以適應各行各業對大資料分析與挖掘人才的需求。