查文庫>論文> 淺談資料探勘技術及其在高等學校教學中的應用教育論文

淺談資料探勘技術及其在高等學校教學中的應用教育論文

淺談資料探勘技術及其在高等學校教學中的應用教育論文

  關鍵詞:資料探勘 高校教學 教育資訊化

  摘要:資料探勘技術目前在商業、金融業等方面都得到了廣泛的應用,而在教育領域應用較少。本文透過時資料探勘在高校教學中的應用分析,認為資料探勘技術可以幫助教學人員合理安排教學工作,協助輔導員對學生的管理,對提高學校的教學管理水平起到指導作用 。

  1引言

  隨著12世紀資訊化時代的到來,整個社會的資訊總量呈幾何級數迅速增長,人們利用資訊科技生產和蒐集資料的能力大幅度提高,積累的資料越來越多,但缺乏挖掘資料中隱藏知識的手段,導致了“資料爆炸但知識貧乏”的現象。隨著資料庫技術的成熟和資料應用的普及,在過去的若干年中,人們積累了大量的資料資料,但資料庫中隱藏豐富的知識及有價值資訊遠遠沒有得到充分地發掘和利用,隨著資料量以指數速度激增,人們渴求從資料汪洋中出現一個去粗存精、去偽存真的技術,越來越希望系統能夠提供更高層次的資料分析功能,從中找出規律和模式,幫助決策者發現數據間重要但被忽略的因素,從而更好地支援決策或科研工作。正是為了滿足這種要求,從資料庫中發現知識(KDD)及其核心技術—資料探勘技術應運而生。

  2資料探勘介紹

  2.1概念及其特點

  資料探勘(DtaaMniing)是指從大量的、不完全的、有噪聲的、模糊的、隨機的資料中,提取隱含在其中的,人們事先不知道的但又潛在有用的資訊和知識的過程,提取的知識表示為概念、規則、模式等。根據資料探勘的目標,採用人工智慧、集合論、統計學等方法,應用相應的資料探勘演算法,分析資料並透過視覺化工具表述所獲得的模式或規則。

  資料探勘有以下特點:(1)能發現反映系統區域性特徵和規律的模型;(2)自動趨勢預測,能發現“新”的知識;(3)比較容易獲得很多規則,並能及時更新。資料探勘方法具有開放性思維方法,它可以及時借鑑和引用模型法的很多成果,比如神經網路、粗糙集、樸素貝葉斯演算法等方法都已被利用在資料探勘方法中。

  2.2資料探勘目的及其過程

  2.2.1目的

  資料探勘期望發現的知識有如下幾類:(1)反映同類事物共同性質的泛化知識;(2)反映一事物和其他事物之間依賴或關聯的關聯型知識;(3)分類、聚類知識,是反映同類事物共同性質的特徵型知識和不同事物之間的差異型知識;(4)根據歷史和當前的資料推測未來的預測型知識。

  2.2.2挖掘的過程

  挖掘過程是從大型庫中挖掘未知的、有效的、可實用的資訊,並使用這些資訊做出決策。通常可以分為準備、資料探勘、評價階段以及運用階段等四個階段。

  (1)資料準備階段。資料準備階段是消除資料噪聲和與挖掘主題明顯無關的資料,完成對資料的篩選、變換和預處理。經處理過的資料一般儲存在資料倉庫中。資料準備是否做得充分將影響到資料探勘的效率和準確度以及最終模式的有效性。包括:①資料的選擇:選擇相關的資料;②資料的預處理:消除噪音、冗餘資料;③資料的推測:推算缺失資料;④資料的轉化:離散值資料與連續值資料之間的相互轉換、資料值的分組分類、資料項之間的計算組合等;⑤資料的縮減:減少資料量。

  (2)挖掘階段。該階段是資料探勘的核心步驟,也是技術難點所在。根據資料探勘的目標,採用人工智慧、集合論、統計學等方法,應用相應的資料探勘演算法,分析資料並透過視覺化工具表述所獲得的模式或規則。

  (3)評價階段。在資料探勘中得到的模式可能是沒有實際意義或沒有使用價值的,也有可能不能準確反映資料的真實意義,因此需要評估,確定有效的、有用的模式。評估可以根據使用者多年的經驗,有些模式也可以直接用資料來檢驗其準確性。如何將挖掘出的有用知識清楚易懂地提供給教育和管理工作者也是一項非常重要的工作,選擇合適的視覺化工具,將結果以關係表或用量化特徵規則表示給使用者。

  (4)運用階段。使用者理解的、並被認為是符合實際和有價值的模式形成了知識。同時還要對知識進行一致性檢查,解決與以前得到的知識互相沖突、矛盾的地方,使知識得到鞏固。運用知識有兩種方法:一種是隻需看知識本身所描述的關係或結果,就可以對決策提供支援;另一種是要求運用知識對新的資料進行分析,由此可能產生新的問題,而需要對知識作進一步的最佳化。

  2.2.3資料探勘的方法

  在資料探勘演算法的理論基礎上,資料探勘中的常用方法有:①生物學方法,包括人工神經網路、遺傳演算法等;②資訊理論方法包括決策樹等;③集合論方法包括約略集、模糊集、最鄰近技術等;④統計學方法;⑤視覺化技術等方法。資料探勘的各類演算法包括預測模型、關聯規則挖掘演算法、分類規則挖掘演算法、序列模式分析演算法、聚類分析演算法、WEB資料探勘等。

  3資料探勘在高等學校教學中的應用

  3.1學生的基本資訊

  利用資料探勘技術,比如可以對學生訪問情況進行分析,跟蹤、瞭解學生出勤情況。還可對學生年齡等個人情況進行分析,瞭解學生的組成、結構,為合理地安排課程設定提供依據。透過對學生考試情況的分析,並結合出勤情況,可作為考查學生學習的情況,為合理地評估學生綜合素質提供依。對於挖掘出來的規則資訊可以利用視覺化技術,以圖表或曲線等形式提供給教師,以使教師能充分利用學生的問題資源,從而提高教學質量。另外,資料探勘可以應用於網上的考試系統,對考生情況和他取得的成績進行挖掘,以幫助教師在以後的教學中更好地讓學生掌握知識。

  3.2學生的學習特徵

  學生特徵包括兩個方面:一是學習準備,一是學習風格。學習準備包括初始能力和一般特徵兩個方面。學生的初始能力是指學生在學習某一特定的課程內容時,已經具備的有關知識與技能的基礎,以及他們對這些學習內容的認識和態度。學生的一般特徵則是指在學習過程中影響學生的心理、生理和社會的`特點,包括年齡、性別、年級、認知成熟度、智力才能、學習動機、個人對學習的期望、生活經驗、文化、社會、經濟等背景因素。學生的學習風格與學習活動有著密切的關係。對學生感知不同事物、並對不同事物做出反應這兩方面產生影響的所有心理特徵構成了學習風格。

  利用資料探勘功能分析學生特徵,並在此基礎上組織學習內容、闡明學習目標、確定教學策略、選擇教學媒體,為學生創造出一個適合其內部條件的外部學習環境,使有效學習發生在每個學生的身上。

  3.3預測學生和教師行為發生

  管理資訊系統中記錄著有關學生與教師在教學中發生的各種教學事故以及典型教學事例等教學執行資訊,利用資料探勘的關聯分析與演變分析等功能,尋找師生各種行為活動之間的內在聯絡。如“當存在A,B時可以推出’C,這樣的規則,即當有A行為和B行為發生時,還會有C行為。在教學過程中,如果發現學生或教師已有A,B行為時,馬上可以分析其產生C行為的可能性,及時制定策略促進或制止C行為的發生。

  3.4合理設定課程

  在學校,學生的課程學習是循序漸進的,而且課程之間有一定的關聯與前後順序關係。在學一門較高階課程之前必須先修一些先行課程,如果先行課程沒有學好,勢必會影響後續課程的學習。另外,同一年級學習同一課程的不同班級,由於授課教師、班級文化的不同,班內學生的總體成績相差有時會很大。利用學校教學資料庫中存放的歷屆學生各門學科的考試成績,結合資料探勘的關聯分析與時間序列分析等相關功能,就能從這些海量資料中挖掘出有用的資訊,幫助分析這些資料之間的相關性、迴歸性等性質,得出一些具有價值的規則和資訊,最終找到影響學生成績的原因。在此基礎上,對課程設定做出合理安排。

  3.5評價學生學習情況

  學習評價是教育工作者的重要職責之一。評定學生的學習行為,既對學生起到資訊反饋和激發學習動機的作用,又是檢查課程計劃、教學程式以至教學目的的手段,也是考查學生個別差異,便於因材施教的途徑。

  特別是對成績管理資料庫進行挖掘,其資料來源於成績管理資料庫,挖掘的任務就是從使用者指定的資料庫中以不同的角度或不同的層次上採掘出一系列的統計結果,如分佈情況、關係,對比、顯著性檢驗等,採掘結果用交叉表,特徵規則,關聯規則,統計的曲線、圖表等表示,所以採用統計分析方法具有簡單、方便、直觀等優點,最為合適。

  因此對學生學習行為和綜合素質進行評價,一般採用模糊論中的模糊綜合評判及模糊聚類的方法,對評價結果採用了對定性和定量指標加權平均算出綜合素質評價得分並排名的方法,而且由於學生綜合素質的評價指標是動態變化的,往往選用動態聚類法對評判結果進行動態聚類分析。

  3.6評價教學質裡

  教學評價是根據教育目標的要求,按一定的規則對教學效果做出描述和確定,是教學各環節中必不可少的一環。教學評價可以透過校園網收集學生對任課教師所講授、輔導課程的意見、評價。有關學生座談意見、學生打分評價、平時各項教學檢查、相應課程期末考試班級成績彙總等都是教學評價的內容,把這些資料要作為教師教授相應課程的檔案資料全部存人資料庫。

  利用資料探勘對資料庫中有關教學的各項評價進行分析處理,可以確定教師的教學內容的範圍和深度是否合適;選擇的教學媒體是否適合所選的教學內容和教學物件;講解的時間是否恰到好處;教學策略是否得當等。從而可以及時的將挖掘出的規則資訊反饋給教師,以期更好地提高其教學水平,更好地服務於學生。

  4結束語

  總之,隨著資訊量的急劇增長和對資訊提取的更高要求,現在我們很難再依照傳統方法在海量資料中尋找決策的依據,這就必須藉助資料探勘去發掘資料中隱藏的規律或模式,為決策提供更有效的支援。雖然資料探勘作為一種工具,它永遠也不能替代教師的地位,但是它可以為教師的決策提供科學的依據。資料探勘技術本身就是人們大量實踐的結晶,它為建立傳統教學中很難獲取或不可能獲取的模型提供了捷徑。