
Educational Data Mining is an emerging discipline, concerned with developing methods for exploring the unique and increasingly large-scale data that come from educational settings and using those methods to better understand students, and the settings which they learn in.
----- educationaldatamining.org
一、 什么是教育數據挖掘?
如同國際教育數據挖掘協會(IEDMS) 首頁所展示所言。教育數據挖掘實際上就是基於計算機系統的學習系統,交互學習環境,模擬學習環境,現有學校學習系統等采集用戶學習行為數據。在心理學和學習科學的理論知道下,利用計算機科學、數據挖掘等領域的知識,發現學生是如何學習。
二、教育數據有哪些特點?
- 一個重要的且獨一無二的特點:教育數據是具有層次性的(hierarchical)。即按鍵層keystroke level)、問答層、會話層、學生層、課堂層、教師層、學校層,層層嵌套。對於現有的在線教育,層次分類可能有些許不同,但是數據的結構還是具有層次性的。
- 教育數據具有時間和序列屬性,並且具有上下文背景。
- 時間屬性包括學習的時間戳、學習時長等
- 序列表示學習中概念之間是如何相互聯系的,以及如何對練習及教學進行排序
- 上下文對解釋結果和判斷模型可不可行非常重要
三、教育數據挖掘的目標是什么?
- 通過創建包含學生知識,動機,元認知和態度等詳細信息的學生模型來預測學生未來的學習行為
- 發現或改進 表征要學習的內容和最佳教學序列的領域模型(domain models)
- 研究學習軟件可以提供的各種教學支持的效果
- 通過構建包含 學生模型,領域和軟件教學法的計算模型,推進關於學習和學習者科學知識的提升
四、教育數據挖掘采用什么技術?
1. 預測(Prediction)
需要建立一個可以由一些數據的組合推斷出另外一個數據的模型。比如偵測是不是在戲耍系統、非期望任務行為、已有技能但不正確回答問題等等。預測模型已經被應用在理解在線教育的行為上,比如通過論壇表現和參加測試等等來預測哪些學生會學習失敗。以及預測學生們的教育成果。
2. 聚類(Clustering)
通過一些共有的特征將學生分成幾個類別,比如通過學生們的學習表現和交互模式,分組推薦學習動作和學習資源。
3. 關聯挖掘(Relationship mining )
發掘數據集中各個變量之間的聯系,並將其編碼形成規則,以便於之后使用。例如,關聯分析可以識別在線購物中產品之間的關系(哪些商品會經常被一起購買等,這個經典的例子是《啤酒與尿布》,有興趣的小伙伴可以了解了解) 。
關聯規則挖掘(Association rule mining) 運用於教育領域可以發現學生們共現的錯誤,根據學生特性和內容的關聯推薦相關的可能感興趣的內容,或者改善教學方法。
序列模式挖掘(Sequential pattern mining) 可以捕捉到連續事件之間的聯系,從而建立規則。可以用來檢測事件,比如由於題目或者知識點很難的時候,學習時長、學習論壇和求助行為等一系列事件發生的內在聯系。
關聯挖掘在教育中的關鍵應用有:發現學生表現和課程序列之間的關聯,以及發現哪些教學策略可以帶來更有效或更有效的學習。后一個領域稱為教學分析,旨在幫助研究人員建立自動化系統,通過挖掘教育系統的使用數據來模擬教師的工作。
4. 決策支持(Distillation for human judgment)
描述數據,幫助人們迅速識別數據的特征。比如學生觀的學習動作、表現、學生之間的合作等(和數據可視化分析有點類似)。
5. 模型發現(Discovery with models)
通過已經建立的模型(比如前面的預測、聚類、關聯挖掘等)和人類已有的知識,將這些模型及經驗知識作為一個組件,建立更加完備和復雜的綜合模型(搭積木一樣把模型組件搭起來),挖掘更加深層的信息。
五、運用上面的技術,能夠回答我們什么問題?
- 對某個特定學生,什么樣的主題序列是最有效的
- 什么學習行為能與更好的學習相關聯(比如更高的課程得分
- 什么學習行為能夠表明 滿意度、參與度、學習進程等等?
- 在線學習環境的什么特征能夠帶來更好的學習效果?
- 哪些因子能夠預測學生的成功(表征習得等等)?
