基于數據挖掘的河北省高考數據分析研究.pdf_第1頁
已閱讀1頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、信息技術的飛速發(fā)展使得各行各業(yè)積累了大量的數據,隨著管理信息化的推進和行業(yè)業(yè)務需求的增大,人們并不滿足于對現有數據的簡單查詢和分析,傳統的數據管理方法已不能深入探索數據背后的含義。數據挖掘技術應運而生,該技術就是幫助人們從海量數據中提取有效的、隱含的、潛在有用的知識以優(yōu)化和促進相應行業(yè)的信息化管理和發(fā)展。經過不到二十年的發(fā)展,數據挖掘技術已經在諸多領域得到了廣泛的應用,也逐步在教育行業(yè)中發(fā)揮一定作用。
   教育信息化的深入推進

2、給我國教育行業(yè)帶來了巨大變革,現代化的信息技術管理已滲透到教育領域的各個環(huán)節(jié)。每年高考過后,教育考試部門都會形成大量的高考數據,包括考生信息、考生成績、報考信息等等。河北省自引進海云天高考閱卷系統以來,一直實施高考網上閱卷,進一步加強教育考試信息化管理工作,規(guī)范考試信息數據的管理和挖掘應用。
   高考閱卷的信息化管理和實施使得相應的教育考試部門積累了大量的高考數據,這其中包括多年的考生報考數據、考生成績數據、考生志愿數據等等,

3、本文將數據挖掘技術中的關聯規(guī)則挖掘和聚類分析引入到高考數據分析中,在高考數據分析系統的基礎之上對數據進行二次挖掘,進而發(fā)現通過現有系統中傳統統計學、教育測量學等技術理論無法挖掘的潛在有用知識,以期對全省的高中教育起到一定的指導作用。
   Weka數據挖掘平臺是目前最為主流的通用數據挖掘工具之一,其強大的數據挖掘功能和集成的眾多通用挖掘算法得到了許多理論研究者和應用開發(fā)人員的青睞。本文綜合考慮其通用性、強大的算法合成等優(yōu)勢,最終

4、選用該平臺,以河北省近幾年普通高考招生考試模擬樣本數據為基礎,綜合運用高考數據分析系統和以Weka平臺為主要依托的數據挖掘技術,將數據庫、計算機編程語言與數據可視化相結合,對河北省高考數據進行深入的挖掘和分析,試圖尋找以高考成績分析為主要內容的高考數據挖掘方法和模式:
   ①依托已開發(fā)的高考數據分析系統進行模擬樣本數據準備和預處理,將提取的數據在Weka平臺中運用數據挖掘技術對全省高考數據進行分析、挖掘,為全省高中教育教學和管

5、理提供決策依據。同時也為教育考試管理部門提供方便快捷的考試數據分析方式。
   ②結合模擬考生報名信息和成績信息,在高考數據分析系統中進行數據預處理,轉化為數據挖掘工具Weka所能處理的數據格式,之后進行關聯規(guī)則挖掘和聚類分析處理,發(fā)現影響考生成績的潛在因素。這為區(qū)域及學校教育的發(fā)展提供一定參考。同時通過Weka挖掘,以英語學科為例,發(fā)現科目試題間的關聯和考生答題趨勢。
   通過本研究,比較深入地對全省高考數據進行了挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論