2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,被信息產業(yè)界認為是數(shù)據庫系統(tǒng)最重要的前沿之一,是信息產業(yè)界最有前途的交叉學科.在各高校實際的教學評價中,存在著很多問題,面對歷年來積累的大量教學數(shù)據,而傳統(tǒng)的教學評價手段顯的無能為力,而數(shù)據挖掘這一技術就解決了這一難題.聚類方法是數(shù)據挖掘中一個重要的研究內容.本文對數(shù)據挖掘技術尤其是聚類挖掘技術進行了系統(tǒng)

2、、深入地分析和研究,并將其投入到教學評價中.主要包括以下一些內容: 首先對數(shù)據挖掘技術進行了簡要的回顧,在提出數(shù)據挖掘基本概念的基礎上,對數(shù)據挖掘可發(fā)現(xiàn)的模式進行了詳細地分類、歸納和總結.對數(shù)據挖掘的體系框架及運行過程也作了詳細的探討.對數(shù)據挖掘技術的國內外研究現(xiàn)狀和當前的研究熱點進行了歸納和總結.為本文的全面展開奠定了基礎. 然后重點討論了聚類算法.k 平均分區(qū)算法和層次凝聚算法是數(shù)據挖掘研究的重點之一.這兩種算法的應

3、用極為廣泛.然而隨著應用的深入,這兩種算法也暴露了一些不足之處.例如:層次凝聚算法由于在每次分區(qū)合并時,需要計算單鏈接距離(或全鏈接距離),耗費了大量的時間,其時間復雜度為0(n<'2>).并且一旦一個合并完成,它不能被撤消,然而對k平均分區(qū)算法來講,它有一個最大的優(yōu)點是不必在指定分區(qū)數(shù).但是k平均分區(qū)算法的缺點是必須事先設定分區(qū)數(shù)k.這一點對用戶來講,是相當不合理的.在k平均分區(qū)算法中,初始分區(qū)的選擇不當?shù)脑?將會收斂成為一個局部最小

4、的準則,找不到最優(yōu)解.針對上述情況,本文提出了一種新的改進算法(NP算法).本文提出了一種新的改進算法(NP算法). 將數(shù)據挖掘技術應用到實踐中,對濰坊學院的成人教育數(shù)據進行挖掘,基于MS Analvsis Services挖掘工具,通過決策樹分析、聚集分析等方法研究而得出的有關學生的特征,如:年齡小于或等于30歲的女生學習成績的綜合表現(xiàn)多偏向于中,年齡大于30歲的男生學習成績表現(xiàn)偏向優(yōu)秀的可能性較大等特征將會提供給學術顧問,以

5、便濰坊學院的教務處發(fā)現(xiàn)成人教育存在的問題與規(guī)律,針對學生的不同特征進行綜合分析后對學生的選課提出指導意見(數(shù)據以濰坊學院成人教育教育管理專業(yè)的為例). 采用數(shù)據挖掘軟件SPSS對于濰坊學院近幾年教育技術學專業(yè)的相關數(shù)據進行統(tǒng)計分析,挖掘數(shù)據背后隱藏的信息與知識,揭示若干教育現(xiàn)象,如:在畢業(yè)論文方面:男女生之間存在顯著性差異,再如在等級考試方面:男女生之間存在顯著性差異,女生的成績明顯高于男生.并為濰坊學院的教育決策支持提供若干參

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論