版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、寫作測試是語言應(yīng)用測試用于英語教學(xué)中最常見的測試之一,然而寫作測試評分的主觀性讓測試人員難以客觀準確測量出學(xué)生的寫作能力(Cho2003;何蓮珍等2008)。寫作測試中,評分員、寫作任務(wù)、評分標準等其他因素往往會導(dǎo)致考生分數(shù)的誤差變異,這些因素或獨立或交互的作用方式也增加了分數(shù)誤差來源的復(fù)雜性。由于主觀評分是寫作測試中的重要環(huán)節(jié),評分員在評分過程中所表現(xiàn)的差異就成為能夠顯著影響評分結(jié)果的重要因素之一。McNamara(1996)指出,圍
2、繞評分員的一起變量均產(chǎn)生交互,從而帶來誤差,因而對評分誤差的研究從評分員自身得以延伸到評分員與其他變量的交互。McNamara(1996)指出,評分員的背景與評分結(jié)果顯著相關(guān)。然而,對于評分員的背景所帶來的評分員效應(yīng)和偏差模式的研究很少,所得出的結(jié)論也不一致。
本研究運用多面Rasch模型研究評分員在寫作評分中表現(xiàn)的評分員效應(yīng),如寬嚴度、評分一致性等;同時從評分員背景出發(fā),通過Rasch模型的偏差分析,研究不同性別和具有不同評
3、分經(jīng)驗的評分員在評卷過程中針對不同考生、不同評分維度所表現(xiàn)出的偏頗模式,并通過訪談深入具體的對評分過程進行定性分析,更進一步探討評分員性別和評分經(jīng)驗背景是否為產(chǎn)生評分系統(tǒng)誤差的根源。
本研究通過一次課堂寫作測驗,經(jīng)批改網(wǎng)收集了137份英語作文(7份用于寫作評分培訓(xùn),130份用于實際數(shù)據(jù)分析),并邀請7位評分員進行評分。7位評分員在經(jīng)過統(tǒng)一的評分培訓(xùn)后,運用同一個寫作評分分項量表對130篇作文進行了評閱。該量表包含任務(wù)完成度、詞
4、匯、句法和銜接與連貫四個不同的維度。本研究將7位評分員根據(jù)其性別和評分經(jīng)驗的不同分為不同評分組別,運用Rasch模型對其評分結(jié)果進行了深入細致的研究和分析,得出以下結(jié)論:
1)七位評分員在評分過程中表現(xiàn)出顯著嚴厲度差異,或多或少顯示出隨機效應(yīng);評分員均呈現(xiàn)出良好的評分員間信度,除一位評分員外,其他評分員均表現(xiàn)出良好的自身一致性;未表現(xiàn)出顯著的趨中效應(yīng);
2)不同性別評分員表現(xiàn)出評分差異。男性評分員相比女性評分員評分更
5、為寬松,呈現(xiàn)出更高的評分一致性,但更容易產(chǎn)生集中趨勢;女性評分員評分更容易出現(xiàn)隨機效應(yīng),也更容易產(chǎn)生評分偏頗;
3)不同性別評分員在與不同能力考生之間以及與不同評分維度之間產(chǎn)生不同的偏頗模式,但差異并不顯著,故性別因素不會引入系統(tǒng)性誤差。
4)不同評分經(jīng)驗評分員表現(xiàn)出評分差異。中手及老手評分員相比新手評分員評分更為寬松,呈現(xiàn)出更高的評分一致性,但更容易產(chǎn)生集中趨勢;新手評分員更容易出現(xiàn)隨機效應(yīng),也更容易出現(xiàn)評分偏頗;
6、
5)不同評分經(jīng)驗評分員在與不同能力考生之間以及與不同評分維度之間產(chǎn)生不同的偏頗模式,差異顯著,呈現(xiàn)出系統(tǒng)的評分偏頗模式,即老手評分員對考生產(chǎn)生更為寬松的偏頗模式,新手呈現(xiàn)更嚴厲的偏頗模式;老手評分員對句法等語法類維度呈現(xiàn)嚴厲偏頗模式,新手對任務(wù)完成等內(nèi)容相關(guān)維度呈現(xiàn)嚴厲偏頗模式。經(jīng)卡方檢驗,差異顯著,故評分經(jīng)驗會引入系統(tǒng)誤差;
根據(jù)評分員的具體評分表現(xiàn),本研究對如何提高并改善評分信度和評分質(zhì)量提出具體、有效的建議;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寫作評分中評分員因素的多側(cè)面Rasch模型分析.pdf
- 基于多層面Rasch模型的CET-SET評分員效應(yīng)研究.pdf
- 中外評分員英語寫作評分中評分表現(xiàn)的對比研究.pdf
- 英語寫作測試中的評分者效應(yīng):整體評分和分項評分對比研究.pdf
- 高考英語寫作評分中評分員和評分量表的關(guān)系探討.pdf
- 高考英語寫作評分員培訓(xùn)效果的研究.pdf
- 高考英語寫作評分員偏頗性研究.pdf
- 一般拖延量表在公務(wù)員群體中的應(yīng)用——基于Rasch模型的分析.pdf
- 運用概化理論多側(cè)面模型分析CEPT口語考試的評分員信度.pdf
- 教練員體能測試內(nèi)容及評分標準
- 多層面Rasch模型在自主招生面試評分中的應(yīng)用.pdf
- 講解員評分標準
- CDSF與WDSF2.1評分系統(tǒng)操作流程的對比分析.pdf
- cdsf與wdsf2.1評分系統(tǒng)操作流程的對比分析
- 采購員考核評分表
- 講解員評分標準
- 關(guān)于非傾向性系統(tǒng)偏差測試員原始評分的修正.pdf
- 成績測試中的EFL寫作評分標準的研究.pdf
- 預(yù)期幸福偏差的聚焦錯覺機制探討——基于高水平聚焦與低水平聚焦的對比分析.pdf
- 評分員與評分量表間的交互作用對EFL作文評分結(jié)果與過程的影響.pdf
評論
0/150
提交評論