版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、“HSK動態(tài)作文語料庫動態(tài)作文語料庫”語料標注及代碼說明語料標注及代碼說明“HSK動態(tài)作文語料庫”從字、詞、句、篇、標點符號字、詞、句、篇、標點符號等角度,對所收入的作文語料中存在的外國人使用漢語的中介語偏誤進行全面標注。1、字處理(包括標點符號)、字處理(包括標點符號)[C]:錯字標記:錯字標記,用于標示考生寫的不成字的字。用[C]代表錯字,在[C]前填寫正確的字。例如:地球[C](“球”是錯字)、這[C]。:別字標記,用于標示把甲字
2、寫成乙字的情況。別字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把別字移至中B的后面,并在前填寫正確的字。例如:提[B題]高、考慮[B虎]。[L]:漏字標記,:漏字標記,用于標示作文中應有而沒有的字。用[L]表示漏掉的字,并在[L]前填寫所漏掉的字。例如:后悔[L],表示“悔”在原文中是漏掉的字。農(nóng)[L]藥,表示“農(nóng)”在原文中是漏掉的字。[D]:多字標記,:多字標記,用于標示作文中不應出現(xiàn)而出現(xiàn)的字。把多余的字移至[D
3、]中D的后面。例如:我的[D的],表示括號中的“的”是多余的字(原文中寫了兩個“的”)。[F]:繁體字標記,:繁體字標記,用于標示繁體字。把繁體字移至[F]中F的后面,并在[F]前填寫簡體字。例如:記憶[F憶]、單F單純、養(yǎng)F養(yǎng)分F份。注意:1)繁體字標記標示的是使用正確的繁體字,如果該繁體字同時又是別字,則先標繁體字標記,再標別字標記。例如:儉樸[F樸[B僕]]。2)繁體字寫錯了,標為:后[F後[C]]。[Y]:異體字標記,:異體字標
4、記,用于標示異體字。把異體字移至[Y]中Y的后面,并在[Y]前填寫簡體字。例如:偏[Y徧]、沉[Y沈]。[P]:拼音字標記:拼音字標記,用于標示以漢語拼音代替漢字的情況。把拼音字移至[P]中P的后面,并在[P]前填寫簡體字。例如:緣[Pyan]分、保護[Ph]。[#]:無法識別的字的標記,:無法識別的字的標記,用于標示無法識別的字。每個不可識別的字用一個[#]表示。例如:更[#][#]保存自己的生命,……[BC]:錯誤標點標記,:錯誤標
5、點標記,用于標示使用錯誤的標點符號。把錯誤標點移至[BC]中BC的后面,并在[BC]前填寫正確的標點符號。例如:勤奮、[BC,]刻苦的精神。[BQ]:空缺標點標記:空缺標點標記,用于標示應用標點符號而未用的情況。把[BQ]插入空缺標……有的農(nóng)民CQ在不使用化肥和農(nóng)藥的情[B精]況下[BD,]養(yǎng)農(nóng)作物,……CDCD:多詞標記,用于標示作文中不應有而有的詞。:多詞標記,用于標示作文中不應有而有的詞。把多余的詞移至CD中CD的后面。例如:……
6、然后肯德基的收入有所增加CD了。中國政府應該采取良好的措施來管理農(nóng)業(yè)CD方面,……但我覺得CD按照上面所寫的方法是現(xiàn)在很多人或國家用的方法。詞處理中需要注意下列問題:詞處理中需要注意下列問題:1)因介詞、方位詞等的缺少或多余造成的結(jié)構(gòu)不完整,助詞的錯用、多用、漏用,詞性誤用等,均視為詞的錯誤。例如:隨著社會CQ的發(fā)展,人們CQ對吃的東西很重視。在這個過程CQ中……特別是非洲CD的話,問題很大的。2)結(jié)構(gòu)助詞“的”、“地”、“得”混用:按
7、錯詞處理。例如:按照人們的要求不用化肥和農(nóng)藥的話,產(chǎn)量會大大地CC的下降。我認為當你很餓的時候,什么東西都吃得CC的下。孩子們餓得CC地大哭小叫,……3)該用漢語數(shù)字而用阿拉伯數(shù)字的,一律按錯詞處理。例如:那應該怎樣解決呢所以我想出了一CC1個辦法,少用化肥和農(nóng)藥。把“十五”寫成了“一五”,應把“一五”整體按錯詞處理,而不能僅僅把“一”處理為別字。4)錯詞、多詞、成分贅余的一個標注符號中可以包括兩個或兩個以上的詞。例如:我想任何人CC每
8、一個都不要有浪費食品的習慣,……(每一個)沒有CC2重視做未經(jīng)污染的食品就是綠色食品。(重視做未經(jīng))5)原文字數(shù)和改后字數(shù)不一致的,須在括號中CC之后且緊靠CC處加一個阿拉伯數(shù)字,表明改后的字數(shù)。例如:戰(zhàn)[Pzhan]爭中最困難的人是沒有力氣的孩子和老人CC5老弱子。所以我認為首先農(nóng)民可以使用天然肥料CC4化肥,代替化肥來種植農(nóng)作物……6)不清楚或無法理解的詞用CY標示,表示“存疑”,標在該詞的后面。例如:雖然這么[L]多年都沒見面CL
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 從語料庫中挖掘知識-北語
- 基于HSK動態(tài)作文語料庫常用頻度副詞研究.pdf
- 基于HSK動態(tài)作文語料庫“那么”的使用分析.pdf
- 基于HSK動態(tài)作文語料庫“更”的偏誤研究.pdf
- 基于HSK動態(tài)作文語料庫“了”的偏誤研究.pdf
- 外國學生作文中語序偏誤的分析——基于“HSK動態(tài)作文語料庫”語例的研究.pdf
- 基于HSK動態(tài)作文語料庫常用物量詞偏誤分析.pdf
- 基于HSK動態(tài)作文語料庫的介詞“對”習得研究.pdf
- 基于HSK動態(tài)作文語料庫的典型語氣詞研究.pdf
- 基于HSK動態(tài)作文語料庫的“很+有+名”結(jié)構(gòu)研究.pdf
- 基于HSK動態(tài)作文語料庫的數(shù)字詞偏誤分析.pdf
- 基于語料庫的公示語漢英翻譯.pdf
- 基于HSK動態(tài)作文語料庫的情感類詞偏誤研究.pdf
- 留學生漢字偏誤分析及教學策略研究——以北語HSK動態(tài)作文語料庫中語料為例.pdf
- 基于HSK動態(tài)作文語料庫的方位詞偏誤研究.pdf
- 基于HSK動態(tài)作文語料庫的“然”類詞偏誤研究.pdf
- 基于語料庫的英語程式語韻律特征研究
- 俄語語料庫和基于語料庫的語法研究.pdf
- 雅思寫作語料庫
- 語料庫研究.pdf
評論
0/150
提交評論