中文姓名自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-11 格式：pdf 頁(yè)數(shù)：66 大小：2.30MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

中文姓名自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf_第1頁(yè)

已閱讀1頁(yè)，還剩65頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、中文命名實(shí)體或未登錄詞識(shí)別是中文信息處理的基礎(chǔ)研究課題，是文本理解、文本校對(duì)、文本主題自動(dòng)抽取、文本聚類、文本挖掘、文本過(guò)濾、信息抽取、機(jī)器翻譯等多種自然語(yǔ)言處理技術(shù)的重要基礎(chǔ)。因此，研究中文命名實(shí)體識(shí)別對(duì)提高詞法分析、句法分析、語(yǔ)義分析乃至中文信息處理的質(zhì)量有很重要的意義。本文針對(duì)現(xiàn)代漢語(yǔ)文本，主要研究人名的自動(dòng)識(shí)別問(wèn)題，我們?cè)趯?duì)大規(guī)模姓名樣本庫(kù)、姓名語(yǔ)料庫(kù)進(jìn)行統(tǒng)計(jì)的基礎(chǔ)上，將姓氏按其在真實(shí)文本中成為真姓氏的概率對(duì)姓氏進(jìn)行優(yōu)

2、先級(jí)劃分，并重點(diǎn)研究了前300個(gè)姓氏作普通單字時(shí)其上下文用字規(guī)律及姓氏的詞性規(guī)律，將局部二元統(tǒng)計(jì)語(yǔ)言模型作為基本框架，設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)中文人名自動(dòng)識(shí)別系統(tǒng)。具體地，本文的主要內(nèi)容如下：本文首先分析了中文人名識(shí)別的困難，并對(duì)現(xiàn)有的人名識(shí)別方法進(jìn)行了簡(jiǎn)單介紹和比較；然后建立了人名樣本庫(kù)、姓氏庫(kù)、人名語(yǔ)料庫(kù)等在人名識(shí)別前所需的語(yǔ)言學(xué)資源，并對(duì)這些資源進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上，建立了各種人名用字表、姓氏概率表、分詞詞典、人名上下文信息表、

3、姓氏用作普通單字時(shí)的上下文信息表、姓氏前綴、后綴表等人名識(shí)別過(guò)程中所需的數(shù)據(jù)資源。然后對(duì)姓氏按優(yōu)先級(jí)進(jìn)行分類，并通過(guò)3σ法則建立優(yōu)先級(jí)閾值庫(kù)；利用局部二元統(tǒng)計(jì)語(yǔ)言模型對(duì)人名識(shí)別問(wèn)題進(jìn)行建模，并給出各個(gè)優(yōu)先級(jí)的姓氏的識(shí)別規(guī)則。最后，我們?cè)O(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于局部二元統(tǒng)計(jì)模型的中文人名自動(dòng)識(shí)別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明，本文提出的人名識(shí)別模型能夠獲得較為滿意的結(jié)果。對(duì)98年1月《人民日?qǐng)?bào)》26日～31日的語(yǔ)料進(jìn)行的開(kāi)放測(cè)試，在調(diào)整閾值參數(shù)c

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

中文姓名自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

中文姓名自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載