版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著情報(bào)檢索計(jì)算機(jī)化和自然語言化的進(jìn)一步發(fā)展,自然語言和情報(bào)檢索語言結(jié)合的趨勢更加明顯?!白匀徽Z言+后控制”已成為情報(bào)檢索發(fā)展的必然趨勢。所以研究它們的結(jié)合方式成為當(dāng)務(wù)之急。后控詞表是眾所周知的自然語言和情報(bào)檢索語言結(jié)合的典范。
后控詞表雛形是一部同義詞詞典,隨后國內(nèi)外陸續(xù)出現(xiàn)了一批后控模式。這些模式吸收先進(jìn)技術(shù),從不同角度探討了后控詞表實(shí)現(xiàn)的方式方法,有些已達(dá)到或接近實(shí)用。本文對這些模式分門別類進(jìn)行研究,分析其原理,結(jié)合實(shí)例
2、闡述其實(shí)現(xiàn)過程,并評價(jià)其特性。
詞典模式比較簡單,機(jī)器實(shí)現(xiàn)比較容易。但是,詞典構(gòu)造比較困難,詞典維護(hù)代價(jià)較大,因而不是十分理想。
積累提問式模式在檢索提問式中選擇后控詞,使后控詞表獲得較高的“用戶保障”。但由于用戶檢索水平參差不齊,檢索提問詞的有效性受到影響,因此后控詞表質(zhì)量不高。
根據(jù)詞形變化實(shí)現(xiàn)后控詞表編制的相似性匹配方法在一定程度上對同義詞進(jìn)行控制,減輕了用戶構(gòu)造檢索策略的負(fù)擔(dān)。但是漢語中由于詞形變化
3、和詞義變化之間并沒有必然聯(lián)系,因此,完全依賴于詞形模式不能達(dá)到較好的后控目的。
聚類分析能綜合利用多種指標(biāo)進(jìn)行分類,并允許增加一些對分類有價(jià)值的綜合指標(biāo)用作分類依據(jù),因而聚類效果較好。但是它對變量選擇要求比較嚴(yán)格。
相比于以上模式,詞頻統(tǒng)計(jì)模式是建立在較成熟的語言學(xué)統(tǒng)計(jì)研究成果基礎(chǔ)上的,具有一定的客觀性和合理性。然而它必須克服單純統(tǒng)計(jì)的形式化缺陷,并結(jié)合語法語義分析,才能構(gòu)造高質(zhì)量的后控詞表。
超文本模式為
4、后控詞表創(chuàng)造了較好的技術(shù)環(huán)境,它真正從人的思維角度來實(shí)現(xiàn)檢索的后控過程,減少了檢索人員的智力負(fù)擔(dān)。
本改進(jìn)系統(tǒng)充分吸收了上述模式優(yōu)點(diǎn),摒棄了完全依靠機(jī)器或僅依靠人工完成詞表編制的原則,采用正確的編制思想由人機(jī)結(jié)合共同完成詞表編制。本系統(tǒng)結(jié)構(gòu)為:自然語言詞典+主題詞表/輪排+分類表,存儲結(jié)構(gòu)由一個系統(tǒng)詞典和三個輔助詞典來實(shí)現(xiàn)。在此基礎(chǔ)上,首先通過一定程序?qū)崿F(xiàn)基本表編制的機(jī)編化。其次,以基本表為參照標(biāo)準(zhǔn)和理論依據(jù),確定了改進(jìn)系統(tǒng)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向搜索引擎的網(wǎng)絡(luò)后控詞表系統(tǒng)設(shè)計(jì).pdf
- 分眾分類與受控詞表的集成研究.pdf
- 受控詞表互操作質(zhì)量分析.pdf
- 受控詞表互操作質(zhì)量分析
- 基于受控詞表的醫(yī)學(xué)資源社會化標(biāo)簽推薦系統(tǒng)設(shè)計(jì)研究.pdf
- 漢語語音合成系統(tǒng)的改進(jìn)與實(shí)現(xiàn).pdf
- 船舶漢語主題詞表查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 中國知網(wǎng)商務(wù)模式模擬評價(jià)與改進(jìn)策略研究.pdf
- 現(xiàn)代漢語動詞表層語義研究.pdf
- 巴陵石化項(xiàng)目投資效益后評價(jià)機(jī)制改進(jìn)研究.pdf
- 基于語音識別的漢語語音評價(jià)系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 韓國高中生漢語教學(xué)用詞表研究.pdf
- JD公司供應(yīng)商質(zhì)量管理改進(jìn)與評價(jià)模式研究.pdf
- 網(wǎng)絡(luò)音樂商業(yè)模式后評價(jià)體系研究.pdf
- 重慶電信投資項(xiàng)目后評價(jià)模式研究.pdf
- 對泰漢語初級階段教學(xué)詞表研究.pdf
- 評價(jià)與改進(jìn)
- 基于知識管理的政府投資項(xiàng)目后評價(jià)改進(jìn)研究.pdf
- Delicious中文標(biāo)簽與漢語主題詞表的結(jié)合研究.pdf
- 現(xiàn)代漢語上下限副詞表主觀量研究.pdf
評論
0/150
提交評論