版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、■收藏本站■聯(lián)系我們■域名主機(jī)網(wǎng)站首頁(yè)┊程序下載┊編程文檔┊電腦教程┊網(wǎng)站設(shè)計(jì)┊網(wǎng)址導(dǎo)航┊網(wǎng)絡(luò)文學(xué)┊游戲天地┊幽默笑話┊生活休閑┊月光論壇┊月光博客認(rèn)識(shí)搜索引擎認(rèn)識(shí)搜索引擎第一部分:搜索引擎發(fā)展史第二部分:搜索引擎原理第三部分:常用中英文搜索引擎指南第一部分:搜索引擎發(fā)展史第一部分:搜索引擎發(fā)展史1990年以前,沒(méi)有任何人能搜索互聯(lián)網(wǎng)。所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity學(xué)生AlanEmt
2、age、PeterDeutsch、BillWheelan發(fā)明的Archie(ArchieFAQ)。雖然當(dāng)時(shí)WldWideWeb還未出現(xiàn),但網(wǎng)絡(luò)中文件傳輸還是相當(dāng)頻繁的,由于大量的文件散布在各個(gè)分散的FTP主機(jī)中,查詢起來(lái)非常不便,因此AlanEmtage等想到了開發(fā)一個(gè)可以用文件名查找文件的系統(tǒng),于是便有了Archie。Archie是第一個(gè)自動(dòng)索引搜索。因?yàn)閅ahoo!的數(shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個(gè)可搜索
3、的目錄。Werer只抓取URL,但URL信息含量太小,很多信息難以單靠URL說(shuō)清楚,搜索效率很低。Yahoo!中收錄的網(wǎng)站,因?yàn)槎几接泻?jiǎn)介信息,所以搜索效率明顯提高。(注:Yahoo以后陸續(xù)使用Altavista、Inktomi、Google提供搜索引擎服務(wù);2002年10月9日,Yahoo放棄自己的網(wǎng)站目錄默認(rèn)搜索,改為默認(rèn)Google的搜索結(jié)果,成為一個(gè)真正的搜索引擎。)1994年初,Washington大學(xué)CS學(xué)生BrianPin
4、kerton開始了他的小項(xiàng)目WebCrawler(BrianPinkertonAnnouncestheAvailabilityofWebcrawler)。1994年4月20日,WebCrawler正式亮相時(shí)僅包含來(lái)自6000個(gè)服務(wù)器的內(nèi)容。WebCrawler是互聯(lián)網(wǎng)上第一個(gè)支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過(guò)URL和摘要搜索,摘要一般來(lái)自人工評(píng)論或程序自動(dòng)取正文的前100個(gè)字。(注:后來(lái)webcrawler陸續(xù)被
5、AOL和Excite收購(gòu),現(xiàn)在和excite一樣改用元搜索引擎Dogpile)Lycos(CarnegieMellonUniversityCenterfMachineTranslationAnnouncesLycos)是搜索引擎史上又一個(gè)重要的進(jìn)步。CarnegieMellonUniversity的MichaelMauldin將JohnLeavitt的spider程序接入到其索引程序中,創(chuàng)建了Lycos。1994年7月20日,數(shù)據(jù)量為5
6、4000的Lycos正式發(fā)布。除了相關(guān)性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個(gè)在搜索結(jié)果中使用了網(wǎng)頁(yè)自動(dòng)摘要,而最大的優(yōu)勢(shì)還是它遠(yuǎn)勝過(guò)其它搜索引擎的數(shù)據(jù)量:1994年8月--394000documents;1995年1月--1.5milliondocuments;1996年11月--over60milliondocuments。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服
7、務(wù))Infoseek(SteveKirschAnnouncesFreeDemosOftheInfoseekSearchEngine)是另一個(gè)重要的搜索引擎,雖然公司聲稱1994年1月已創(chuàng)立,但直到年底它的搜索引擎才與公眾見面。起初,Infoseek只是一個(gè)不起眼的搜索引擎,它沿襲Yahoo!和Lycos的概念,并沒(méi)有什么獨(dú)特的革新。但是它的發(fā)展史和后來(lái)受到的眾口稱贊證明,起初是否第一個(gè)登臺(tái)并不總是很重要。Infoseek的友善用戶界面、
8、大量附加服務(wù)(suchasUPStrackingNewsadirectythelike)使它聲望日隆。而1995年12月與scape的戰(zhàn)略性協(xié)議,使它成為一個(gè)強(qiáng)勢(shì)搜索引擎:當(dāng)用戶點(diǎn)擊scape瀏覽器上的搜索按鈕時(shí),彈出Infoseek的搜索服務(wù),而此前由Yahoo!提供該服務(wù)。(注:Infoseek后來(lái)曾以相關(guān)性聞名,2001年2月,Infoseek停止了自己的搜索引擎,開始改用Overture的搜索結(jié)果)1995年,一種新的搜索引擎形
9、式出現(xiàn)了——元搜索引擎(AMetaSearchEngineRoundup)。用戶只需提交一次搜索請(qǐng)求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢結(jié)果,集中起來(lái)處理后再返回給用戶。第一個(gè)元搜索引擎,是Washington大學(xué)碩士生EricSelberg和enEtzioni的Metacrawler。(注:元搜索引擎概念上好聽,但搜索效果始終不理想,所以沒(méi)有哪個(gè)元搜索引擎有過(guò)強(qiáng)勢(shì)地位。)DE
10、C的AltaVista(2001年夏季起部分網(wǎng)友需通過(guò)proxy訪問(wèn),無(wú)proxy可用qbseach單選altavista搜索,只能顯示第一頁(yè)搜索結(jié)果)是一個(gè)遲到者,1995年12月才登場(chǎng)亮相(AltaVistaPublicBetaPressRelease)。但是,大量的創(chuàng)新功能使它迅速到達(dá)當(dāng)時(shí)搜索引擎的頂峰。Altavista最突出的優(yōu)勢(shì)是它的速度(比較搞笑,設(shè)計(jì)altavista的目的,據(jù)說(shuō)只是為了展示DECAlpha芯片的強(qiáng)大運(yùn)算
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
評(píng)論
0/150
提交評(píng)論