網(wǎng)站收錄_第1頁
已閱讀1頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、如何加快搜索引擎對網(wǎng)站頁面的收錄如何加快搜索引擎對網(wǎng)站頁面的收錄創(chuàng)業(yè)感悟2009061122:50:48閱讀2評論0字號:大中小在談如何加快Google和百度對網(wǎng)站頁面的收錄之前,我想先解釋一下為什么要加快收錄速度。所有的站長都希望自己的網(wǎng)站能夠有比較好的搜索引擎表現(xiàn)。那么影響自己搜索引擎表現(xiàn)力的其中一項就是網(wǎng)站被收錄的頁面。雖然不是絕對,但是普遍來說,頁面收錄量大一些,網(wǎng)站的整體搜索引擎表現(xiàn)就會好一些。同時,網(wǎng)站的搜索引擎推廣絕非是幾

2、個關鍵詞的優(yōu)化,而是一群關鍵詞都得到較好的排名,利用長尾理論,每個詞貢獻幾個訪問量來源,最終匯集成為一個巨大的搜索引擎訪問量來源。同時,還能更加廣泛地抓住潛在客戶。要做到這點,網(wǎng)站的頁面要盡可能被搜索引擎收錄,不然就無法做到一群關鍵詞都獲得很好的排名。所以,盡可能地讓自己的網(wǎng)站頁面都被收錄,這是所有站長都應該做的。要做好搜索引擎的收錄,其中最重要的還是網(wǎng)站的結(jié)構。要說明這個問題,請允許我介紹一下搜索引擎爬蟲的工作原理。搜索引擎爬蟲來收錄

3、網(wǎng)站并非一次性就將整個網(wǎng)站就走一遍的,甚至很多時候爬蟲只是檢索了幾個頁面就會離開了。同時,爬蟲的工作分成兩個,一個是建立網(wǎng)址檢索任務,第二個是對任務表當中的網(wǎng)址進行檢索,并存入搜索數(shù)據(jù)庫。只要網(wǎng)站的所有頁面被放進了檢索任務表,那么爬蟲就一定會來進行那些網(wǎng)頁的收錄工作。那么網(wǎng)址檢索任務又是如何建立的呢?當爬蟲在檢索某一個頁面的時候,它會將這個頁面所包含的站內(nèi)網(wǎng)址放入檢索任務表。但是,并不是一定會將所有的網(wǎng)址都放進去的。爬蟲會選擇什么網(wǎng)址?

4、多少網(wǎng)址?其實并沒有什么規(guī)律。不過似乎越靠前的網(wǎng)址是越被重視。而且似乎遇到了站外鏈接、網(wǎng)址數(shù)量過多、重復的網(wǎng)址出現(xiàn)在任務表中的時候,就會停止收錄網(wǎng)址。而一旦停止,那么只有等待爬蟲在下一次來訪網(wǎng)站的時候才會更新網(wǎng)址任務表,那很可能就是幾天之后了。根據(jù)這個情況,如果想要讓網(wǎng)站更好地被收錄,要做到以下幾點:1.網(wǎng)站的內(nèi)容要層層遞進,通過一個清晰的網(wǎng)站鏈接結(jié)構,幫助爬蟲在幾次來訪網(wǎng)站后就可以把主要的網(wǎng)站頁面全部收錄。清晰的結(jié)構通常是一個樹狀的,

5、而且層級最好不要超過4層。網(wǎng)站結(jié)構主要體現(xiàn)在導航條的部分,通過首頁的導航和每個欄目頁的二級導航進入到內(nèi)容列表頁,最后指向文章頁。2.首頁的導航和欄目頁的導航一定要在代碼位置靠前,避免爬蟲在抓取到導航鏈接前就離開網(wǎng)站了。3.列表頁要巧妙使用翻頁機制,同一個頁面當中列表的條數(shù)不要超過50條。數(shù)量太大,爬蟲會離開。翻頁空間也要做成第1.2.3.4.5.6.7.8.9頁這樣的模式,把后面的翻頁列表也讓爬蟲抓入任務列表庫。4.文章頁內(nèi)是鏈接最少的

6、頁面,要充分利用這個特點,讓爬蟲在文章頁抓取的時候也能夠收錄到網(wǎng)站內(nèi)其它的頁面。這就需要文章內(nèi)容頁要有相關文章和推薦文章的鏈接。讓爬蟲在文章頁進行網(wǎng)站結(jié)構的橫向抓取。5.一個小技巧是做好GoogleSitemap并且進行準確的提交到網(wǎng)站管理工具當中去。這對Google的抓取很有幫助,是一種主動為google提供抓取任務表的方式。另一個竅門是sitemap可以不止一個,而是每個欄目一個,這樣可以做到同步提交,加快收錄速度。6.讓最新的文章

7、盡快的被收錄也是能夠讓收錄量不斷上升的方式。所以我們可以通過在首頁把最新的文章進行展示,即可以保持網(wǎng)站的更新頻率,又讓最新的文章盡快被收錄。7.網(wǎng)站的內(nèi)容是一個持續(xù)的增長。有的網(wǎng)站通過信息抓取工具,從其它網(wǎng)站抓取大量文章,一次性導入到自己的網(wǎng)站當中來,其實是很不健康的。搜索引擎對于這種短時間內(nèi)的突變非常敏感,甚至可能會進行懲罰。所以,文章的增加一定要穩(wěn)定、持續(xù)。例如每日2030篇的數(shù)量。8.最后,別忘記了在搜索引擎網(wǎng)站提交入口做一次提交

8、。通常Google提交的一周左右開始進行收錄,百度要23周才會開始收錄。(百度開始收錄后,只有首頁顯示被收錄,剩下的頁面通常要等一個月甚至更長的時間才會顯示。)9.多做一些外鏈,這樣可以增加爬蟲從其它網(wǎng)站來訪的幾率,從而讓爬蟲來訪的次數(shù)增加,自然增加收錄速度。最后,以我的經(jīng)驗來看,對于企業(yè)網(wǎng)站,Google收錄數(shù)在1000以上的時候,整體網(wǎng)站的各個頁面的搜索引擎表現(xiàn)力會有比較明顯的提升。收錄數(shù)對百度的影響較不如google的明顯,但是也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論