作為中文搜索引擎的兩大巨頭,百度和google在網(wǎng)站收錄方面,各自有著自己的側(cè)重點(diǎn)和收錄原則,對(duì)于大型網(wǎng)站(比如門戶新聞網(wǎng)站)以及其他更新量大的網(wǎng)站,百度和Google的索引速度都很快,基本上都能做到當(dāng)天更新。但是對(duì)于一些更新量小的網(wǎng)站,兩者就有比較明顯的區(qū)別,Google對(duì)于高權(quán)重并提交Sitemaps和Ping的網(wǎng)站,索引速度可以達(dá)到分鐘級(jí)別,比如幾分鐘就可以在搜索排名中看到自己剛剛編寫的文章,但百度索引速度較慢,如果不是權(quán)重較高的站點(diǎn),有可能一天、三天甚至更久才被收錄。總體來講,百度對(duì)于網(wǎng)站首頁的關(guān)注以及權(quán)重給的似乎特別高,而Google對(duì)于最終的文章內(nèi)容頁面的關(guān)注多于百度。
作為全球最大的多語言搜索引擎,Google在發(fā)展歷史過程中已形成了自己的網(wǎng)頁收錄習(xí)慣,也建立起自己的一套標(biāo)準(zhǔn)。研究Goolge收錄網(wǎng)頁的習(xí)慣有利于更好地迎合Google搜索引擎的口味,達(dá)到提高網(wǎng)頁收錄量和收錄排名的目的。
Google PageRank能夠?qū)W(wǎng)頁的重要性做出客觀的評(píng)價(jià),PageRank并不計(jì)算直接鏈接的數(shù)量,而是將從網(wǎng)頁A指向網(wǎng)頁B的鏈接解釋為由網(wǎng)頁A對(duì)網(wǎng)頁B所投的一票。這樣,PageRank會(huì)根據(jù)網(wǎng)頁B所收到的投票數(shù)量來評(píng)估該頁的重要性。谷歌的搜索引擎同時(shí)也分析網(wǎng)頁內(nèi)容,他并不采用單純掃描基于網(wǎng)頁的文本(網(wǎng)站發(fā)布商可以通過元標(biāo)記控制這類文本)的方式,而是分析網(wǎng)頁的全部內(nèi)容以及字體、分區(qū)及每個(gè)文字精確位置等因素,Google同時(shí)還會(huì)分析相鄰網(wǎng)頁的內(nèi)容,以確保返回與用戶查詢最相關(guān)的結(jié)果。
百度對(duì)于新站一般都不會(huì)立刻收錄,并且在相當(dāng)長的時(shí)間內(nèi)都不會(huì)收錄,當(dāng)新網(wǎng)站在搜索引擎有了一個(gè)不錯(cuò)且穩(wěn)定的表現(xiàn),并且有了較多的反向鏈接,會(huì)出現(xiàn)一個(gè)閥值。百度判斷其網(wǎng)站內(nèi)容的質(zhì)量,會(huì)開始收錄這個(gè)新站點(diǎn)內(nèi)容,這時(shí)候網(wǎng)站才會(huì)出現(xiàn)來自百度的流量。而百度似乎對(duì)于自己的網(wǎng)站(百度知道、百度空間、百度百科等)給予較高的權(quán)值,并且更青睞于那些更新頻繁的大型門戶網(wǎng)站,而對(duì)于反向鏈接似乎沒有給予太多的權(quán)重。
綜上所述,從網(wǎng)站收錄速度上來看,Google現(xiàn)在比百度要快,不過由于百度的用戶更多一些,所以網(wǎng)站搜索來源大多還是來自于百度,在搜索引擎中的份額約占70%左右。