搜索引擎在收錄網(wǎng)頁時(shí),對(duì)網(wǎng)頁進(jìn)行備份,存在自己的服務(wù)器緩存里,當(dāng)用戶在搜索引擎中點(diǎn)擊“網(wǎng)頁快照”鏈接時(shí),搜索引擎將Spider系統(tǒng)當(dāng)時(shí)所抓取并保存的網(wǎng)頁內(nèi)容展現(xiàn)出來,稱為“網(wǎng)頁快照”。而網(wǎng)頁快照的時(shí)間理應(yīng)和搜索引擎收錄網(wǎng)頁時(shí)的時(shí)間同步,但事實(shí)上站長(zhǎng)朋友看到的快照時(shí)間并非如此。
針對(duì)目前百度搜索引擎出現(xiàn)快照異常的問題,柴瀟總結(jié)了以下三點(diǎn):
一、快照時(shí)間更新慢; 二、快照時(shí)間不更新; 三、快照時(shí)間倒退。
這三個(gè)問題是SEO人員經(jīng)常糾結(jié)的問題,今天就針對(duì)這三個(gè)問題展開分析。
一、快照時(shí)間更新慢
快照更新時(shí)間慢是一個(gè)很正常的現(xiàn)象。但可以簡(jiǎn)單的歸納為兩種情況,1、網(wǎng)站不更新;2、快照更新需要時(shí)間。
1、網(wǎng)站不更新
一個(gè)網(wǎng)站的快照更新時(shí)間首先跟網(wǎng)站本身的更新時(shí)間有必然聯(lián)系。如果網(wǎng)站不更新,那么搜索引擎蜘蛛爬取時(shí)沒有看到新的東西,自然會(huì)掉頭就走,索引庫(kù)里的備份時(shí)間也不會(huì)更新。
2、快照更新需要時(shí)間
搜索引擎蜘蛛抓取了網(wǎng)頁后,先會(huì)將索引庫(kù)里的時(shí)間進(jìn)行更新。而用戶看到的網(wǎng)頁快照 時(shí)間是展示到界面的時(shí)間,搜索引擎快照的更新有一定的延遲,并不是所有的網(wǎng)站都會(huì)在索引庫(kù)更新后第一時(shí)間反應(yīng)到快照上來。因此快照時(shí)間更新不及時(shí),跟搜索 引擎的更新延遲是有關(guān)的。但是也跟網(wǎng)站本身長(zhǎng)期建立起來的更新周期有一定的關(guān)系,如果你的網(wǎng)站一如既往的每日及時(shí)更新,那么搜索引擎對(duì)你網(wǎng)站的抓取更新周 期也會(huì)隨之調(diào)整。
二、快照時(shí)間不更新
快照時(shí)間不更新,同樣簡(jiǎn)單的分兩種情況:1、網(wǎng)站長(zhǎng)期不更新;2、網(wǎng)站出現(xiàn)無法訪問或者屏蔽等現(xiàn)象。
1、網(wǎng)站長(zhǎng)期無人打理,不更新,不用多說,搜索引擎即便再照顧你,也不會(huì)照顧到?jīng)]有節(jié)操的地步。你網(wǎng)站最后一次的更新時(shí)間會(huì)一直保留,因此造成快照時(shí)間不更新的假象。
從上圖中可以看出,該網(wǎng)站雖然說搜SEO這個(gè)詞排名很好,但是快照時(shí)間并沒有更新。通過查看頁面內(nèi)容就會(huì)發(fā)現(xiàn),該頁面作為一個(gè)固定的列表頁,里面的內(nèi)容發(fā)布于2008年,至今沒有變化,是導(dǎo)致排名雖然很好,但是快照并么有更新的原因。
2、如果網(wǎng)站在中途出現(xiàn)無法訪問,或服務(wù)器關(guān)閉,或因?yàn)槠渌驅(qū)е轮┲?a href="http://www.saitell.cn/tags-413.html" target="_blank">抓取異常等現(xiàn)象,會(huì)導(dǎo)致快照更新出現(xiàn)異常。
有時(shí)候會(huì)看到,網(wǎng)站在更新,或者網(wǎng)站可以正常訪問,但是快照時(shí)間依然停留在很久以前。是因?yàn)樗阉饕嬲故窘o用戶的時(shí)間,并不一定是最新更新的時(shí)間,而是會(huì)選擇一個(gè)它認(rèn)為比較合適的收錄時(shí)間。
三、快照時(shí)間倒退
如果說前兩種情況大家都可以理解的話,第三種情況可能就很少有人理解了。為什么呢?因?yàn)橛行┚W(wǎng)站是2013年建的,快照顯示時(shí)間卻是2006年。這個(gè)時(shí)間差讓人哭笑不得,甚至有罵百度腦殘的沖動(dòng)。這個(gè)問題在幾次站長(zhǎng)大會(huì)上一直有人向百度工作人員提出過提問,但是一直都沒有正面回應(yīng),都是以第二個(gè)現(xiàn)象的答案來回答這個(gè)問題的。今天柴瀟就對(duì)這個(gè)現(xiàn)象進(jìn)行圖文解析。首先我們來看一下下面這組圖。
上圖是柴瀟的個(gè)人博客,這里顯示的時(shí)間為2006-5-12,但實(shí)質(zhì)上其博客是2013年建立的。因此看到這個(gè)快照時(shí)間后,非常難以理解,想知道這個(gè)時(shí)間是從哪里來的。經(jīng)過一番研究后發(fā)現(xiàn)了這個(gè)秘密,請(qǐng)看下圖:
當(dāng)時(shí)打開網(wǎng)站進(jìn)行查看,發(fā)現(xiàn)首頁的內(nèi)容摘要里顯示了一個(gè)英文時(shí)間,這個(gè)時(shí)間翻譯過來恰好就是2006年5月12日。經(jīng)過回憶,而在這段時(shí)間,這個(gè)網(wǎng)站曾有一天因?yàn)榉⻊?wù)器到期而無法訪問。看到這些,問題迎仍而解。
原來百度快照時(shí)間除了會(huì)自己選擇一個(gè)合適的收錄時(shí)間作為快照時(shí)間來展示給用戶之外,還有可能抓取網(wǎng)站內(nèi)容中的時(shí)間作為快照時(shí)間展示出來。
也許還有人會(huì)覺得這是一種恰合,于是為了進(jìn)一步證明,柴瀟再次做了實(shí)驗(yàn)。請(qǐng)看下圖:
之前說SEO研究協(xié)會(huì)網(wǎng)的快照是2014年1月10日。當(dāng)我把網(wǎng)站頁面的內(nèi)容里的時(shí)間修改為2014年7月25日后,百度快照時(shí)間開始更新。更新后的快照時(shí)間和我修改的時(shí)間吻合。
因此,從以上的實(shí) 驗(yàn)中可以看出,百度快照時(shí)間的來源主要有三點(diǎn):
一、及時(shí)按照收錄時(shí)間進(jìn)行更新;
二、系統(tǒng)在索引庫(kù)里的備份時(shí)間里選取一個(gè)百度自認(rèn)為相對(duì)適合的時(shí)間作為快照 時(shí)間進(jìn)行展示;
三、當(dāng)網(wǎng)站服務(wù)器出現(xiàn)無法訪問等情況時(shí),網(wǎng)站快照時(shí)間容易出現(xiàn)異常,這事搜索引擎蜘蛛會(huì)抓取網(wǎng)站內(nèi)容里面的時(shí)間作為快照時(shí)間進(jìn)行展示出來。
當(dāng)然以上只是柴瀟總結(jié)出來的部分現(xiàn)象,并非全部,由于篇幅較長(zhǎng),所以不一一列舉,今后將會(huì)在巨推學(xué)院的課程里依次進(jìn)行分享。
下面是大家僅此遇到的一些關(guān)于SEO方面的問題:
Q:網(wǎng)站快照時(shí)間倒退如何解決?
A:首 先回憶網(wǎng)站本身在近期內(nèi)有沒有服務(wù)器無法訪問的現(xiàn)象,或者臨時(shí)關(guān)閉等。如果沒有,請(qǐng)通過百度快照投訴或百度站長(zhǎng)平臺(tái)提交等渠道進(jìn)行更新;如果近期服務(wù)器有 異,F(xiàn)象,請(qǐng)檢查網(wǎng)站首頁內(nèi)容里是否有與百度快照時(shí)間相吻合的時(shí)間存在,如果有,請(qǐng)修改改時(shí)間,或者消除該時(shí)間,下次百度蜘蛛抓取時(shí),發(fā)現(xiàn)原有時(shí)間不存在 后,會(huì)對(duì)快照時(shí)間進(jìn)行更新。
Q:網(wǎng)頁URL中出現(xiàn)關(guān)鍵詞是否對(duì)SEO有幫助?、
A: 從用戶體驗(yàn)角度考慮,url可讀是比較理想的狀態(tài),用戶可以通過url即可簡(jiǎn)單判斷頁面主題內(nèi)容,對(duì)于符合用戶體驗(yàn)的百度當(dāng)然提倡;從直接的角度來講,沒有明確指出有幫助的,但是從間接的角度講,還是有作用的,建議如果能在URL中體現(xiàn)關(guān)鍵詞或者關(guān)鍵詞拼音即可盡量體現(xiàn)。
Q:拒絕外鏈的生效時(shí)間是多久?
A: 拒絕外鏈的生效問題,這里涉及了抓取、更新、計(jì)算的很多環(huán)節(jié),最快生效時(shí)間也將在30天左右。另外考慮的一點(diǎn),作弊站是需要增加作弊成本的,不可能拒絕后即生效,仍然有一段懲罰周期存在。
作者:柴瀟
轉(zhuǎn)載請(qǐng)保留原文地址: http://www.saitell.cn/show-503.html