作為用戶的我們,在打開網(wǎng)站的時(shí)候,偶爾會(huì)打不開,為什么會(huì)出現(xiàn)這種狀況呢?
合肥網(wǎng)絡(luò)公司為您解答,不可不說(shuō)的網(wǎng)站解析。
百度蜘蛛抓取建庫(kù),你的網(wǎng)站錯(cuò)過(guò)了什么?這些都需要站長(zhǎng)朋友們?cè)诠ぷ饕约芭c百度進(jìn)行相關(guān)調(diào)整的時(shí)候,進(jìn)行全面的了解與改善。
1,有時(shí)候網(wǎng)站網(wǎng)頁(yè)自身不大,但為何會(huì)出現(xiàn)解析不出來(lái)的現(xiàn)象呢?
例如趕集、58這些網(wǎng)站頁(yè)面的量很大,是沒有問(wèn)題的。試想一下,你每次在頁(yè)面之間follow出新的鏈接,試圖把后面的參數(shù)去掉都不會(huì)受到任何影響的,網(wǎng)站頁(yè)面正常訪問(wèn)都沒有問(wèn)題。如果出現(xiàn)相反的情況,就會(huì)適得其反,出現(xiàn)相關(guān)問(wèn)題。
2,對(duì)于蜘蛛而言,關(guān)于URL的長(zhǎng)度是有限制要求的,那關(guān)于目錄名的長(zhǎng)度是否同樣有要求呢?
事實(shí)上是沒有要求的,因?yàn)樵谖覀冋J褂眠B接的情況是從www到結(jié)束,其中中間字節(jié)不能超過(guò)1024個(gè)。
3,在同一個(gè)網(wǎng)站范圍內(nèi),如果出現(xiàn)這種在內(nèi)容一樣,但其排版結(jié)構(gòu)是不一樣的,這是算重復(fù)嗎?
是的,重復(fù)無(wú)論是文字還是在排版方面,關(guān)鍵看文字,內(nèi)容相同,就肯定是重復(fù)。
4,如果在整版都是Flash的情況下,為了不影響美觀,我將其某些欄目或者是更新的最新內(nèi)容隱藏。但需要把它提取出來(lái)的時(shí)候,是否可以使用CSS或者是hidden屬性?
CSS是完全提取不出來(lái)的,hidden可以提出,但是對(duì)于是注釋這種形式的就不會(huì)去理會(huì)。
5,作為站長(zhǎng)偶爾會(huì)看到關(guān)于這樣的注釋:頁(yè)面大小不超過(guò)一兆,這種情況下,是指頁(yè)面需要壓縮嗎?
此時(shí)我們需要了解的是在頁(yè)面壓縮以后的情況,最好不要超過(guò)1兆,方便傳播與存儲(chǔ)。
6,對(duì)于長(zhǎng)久未更新的網(wǎng)站,網(wǎng)站信息已是很久之前的,但在搜索的時(shí)候,網(wǎng)頁(yè)返回的是200,為什么會(huì)受到懲罰呢?
互聯(lián)網(wǎng)世界是信息更新速度非??斓?,如果用戶搜索的信息,導(dǎo)流到你的網(wǎng)站的時(shí)候,對(duì)用戶的作用不大,自然不會(huì)受到百度蜘蛛的青睞。
7,圖文傳播的形式,方便用戶了解,但是僅僅在頁(yè)面中放置一張圖片,以及相關(guān)的文字,對(duì)于百度而言,是否會(huì)喜歡呢?
最好是不要使用。蜘蛛一般抓取的通過(guò)文字的形式進(jìn)行篩選,如果長(zhǎng)期搜索的是圖片,那么會(huì)認(rèn)為是內(nèi)容死鏈,分析不出來(lái)的話,網(wǎng)站就會(huì)受到影響。
8,無(wú)論是糯米還是現(xiàn)在支付寶更新的團(tuán)購(gòu)功能,但猝不防及的時(shí)候,會(huì)瀏覽到過(guò)期團(tuán)購(gòu)的消息,這樣的頁(yè)面會(huì)受到懲罰嗎?
此種頁(yè)面如果用戶的點(diǎn)擊量特別大的情況下,就會(huì)出現(xiàn)與上面所說(shuō)的內(nèi)容死鏈,如果分析不出來(lái)的話,會(huì)出現(xiàn)相關(guān)問(wèn)題。
9,一般資訊頁(yè)面時(shí),是發(fā)布時(shí)間好還是不需要出現(xiàn)時(shí)間呢?又或者在評(píng)論解答頁(yè)面的情況下,評(píng)論的時(shí)間重要嗎?
蜘蛛在抓取頁(yè)面的時(shí)候,是根據(jù)抓取時(shí)間來(lái)進(jìn)行判斷的。相對(duì)于評(píng)論時(shí)間而言,百度更加注重的是主題內(nèi)容的時(shí)間。
10,靜態(tài)與動(dòng)態(tài)的URL區(qū)別會(huì)很大嗎?出現(xiàn)在產(chǎn)品平臺(tái)頁(yè)面情況下,關(guān)于型號(hào)與顏色發(fā)生不一致的情況下,例如型號(hào)發(fā)生改變,但是顏色還是一樣的,這樣對(duì)于蜘蛛而言,會(huì)認(rèn)為是重復(fù)的情況嗎?
無(wú)論是靜態(tài)還是動(dòng)態(tài)URL,在百度認(rèn)為都是一樣的,都可以識(shí)別出來(lái)。
關(guān)于型號(hào)與顏色之間之于百度的收錄,如果其結(jié)構(gòu)形態(tài)發(fā)生變化的話,是不會(huì)認(rèn)為是重復(fù)的現(xiàn)象。例如第三點(diǎn)中說(shuō)到的,如果你在產(chǎn)品介紹中,內(nèi)容出現(xiàn)重復(fù)的話,會(huì)認(rèn)為是重復(fù)問(wèn)題。所以細(xì)節(jié)很重要。