北京網(wǎng)站設(shè)計
公司丁丁貓:在騰訊微博上面,robin主持了一個“百度說”,里面有很多關(guān)于百度官方透露的一些實(shí)質(zhì)性的消息和百度優(yōu)化方面的一些技巧,整理一下,給大家看看,最好是每一條都看。
我是 Robin ,希望主持的這個“百度說”,能給大家有所幫助。
Robots 掉的網(wǎng)頁,如果互聯(lián)網(wǎng)上其他網(wǎng)頁鏈接并描述了這個網(wǎng)頁的內(nèi)容,我們會把這些描述信息建入索引,但 Robots 掉網(wǎng)頁我們不會抓取,網(wǎng)頁內(nèi)容也不會收錄。當(dāng)你網(wǎng)站上的內(nèi)容對用戶有用時,用戶會推薦給別人,推薦的形式可能多種多樣:IM軟件上推薦給自己的朋友、在論壇里發(fā)帖推薦、寫博客介紹等。這些推薦,都會被搜索引擎用來判斷網(wǎng)頁/網(wǎng)站價值的高低。
不把 Meta Description 當(dāng)做權(quán)值計算的因素,這個標(biāo)簽存在與否不影響網(wǎng)頁權(quán)值,只是摘要的一個選擇目標(biāo)。
如果想維護(hù)一個策略的生命周期的話,最好的方式是保守策略細(xì)節(jié)的秘密。但有一點(diǎn)可以確定,一個成熟的搜索引擎,不會輕易的通過一兩個要素來判斷一個網(wǎng)站的生死。有一點(diǎn)可以肯定,索引結(jié)果數(shù)肯定不會是一個網(wǎng)站在搜索引擎中的站點(diǎn)評級指標(biāo)。這是很容易理解的。從投票權(quán)角度,它的權(quán)重會低于大部分索引了成千上萬網(wǎng)頁的站點(diǎn)?所以站長若要搞搞友情鏈接,更重要的是用自己的經(jīng)驗去做價值分析。
作為站長,如果想深入的研究SEM,可以坦白的講,數(shù)據(jù)分析是必須的。在網(wǎng)絡(luò)上搜到的東鱗西爪的所謂SEO技巧,大多是別人嚼剩下的、沒什么大用的、甚至有害的東西。站長要學(xué)會的首要事情之一,是對自己的網(wǎng)站日志做深入解剖,并能針對問題做各種實(shí)驗和分析。
山賊入伙,還需要“投名狀”呢;入搜索引擎的伙,也得要點(diǎn)考察期吧。(對于新站內(nèi)頁收錄慢的回答)如果你在中關(guān)村,搜“銀行”,然后結(jié)果全是中關(guān)村周圍的銀行網(wǎng)點(diǎn),按距離你的遠(yuǎn)近排序,這聽上去不是一件很美妙的事情嗎?呵呵。我也希望那一天盡早到來。
判定頁面重復(fù)的算法很復(fù)雜??梢钥隙ǖ氖?,僅meta相同,是不會被判為重復(fù)的。相同兩個帖子被收錄(URL可能不同),低權(quán)重的頁面會不被建索引,或者被高權(quán)重頁面類聚掉。更換服務(wù)器對網(wǎng)站排名有影響嗎?如果有,影響有多大?百度說:原則上是不會的。除非…新?lián)Q的服務(wù)器太糟糕,三天兩頭訪問失敗,或者服務(wù)器從國內(nèi)換到國外,動輒被和諧,諸如此類的“硬件”問題。
很多人喜歡往標(biāo)題里塞很多關(guān)鍵詞,以為那樣就全面開花,但很可能適得其反。這個原理同在一個頁面上設(shè)超鏈個數(shù)一樣。分一杯羹的人越多,每個人所得的羹越少。一個普通用戶,如果用你的關(guān)鍵詞去搜,怎樣的結(jié)果是合理的?如果你不喜歡的結(jié)果,恰是用戶所喜歡的,那么除非版權(quán)問題之類,否則很難得到解決;如果你不喜歡的結(jié)果,也是普通用戶所不喜歡的,那么這是一個會被百度關(guān)注的問題。
造成搜索結(jié)果中顯示標(biāo)題與實(shí)際標(biāo)題不一致的主要原因可能是tag title提取失敗,系統(tǒng)只好從其他地方取了一些文本作為標(biāo)題。這種提取失敗的原因,有網(wǎng)頁設(shè)計層面的(比如全是flash或者ajax),也有robots封禁層面的(某些重要網(wǎng)頁雖然不抓取,但會保留url本身)。一個網(wǎng)頁導(dǎo)出的鏈接數(shù)這個暫時沒有具體的數(shù)值標(biāo)準(zhǔn)。一般情況下,鏈接數(shù)量,會影響到這些鏈接從該頁面上所獲得的權(quán)重;少就多分一些,多就少分一些。
從用戶體驗角度,有些轉(zhuǎn)載未必比原創(chuàng)差。比方一篇科技原創(chuàng)博文,被知名門戶網(wǎng)站的科技頻道轉(zhuǎn)載。如果這種轉(zhuǎn)載保留原創(chuàng)者姓名和出處鏈接,實(shí)際上對原創(chuàng)者是有利的,因為起到了更好的傳播效果。只是國內(nèi)的轉(zhuǎn)載,很多是掐頭去尾,使原創(chuàng)者比較受傷。
對于搜索引擎來說,雖然超大的頁面并不影響抓取和收錄,但畢竟搜索引擎不會為頁面上的每一個字節(jié)都建立索引(那會造成極大的資源浪費(fèi)和效率等問題)。為了使頁面的主體內(nèi)容都可被檢索到,我們建議應(yīng)當(dāng)將單個頁面的大小控制在合理范圍內(nèi),就目前而言,推薦不大于128KB。
Robots Meta標(biāo)簽,我們支持nofollow和noarchive。
幾乎所有的大型網(wǎng)站都在用CDN,看看他們在搜索引擎中的表現(xiàn)就可以知道不會任何的負(fù)面影響了。但我們建議站長盡量選擇技術(shù)成熟的CDN服務(wù)商,某些CDN服務(wù)商會導(dǎo)致網(wǎng)站在某些地區(qū)訪問不穩(wěn)定,可能會影響B(tài)aiduspider的抓取。正常的301永久重定向,舊url上積累的各種投票信息會全部轉(zhuǎn)移到新url上。
正常情況下,Baiduspider對一個網(wǎng)站的抓取頻率決定于這個網(wǎng)站產(chǎn)出新內(nèi)容的速度。一個小網(wǎng)站的抓取頻率遠(yuǎn)高于新內(nèi)容產(chǎn)出速度,通常會是下面這兩種問題有中的一個:1)有其他程序冒充Baiduspider抓取。2)網(wǎng)站程序有漏洞,通常情況下,搜索引擎對https這類網(wǎng)頁并不做內(nèi)容解析,而只是將url進(jìn)行索引。IP地址的url被收錄,除了spider在機(jī)制上的不完善之外,通常站點(diǎn)設(shè)計上也有一些缺陷。一般情況下,這類問題是可以被規(guī)避的。
javascript的解析,是很多搜索引擎正在做的事情;同理,對flash的解析。畢竟有那么多應(yīng)用javascript或者flash的網(wǎng)站,并沒有意識到,他們的做法給搜索引擎的收錄和索引帶來的麻煩。所以,如果期望不被搜索引擎收錄的話,最直接的手段,還是寫robots文件。
過期域名也是域名,所以,適用于新域名的策略,也一樣適用于過期域名。只是過期域名在歷史上累積的與現(xiàn)有網(wǎng)站無關(guān)的權(quán)重,會被剝離掉,這也是很容易理解的。“偽原創(chuàng)”就是“非原創(chuàng)”。對非原創(chuàng)的策略,同樣適用于偽原創(chuàng)。歸根結(jié)底,這是一個技術(shù)實(shí)現(xiàn)程度問題,而不是策略思路問題。百度近期會發(fā)布基于百度的搜索引擎優(yōu)化指南,里面有百度推薦的網(wǎng)站建設(shè)方法,以及一些會危害到權(quán)重的做法。大家可以期待哦。
轉(zhuǎn)發(fā)請注明:丁丁貓