搜索算法排名因素統(tǒng)計(jì)靠譜嗎
但有一個(gè)問題一直沒仔細(xì)說。所有排名因素統(tǒng)計(jì)調(diào)查都一樣,嚴(yán)格說,從搜索結(jié)果統(tǒng)計(jì)分析出來的排名因素只能說是與排名有相關(guān)性,不一定有因果性。換句話說,觀察、統(tǒng)計(jì)得到的排名因素并不一定是真的搜索引擎使用中的排名因素。
簡單說,這些排名因素統(tǒng)計(jì)的過程是這樣:搜索典型關(guān)鍵詞(總數(shù)需要達(dá)到一定量,比如1萬個(gè)關(guān)鍵詞),下載搜索結(jié)果頁面(比如前2頁或前10頁),使用各種工具記錄、查詢頁面的特征(也就是排名因素),分析排名好的頁面有哪些共同特征,或者有哪些排名不好的頁面所沒有的特征,使用統(tǒng)計(jì)方法如皮爾森相關(guān)系數(shù)(Pearson)或斯皮爾曼相關(guān)系數(shù)(Spearman)計(jì)算出排名與排名因素之間的相關(guān)系數(shù)。
所以,這種統(tǒng)計(jì)的基礎(chǔ)是,“排名好”與“頁面特征”同時(shí)出現(xiàn),也就是這兩者有相關(guān)性,經(jīng)常相關(guān)系數(shù)還挺高。但有相關(guān)性并不必然說明有因果性。最淺顯的比喻是,公雞打鳴和天亮經(jīng)常一起出現(xiàn),是有很高相關(guān)性的,而且是公雞打鳴后天亮,但公雞打鳴不是天亮的原因。
排名與所謂的排名因素之間也是如此。最明顯的,幾乎所有排名因素統(tǒng)計(jì)都表明,F(xiàn)acebook和Twitter等社交媒體上的點(diǎn)贊數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)等是與Google排名相關(guān)性最高的因素,或者說兩者同時(shí)出現(xiàn)概率很高,但社交媒體互動(dòng)數(shù)據(jù)高是導(dǎo)致排名好的原因嗎?或者說,是排名因素嗎?一直以來,Google的幾位員工都明確否認(rèn)社交媒體數(shù)據(jù)是排名算法中的因素。
Google員工的話不一定都可信,但社交媒體數(shù)據(jù)不是排名因素,基本上是可以相信的。兩個(gè)原因:
Google拿不到社交媒體上的完整數(shù)據(jù)。目前Google和幾個(gè)主要的社交媒體都沒有協(xié)議(以前和twitter有過),不能后臺拿數(shù)據(jù),只能靠自己抓。需要登錄才能看到的信息自然抓不了,即使是不需要登錄的,由于信息量太大,Google抓取的比例我記得以前看到過統(tǒng)計(jì),還不到10%。
社交媒體隨時(shí)可以禁止Google抓頁面。這個(gè)就更可怕了。不能掌握在自己手里的數(shù)據(jù),用來做重要排名因素,一旦社交媒體們翻臉,Google搜索結(jié)果質(zhì)量可能直線下降。把自己的質(zhì)量控制權(quán)放在別人手里,大公司做不出這種事。
之所以社交媒體數(shù)據(jù)好的頁面同時(shí)也排名好,可能的原因包括:
社交媒體數(shù)據(jù)確實(shí)是排名因素(不是必然,但不排除這種可能)
搜索排名好導(dǎo)致社交媒體分享數(shù)據(jù)好(因果關(guān)系是反過來的)
搜索排名和社交媒體分享是另一個(gè)或一些共同因素造成的(比如頁面瀏覽量、外鏈數(shù)之類)
社交媒體互動(dòng)間接造成搜索排名好
巧合
到底是哪一種,或是其它原因,我們目前無法知道。
再比如,一個(gè)相反的例子。Searchmetrics的統(tǒng)計(jì)表明。com域名與排名是負(fù)相關(guān),或者說。com域名不利于排名。這就有點(diǎn)費(fèi)解了,一般來說。com域名都是首選啊。這很可能是被維基百科強(qiáng)大的排名能力干擾了,大部分查詢詞都會(huì)有一兩個(gè)維基百科的頁面排在前面,而它是。org域名。
再舉一個(gè)中性的例子。統(tǒng)計(jì)表明,排名好的頁面文字長度越來越長,那么文字長度是排名因素嗎?也許是,也許不是,也許現(xiàn)在所有頁面平均長度都變長了呢。
既然所謂的排名因素和排名之間不一定有因果關(guān)系,有些甚至明確沒有因果關(guān)系,那我們忙活什么呢?那些公司費(fèi)勁統(tǒng)計(jì)它干什么呢?
首先,不一定有因果關(guān)系,但也不一定就沒有因果關(guān)系。搜索引擎不說,我們就不能確定而已。各個(gè)統(tǒng)計(jì)調(diào)查中那么多因素,總會(huì)有一些確實(shí)是搜索引擎使用中的排名因素,碰也能碰上幾個(gè)。
更重要的是,兩者的強(qiáng)相關(guān)度往往是有內(nèi)在原因的,雖然我們不知道確切關(guān)系。排名因素統(tǒng)計(jì)至少告訴我們,排名好的頁面都有哪些特征。如果SEO們把一個(gè)頁面優(yōu)化得和排名好的頁面一個(gè)樣,那么很大概率這個(gè)頁面也能獲得好排名,雖然我們也無法明確知道到底優(yōu)化的那一部分起了作用,起了多大作用,到底哪些因素起了作用也無所謂。