Google一說

網友經常有這樣的反映:我的網站提交Google很長時間了,怎麼就是找不到我的網頁呢?有些對 搜索引擎工作原理不熟悉的人甚至認為,只需將網頁做好,上傳到網站空間,就會自動登陸搜索引擎。

  對後一種情況可以打個比方,就好象一個人自生下來就成了孤兒,而且又一直獨處,不跟任何人接觸,突然有一天卻憤憤不平地說,為什麼誰都不認識我!?網站也是同樣,你不進行宣傳和推廣,它就象茫茫網海中的一座孤島,被人發現的機會幾乎沒有。

   前一種情況稍好些,至少知道要將網站提交到Google,這種做法在幾年前也許有效,但現在就不夠了。可以這麼說,網站鏈接是搜索引擎存在的基礎。從全 文搜索引擎工作原理中可以看出,搜索引擎是依*跟蹤各網站間的鏈接來找到網站和抓取網頁信息的,如果網站都相互獨立,搜索引擎的工作效率、所提供信息的廣 度和質量都會大打折扣。

  對Google而言,鏈接可是它的“命根子”,也是它成功的關鍵。所以Google一有機會就向你灌輸這 樣的觀念:出去找鏈接吧,不然你的網站是不會被我們接受的。Google曾在一次搜索引擎學術會議上說明了收錄網站的最低標準,即當你向Google提交 網址時,至少要保證已有一個外部鏈接。實際上如果網站的外部導入鏈接足夠多的話,你根本用不著直接將網址提交給Google(而且Google也不建議你 這麼做),這樣反而會更快地被Google收錄。

  現在我們知道了鏈接在登陸Google時的作用,下面介紹一下獲得外部鏈接的方法。在介紹之前,有必要先將有關鏈接的概念澄清一下:

  外部鏈接: External Links。本網站外部的鏈接,一般是指其他網站連到本網站的鏈接。

  內部鏈接: Internal Links。本網站內部網頁之間的鏈接。

  反向/導入鏈接: Backward Links或Incoming/Inbound Links。意義與“外部鏈接”接近,指其他網站連到本網站的鏈接。

  導出鏈接: Outgoing/Outbound Links。指從本網站連到其他網站的鏈接。

  * 獲得外部鏈接的方法

  1、將網站提交到門戶網站

   獲得外部鏈接最簡單的方法是將網站提交到各大門戶網站,目前 搜狐、 新浪、網易都提供收費網站登錄服務,收費從幾百到數千元不等。雖然需要一定的投入,但網站推廣的角度說,這是必須付出的代價,而且大型門戶上的鏈接會讓你 更快地登陸Google引擎,同時還可改善網站在Google上的 排名。

  2、與其他網站交換鏈接

  前面說過網站的外部反向鏈接越多,被Google找到的可能性就越大,因此你可以向其他網站申請交換鏈接。

  3、將網址提交到其他的類型網站

  這方面與通常意義上的網站推廣策略是相吻合的,為了提升網站的訪問量,我們可以將網址加到行業門戶站點、網上論壇,留言簿等等各種允許添加網址鏈接的地方,這樣也會增加Google找到我們的機會。

  * 在尋找外部鏈接時應注意的問題

  一般情況下,更多的網站外部導入鏈接會讓你更快地登陸Google搜索引擎,但這並不意味著你可以不求策略地與任何網站建立連接,其中要遵循幾個基本原則:

  1、鏈接對象是否已被Google收錄

  在尋找連接網站時有一個基本原則,就是首先確認目標網站是否已被Google收錄,主要是看該網站是否有PageRank得分,而且分值越高越好。

  2、鏈接對象是否被Google懲罰

  如果某個網站被Google懲罰,而你卻與它建立鏈接的話,不僅無助於登陸Google,相反會被殃及池魚,你的網站也可能被Google懲罰。

Google排名的意義:

根 據Jupiter MediaMetrix2002年公布的統計數據,79%的互聯網用戶依靠搜索引擎獲取信息,信息搜索成為僅次於電子郵件的互聯網第二大應用。而在眾多搜 索引擎當中,Google以其龐大的搜索量,快速而精準的搜索結果和極高的知名度成為搜索引擎的代名詞,因此自然成為企業網站推廣的首選。

Google排名優化:

優 化的方式形形色色,一般無外乎按照一定的關鍵詞,通過對網站結構,頁面因素和外部鏈接的優化,使網站得到最佳的搜索引擎排名。但事實上我們發現,有一些網 站由於採取了不正確的優化策略,不但未能有效提升網站的排名,反而使網站排名慘跌甚至遭到搜索引擎刪除。在此我們列出被Google明令禁止的屬SPAM 性質的優化技術供大家借鑒。

一:隱藏文本/隱藏鏈接

一般指網頁專為搜索引擎所設計,但普通訪問者無法看到的文本內容或鏈接。在形形色色的隱藏技術中,最常見的就是把文本或鏈接文字的字體顏色設置為與背景色相同或十分接近。

隱藏文本內容(Invisable/hidden text)

意欲在不影響網站美觀的前提下通過包含大量關鍵詞的網頁提高關鍵詞相關性得分,從而達到改善搜索引擎排名的目的。

隱藏鏈接(Invisable/hidden links)

意欲在不影響網站美觀的前提下通過在其它頁面添加指向目標優化頁的隱形鏈接,通過提升鏈接得分而改善搜索引擎排名。

現 在大多數搜索引擎都能檢測隱藏技術,並視為作弊。因而包含隱含文本的網頁面臨被搜索引擎降低排名甚至刪除列表的懲罰。雖然在Google上不乏使用隱形技 術而僥倖逃脫的網站,但多數人還是認為不值得冒這個險。其實通過添加可視文本內容並保證一定的關鍵詞密度可達到相同的優化效果。

二:網頁與Google描述不符

一般發生于先向搜索引擎提交一個網站,等該網站被收錄後再以其它頁面替換該網站。“誘餌行為(Bait-&-Switch)”就屬於此類偷梁換柱之舉--創建一個優化頁和一個普通頁,然後把優化頁提交給搜索引擎,當優化頁被搜索引擎收錄後再以普通頁取而代之。

三:誤導性或重複性關鍵詞

誤導性關鍵詞(Misleading Words)

在頁面中使用與該網頁毫不相干的誤導性關鍵詞來吸引查詢該主題的訪問者訪問網站。這種做法嚴重影響了搜索引擎所提供結果的相關性和客觀性,為搜索引擎所深惡痛絕。

重複性關鍵詞(Repeated Words)

這 種作弊技術也被稱為“關鍵詞堆砌欺*(KeywordStuffing)”,它利用搜索引擎對網頁正文和標題中出現的關鍵詞的高度關注來對關鍵詞進行不合 理的(過度)重複。類似的其它做法還包括在HTML元標識中大量堆砌關鍵字或使用多個關鍵字元標識來提高關鍵詞的相關性。這種技術很容易被搜索引擎察覺並 受到相應懲罰。

四:隱形頁面(Cloaked Page)

對實際訪問者或搜索引擎任一方隱藏真實網站內容,以向搜索引擎提供非真實的搜索引擎友好的內容提升排名。

五:欺*性重定向(Deceptive redirects)

指把用戶訪問的第一個頁面(著陸頁)迅速重定向至一個內容完全不同的頁面。

“鬼域(Shadow Domain)”

這 是最常見的欺*性重定向技術,通過欺*性重定向使用戶訪問另外一個網站或頁面。一般利用HTML刷新標識(MetaRefresh)來實現。大多搜索引擎 都不會索引使用該標識的頁面。如果你使用刷新標識來檢測瀏覽器或分辨率,那麼就請使用javascript,且盡可能延長重定向時間。如果一定要使用重定 向功能,那麼請務必確保刷新週期不少於10秒鐘。

還有一種情況就是當用戶打開一個網站,該網站聲稱其網站已移至新域名下,並請用戶點擊新域名鏈接進入網站。但當用戶進去後才發現,這個鏈接是一個“會員”鏈接。這也屬欺*性重定向行為。

六:門頁(Doorway Page)

也 叫“Bridge/Portal/Jump/EntryPage”。是為某些關鍵字特別製作的頁面,專為搜索引擎設計,目的是提高特定關鍵詞在搜索引擎中 的排名所設計的富含目標關鍵詞的域名,且重定向至另一域名的真實網站。搜索引擎的Spiders往往忽略對那些自動重定向到其它頁的頁面的檢索。

七:複製的站點或網頁

最常見的當屬鏡象站點(MirrorSites)。通過複製網站或卬頁的內容並分配以不同域名和服務器,以此欺*搜索引擎對同一站點或同一頁面進行多次索引。現在大多數搜索引擎都提供有能夠檢測鏡象站點的適當的過濾系統,一旦發覺鏡象站點,則源站點和鏡象站點都會被從索引數據庫中刪除。

八:作弊鏈接技術/惡意鏈接(Link Spamming)

典型的作弊鏈接技術包括:

鏈接工廠(link farms)

大宗鏈接交換程序(bulk link exchange programs)

交叉鏈接(Cross Link)

“鏈 接工廠”(亦稱“大量鏈接機制”)指由大量網頁交叉鏈接而構成的一個網絡系統。這些網頁可能來自同一個域或多個不同的域,甚至可能來自不同的服務器。一個 站點加入這樣一個“鏈接工廠”後,一方面它可得到來自該系統中所有網頁的鏈接,同時作為交換它需要“奉獻”自己的鏈接,籍此方法來提升鏈接得分,從而達到 干預鏈接得分的目的。如今搜索引擎發現它們已然不費吹灰之力。只要發現,不管屬有意還是無意,“鏈接工廠”中的所有站點都難逃干係。

九:其它

日誌欺*行為

通過對一些頁面等級較高的站點進行大量的虛假點擊以求名列這些站點的最高引用者日誌中,從而獲得它們的導入鏈接。Google已然意識到這種行為並將對利用這種途徑獲得導入鏈接的站點採取相應措施。

門域(Doorway Domain)

專為提高特定關鍵詞在搜索引擎中的排名所設計的富含目標關鍵詞的域名,然後重定向至其它域名的主頁。由於搜索引擎一般忽略自動重定向至其它頁的頁面的檢索,所以不提倡使用這種技術。

什麼是PageRank?

PageRank 是Google衡量網頁重要性的工具,測量值範圍為從1至10分別表示某網頁的重要性。在Google工具欄可以隨時獲得某網頁的PageRank值。在 這裡我們將透視PageRank的一些特殊之處,從而對其能夠獲得較為深入的了解,使廣大用戶能夠更好的使用和了解Googel。

  網站 排名的歷史淵源

   上世紀90年代早期網絡剛剛興起之時,每天都有大量的含有特別行業內容的站點發布於網上。網上衝浪者卻沒有相應的工具定位這些他們認為存在的,但是卻沒 有辦法找到域名或網址的站點。到了1993年,雅虎誕生了。雅虎的誕生為網民減輕了這些煩惱。雅虎最初將每一個它所找到的網站,按照所屬的分類目錄進行劃 分組織,建立起一個整潔的、可以逐級查找的數據庫,雅虎同時也在網站上置入一個 搜索引擎可以根據數據庫中存在的“關鍵詞”搜索到網站。接著其他搜索引擎如Altavista ,Excite, Lycos等也相繼推出供用戶使用的搜索工具。他們中的大多數是根據找到的元標識中的關鍵詞來識別網站的相關性。

   事情好像發展地很順利,但是當站主及網管意識到可以在元標識中插入行業關鍵詞或其他站點代碼,就可以巧妙的得到搜索結果頁面上的較高的位置的時候問題來 了。有一段時間,搜索引擎的結果被這些垃圾網站搞得亂七八糟,他們用某些相關的關鍵詞充斥於網站的各個角落,可是展現在用戶面前的實際內容確實糟糕透頂。 那些信用較高、地位重要的搜索引擎開始受到挑戰,他們必須採取更好的措施精確為用戶輸出的搜索結果。

  Google網頁級別祥解

  Google意識到了傳統搜索引擎所面臨的這種問題。如果相關性有網管來控制的話,那麼排名結果必將被他們人為安排的大量相關關鍵詞所污染,掩蔽了真正的相關性。

  網絡的本質就是超鏈接。我們從邏輯上分析,每個人都讓自己的網站與某些重要的站點相鏈接,那麼,本質上,這個站點就投了對方的一票。當上百上千個站點鏈接到這個站點時,我們認為這個站點是一個很好的很重要的站點也就非常符合邏輯了。

   就是在這樣的邏輯推理下,Google的兩位創始人Sergey Brin及LarryPage建立了一個搜索引擎算法公式,即將排名比重轉移到了網頁意外的因素上。他們的公式被命名為“PageRank”(以創建人 LarryPage的名字命名)。Google就是利用這一公式計算鏈接到某一網頁的網站數量,然後按照從1-10分別給予表示重要度的分數。鏈接到網頁 的站點越多,PageRank的分數越高。

  Sergey Brin和LarryPage在1998年把PageRank技術配置進Google一同推出。結果出乎的成功。Google這種難以認為控制的算法公司 得出的出眾的相關結果大大超過了競爭對手。這種新的算法不僅有助於提供出權威的高質量的信息,而且使得站主即網管很難利用作弊手段取得較高排名。

  Google的PageRank之所以如此重要,就是因為影響網頁排名的因素主要是依賴於網頁意外的因素,而非能夠認為操縱的因素。

  Google對PageRank的解釋

  在Google網站上有一個專門的域名介紹PageRank(http://www.Google.com/technology/)

   PageRank完全依靠的是網絡的民主特性,利用大量的鏈接結構表明某個單獨頁面的價值。本質上來說,Google把鏈接轉換為一次投票,當從網頁A 鏈接到網頁 B 時,Google 就認為“網頁 A 投了網頁 B 一票”。 Google也不是純粹考慮投票的數量,還對投票的網頁進行分析。本身很重要的網頁的投票有助於增強其他對方網頁的重要度。

  重要 的是,Google會記錄每次的搜索行為,高質量的網站能夠獲得較高的PageRank分值。當然,重要的網頁如果不能匹配你的查詢就沒有任何價值。所 以,Google把PageRank技術及文本匹配技術進行結合從而搜索出既重要又相關的的結果。Google的匹配技術不是隻考慮詞條在網頁上的出現次 數,而是檢查網頁內容(及鏈接網頁的內容)的所有方面,從而決定該網頁是否匹配你的查詢。

  更多信息訪問Google PageRank介紹:

  搜索引擎排名與PageRank的關係

  雖然每個搜索引擎都嚴格保密各自的明確的搜索算法,但是搜索引擎分析人士相信搜索引擎結果(排名列表)是“Page Relevance”與“PageRank”因素綜合承繼的結果。

  Ranking = (Page Relevance) x (PageRank)

   PageRank邏輯算法無疑是具有重大意義的,而且這種算法不能夠被網管人員輕易操縱。Google的搜索結果能夠顯示出如此高的相關性無疑也是它能 夠獲得徹底成功的重要原因之一。大多數其他搜索引擎已經完全採用同類模式作為自己的搜索算法,而有的搜索引擎將這種算法在決定結果排名中的重要程度進行定 義後應用與自己的搜索結果中。

自網絡發展的初期,搜索引擎就一直不斷的努力試圖開發出可以排列相關網頁的搜索算法。大多數搜索引擎重視於“鏈接流行度”(link popularity),作為評價網頁重要度及用於索引的標準

  Google 工具欄

  Google工具欄供人免費下載安裝,除了某些有用的功能外,比較顯著的一個特點就是它可以告訴用戶目前正在訪問的每個網頁的PageRank值。

  下載後的Google工具欄位於瀏覽器窗口下部,可隨時隨地進行網上搜索。工具欄顯示出每個頁面從1-10不等的PageRank分值。對於Google未索引的網頁,工具欄不會顯示出該頁的PageRank分值。需要提醒的是,該分值是針對網頁而言,而非網站。

  注:PR值越高,說明營銷人員要針對相應的搜索詞條獲得較高的排名位置就有更多的競爭。所以,我們建議根據關鍵詞優化你的網頁PR值。

  什麼是鏈接流行度?

   “鏈接流行度”系統是基於網頁獲得的鏈接的數量及質量而定的。也就是說,指向你的網頁的鏈接數量越多,你的網頁將被搜索引擎認為越重要。數量並不是決定 網站重要度的唯一因素,重要度還取決於其他因素,包括被鏈接到本站點的站點的質量、他們的內容的質量及與本站點的行業相關性等。

  鏈接到本站點的網頁會把PageRank的部分分值分配到本站點。所以鏈接頁面的PageRank分值越高,分配給本站點的分值也就越高。

  PageRank也會被鏈接頁面商店所有導出鏈接所瓜分。譬如,同樣PR為5的鏈接網頁,導出鏈接只有15個的網頁會比導出鏈接為100個的網頁分配給你更多的分值。

  所以重要的是要從PR值較高並且總體導出鏈接數量較少網頁才能獲得安全鏈接。

  如何檢測鏈接流行度

  最簡單的檢測網站流行度的方法就是利用Google搜索,方法如下:

  link:www.yoursite.com

  其它主要搜索引擎在搜索你的鏈接流行度時都有不同的規則。

  建立鏈接流行度提高PageRank

  建立鏈接流行度是搜索引擎營銷的一個重要方面。儘管認為的提高PageRank不是意見容易的事,但是你通過改善鏈接流行度就可以不難做到。通過長期不懈的關注建立鏈接的工作,你就會提高站點的PageRank,大大改善自己的站點排名。

   就在不久前,Google及其他搜索引擎配製了某些類似與PageRank的算法成分(如TSPR”Topic SensitivePageRank”,Hilltop“Links from expert document.”),進一步將決定排名的比重放置在頁面以外因素上。

隨著頁面以外因素在網站排名中受到重視,所以提高加強這些因素的重視就變得越來越重要。當越來越多的網管意識到PageRank及鏈接流行度的重要性時,就不難在同行業中與其他站點進行鏈接交換了。

如何應對Google的新算法?大家可以根據下面所列的一些要點採取相應的措施。

3-1. 關鍵詞的研究:擴大覆蓋面

搜 索引擎策略的中心思想是確定恰當的關鍵詞來鎖定目標群體。但有很多網站管理員卻在這一步上掉以輕心,只在屈指可數的幾個平平常常的關鍵詞身上鉚足了勁,卻 不知這種策略失之偏頗。關鍵詞研究的主要目標應該是確定目標群體所有可能使用的關鍵詞,其中包括了品牌名稱、地理位置及修飾語等“修飾成分”。

儘 管對網站的每個頁面只能圍繞兩到三個關鍵詞進行關鍵詞優化,但通過關鍵詞和修飾成分的有機結合,亦可大幅提高網站對搜索結果的覆蓋率。對於Google在 去年11月15號所做的更新,有很多實施了有效關鍵詞策略的網站管理員壓根就沒有注意到。原因很簡單:他們鎖定的是所有可能相關的關鍵詞,覆蓋面極廣,所 以雖然個別一般性的關鍵詞的排名下降了,但網站的整體訪問量並未受到什麼影響。

若只針對少數關鍵詞,而且這些關鍵詞都有很好的排名, 這種策略看起來似乎也蠻不錯。可是一旦搜索引擎改變了排名算法,就象Google這次一樣,這種缺乏靈活性的策略可就撞上南墻了--正確的做法是鎖定所有 可能相關的關鍵詞,擴大對搜索結果的涵蓋面,給自己的搜索引擎策略打下一個堅實的基礎。

3-2. 網站結構的有效性

為保證“廣泛的關鍵詞”策略的有效性,網站需要進行組織,讓搜索引擎可以順利地遍歷或檢索網站內的所有網頁。為了更好的理解這一點,讓我們先來看看搜索引擎的Spiders是如何遍歷網站的。

在對網站的第一次造訪中,Spider首先會取得一個叫做Robots.txt的文件來決定是否允許它檢索。

當Spiders從另外一個站點發現你網站的鏈接時,若Robots.txt文件裡並未聲明不允許它訪問該頁面,則Spiders會把這個頁面保存下來。它不一定就是主頁,也可能是你網站的其它頁面。

Spider在對這一頁進行檢索時,它會從中摘錄一些關於內容方面的信息和頁面上的所有鏈接,並將其放入搜索引擎的數據庫裡面。如果它所認為你的網站十分重要,它稍後會檢索這些鏈接頁面。

如果你在網站的每個頁面上都放了一組指向網站主要部分的鏈接(網站全局導航鏈接),那麼接下來這些鏈接頁極有可能得到Spider的檢索。假設網站上的每個頁面上都依次放有指向網站主要內容的鏈接,那麼搜索引擎要想遍歷整個網站真是易如反掌。

因 而,最有效的網站結構當屬自頂而下(Top-Down)或金字塔型設計結構。規模較大的網站(至少十幾頁)應設立一個網站地圖頁,用以列出網站的所有內部 鏈接頁。SUN微電子公司的網上大師級人物傑可布.尼爾森(JakobNielsen)認為:一個網站設計的精良與否的一個重要標誌就是是否有網站地圖。

許多人對文本鏈接方式的網站導航持排斥態度(可能因為它不那麼漂亮吧),而是熱衷於Flash或動態網頁(DHTML)形式的菜單。使用 這種導航方式的人要當心了,因為搜索引擎目前尚無法很好地支持這種導航系統。不過別擔心,只需將文本導航鏈接放到網頁的最下方,這樣既保持了你喜歡的網站 風格,又向搜索引擎提供了更對它們口味的東西,可謂皆大歡喜。

內容清楚的文字性鏈接不但可使你的網站很容易得到Spiders的檢索,而且對我們這些真實的訪問者來說亦一目了然。做文字鏈接時需注意一個問題:盡量讓網站的內容只需最多兩三次點擊就可以打開,可創建一個網站地圖把這些鏈接放到一起。

3-3. 創建大量優化網站內容

網站的結構就象一個框架。我們已經知道了如何構建一個友好的網站結構,接下來該向結構中填加內容了。

先記住完成步驟一(3-1)後找到的所有相關關鍵詞以及相應的修飾語,現在我們可以在每一頁的內容上,在下面幾個地方放上相關的主要關鍵詞,並予以恰當的修飾:

1. 網頁的中

2. HTML源碼中的關鍵詞和描述元標識(META Keywords & Meta Description)

3. 頁面上的主標題文字和各部分的標題文字

4. 網頁正文中的段落()和列表()之中

不 必太擔心象“關鍵詞密度”這樣“深奧”的東西。只需自然地使用關鍵詞,利用不同的單詞變化形式,並輔以恰當的修飾語。而且只需在頁面上可以看見的文本內容 中出現若干次關鍵詞,並將這些關鍵詞放在頁面上較為突出的位置上就OK了。沒必要再向其它毫不相干的地方“填塞”關鍵詞。

假設你已經 為要建設的網站擬定了大量內容––建設一個內容相當多的網站著實是一項有些讓人望而生畏的任務。實際上也確有一些人望而卻步,轉而使用諸如機器自動生成的 “門頁”等這樣一些廉價的伎倆,大家千萬別相信這些投機取巧的方法,它們只會增加你遭到搜索引擎處罰的可能性而不是你想要的排名。況且,網站內容的開發工 作並沒有那麼難。

如果你是自己做這項工作,你完全可以把工作分做幾步來開展,這樣就輕鬆多了。例如,若將工作分做10個步驟,且每個步驟中需創建10個頁面,你就可以每天只完成一兩頁內容,等一個步驟完成後再繼續下一個步驟。

花上兩三個月來構建一個既實用又兼具豐富內容的站點是值得的。別忘了要經常給網站補充新鮮的內容––即使一個星期只補充一點內容,時間長了之後,用戶總會看到內容上的質的飛躍。而且網站的內容越多,搜索引擎用戶發現它的機會也就越大。

3-4. 鏈接策略

現 在你的網站不但漂亮而且實用,不但內容豐富,而且關鍵詞完美涵蓋了所有用戶可能用到的查詢條件。每個頁面都是一個優化的典範,且被極佳地相互鏈接起 來...現在可以鬆口氣了嗎?別急,革命尚未成功。若現在你就停滯不前了,那你一定會得失望。搜索引擎不會對一個沒有任何外部鏈接的網站青睞有加。因為外 部鏈接往往意味著業內其它網站對你的認知程度。要想得到理想的排名,你還需要花時間來進行網站推廣和逐步建立網站的導入鏈接。

如果想在“新”Google中取得成效,就需要鎖定那些來自相關站點的相關鏈接。數量當然是多多益善了。問題是:怎麼去找這樣的鏈接呢?

首先,向所有能找到的相關目錄提交你的網站。象DMOZ這種大型目錄當然是首選目標了,不過一些規模相對較小的分類目錄也是理想的提交對象,如GoGuides,Skaffe,Gimpsy,WebSavvy,等等。

其 次,可從相關站點群體獲得相關鏈接。以所有主要目標關鍵詞為查詢條件,從Google上查找那些排名位居榜首的網頁。排名前20到30名的網頁一般來說相 關度最高,因而都可能是理想的目標。再依次訪問其中的每個網站-–若這些網站提供有鏈接頁,或鏈接到相關站點,可以向他們請求交換鏈接。然後再看看有哪些 網站鏈向它們,再設法同這些網站交換鏈接。

盡量控制鏈接的放置位置。即使是一個羅列了大量鏈接的“資源”頁的相關鏈接也是不錯的。若鏈接位於訪問量較好的頁面,可使你賺進顯著的訪問量。找一找這樣的網頁,和他們進行互惠鏈接。

一般情況下,鏈接頁上都會放置自己的首頁作為到自己網站的鏈接。但也不盡然。在建立鏈接時,也可以為網站的“內部”頁面尋找鏈接的機會。

3-5. 不要“見好就收”!

大多數人很容易步入的一個誤區是:一旦他們的網站在搜索引擎中的排名效果顯著上升,並由此而使訪問量得到可觀的增加後,他們就開始忙於應付新訪問者了,而不再為網站的內容、鏈接花心思了,甚至沒有心思再去看他的網站排名了。

不久之後,倘若Google或任何一家搜索引擎把他們的排名給刷下來了,他們就開始牢騷滿腹,說什麼搜索結果不公正,搜索引擎在迫害他們...等等等等。

對此,我的建議很簡單-–不要因為排名上去了就停止努力,繼續尋找新的相關關鍵詞,繼續創建鏈接,繼續為網站添加新鮮“血液”,保持網站的最新狀態。記住:無論是排在你後面還是前面的競爭對手,沒有人會停止和你競爭的。

你的努力往往需要過上幾個月才會在搜索結果中體現出來。可是有些人在幾個星期之後就因為沒有看到直接的效果而放棄了。如果在網站的搜索引擎排名上掉以輕心,等發覺問題時,你已經落後至少好幾個月了。

如果你已經讀過了“Google專利網頁級別技術PageRank揭密”或Google的PageRank技術說明,也許你會對我在這篇文章中將要談論的這個問題表示認可。

   為什麼我會提出這樣一個奇怪的問題?其實並不奇怪,因為這個問題已逐漸變成人們注意的焦點並開始給大家帶來困擾。有些人說根本不存在這樣的問題,有些人 則更加認為這只是個荒誕的說法。-頁面等級是否存在漏損的問題?如果是,這種損失有多嚴重?——我認為是對這個問題作出解釋的時候了。

反對者如是說:

   反對頁面等級會遭受漏損影響的人認為:一個網頁有其確定的頁面等級(PR值)。Google的頁面等級系統只是部分決定了該網頁所鏈向的那些頁面因為此 外部鏈接所獲得的PR增量。而在此過程中,該網頁本身的PR值實際上並未遭受損失。換句話說,如果頁面A有其確定的頁面等級,那麼不管它鏈向多少站點,頁 面A的頁面等級都不會因此而改變。

我的解釋如下:

  這種觀點確實幾乎無懈可擊,只是他們忽略了這樣一個事實,那 就是既然一個單一的網頁A上可能有其它鏈接(內部或外部的鏈接),而我們討論的又是一個網站,那麼對網頁A所在的網站而言,頁面等級是有可能循環返回到頁 面A的,這種可能性並不是沒有意義的。雖然PageRank是基於網頁而不是網站的操作,但我們大家都知道,根據網站的定義,它其實就是一個由網頁所組成 的系統。

  網站的一個獨有特性就是其內部的每個頁面是緊密鏈接起來的。這種緊密的鏈接意味著該網站上的網頁會通過鏈向網站內的其它 網頁而受益。反之,如果它鏈向一個外部網頁,它就不會得到這樣的收益。即:頁面等級的漏損問題對你的網站不會造成什麼直接的影響,其影響是間接的。那些堅 持頁面等級漏損影響不存在的人,對頁面等級這個概念的理解過分簡單化了。

讓我們先來做一個類比:

  先假設有 1,000元魔法錢在我手裡,我可以給你,但你必須遵守這樣一些遊戲規則:規則一是你必須把錢都分給你家庭中的5個成員和兩個陌生人;規則二是得到錢的這 些人要把他們得到的錢拿出一半來給你或其他6個人;規則三也是最後一個規則就是,你可以按任意分配比例把這1,000塊錢分配給7個人中的每一個人(即分 配比例由你自行決定,允許有人得不到錢)。

  現在讓我們看看,遊戲開始時你的家庭的魔法錢有多少?自然是1,000塊。根據人的本 性來推斷:你下面準備做兩樣事情,第一件是確保你盡可能得到最多的魔法錢;二是確保你得不到的那些錢能夠被你的其它家庭成員得到。所以在你第一次分配這些 錢的時候,你是壓根不會分給那兩個陌生人的。而且在把錢分給5個家庭成員時,那個你認為最可能給你50%回饋的人得到的錢一定是最多的。當然為避免引起猜 忌,你也不可能把全部錢都給這個人。而如果萬一你的某個家庭成員把他的錢給了陌生人,其實你並沒有任何損失,不過同時你也沒有最大化利用我給你的機會。這 個被浪費的機會就是你的“漏損”,是它導致了你實際得到的錢比你能夠得到的要少。

  與此類似,一個網站就象一個家庭,其內部的頁面 就象一個個家庭成員。相對於那些外部網頁來說,你只能指望你自己的網頁把得到的一半魔法錢回贈你。而且假如這些網頁都不允許留下它們所得到的魔法錢,那你 也只能指望從自己的網頁處得到這些錢。而對那些外部頁面來說,它們只會把錢給回它們自己的網站。

現在我們可以這樣下結論:

  頁面等級的漏損問題確實存在,不過它是合理的,也不會給網站造成直接影響。實際上我們可以這樣說:頁面等級的漏損導致了你無法獲得你本來能夠獲得的頁面等級,即你獲得的頁面等級比你能夠獲得的要低。

頁面等級的漏損問題是否有那麼重要?

   現在新問題來了,是不是可以不對外鏈接來防止頁面等級的漏損?答案要取決於你需要網站頁面等級為幾,你所處領域的競爭性如何,以及你所期望的頁面等級是 否與你的頁面相一致?最好的辦法是讀一下我們文章開頭所提到的“頁面等級揭密”。不過在這裡,有一點我們可以肯定,即使在最具競爭的領域內,最通常的情形 是:對一個網站來說,只有其中的一些網頁需要較高的頁面等級來獲得較好的排名,而不是它內部的全部網頁。也會有這樣的情形出現,即人們首先擔心其頁面等級 的損失而不是設法去很好地分配其網站上頁面的等級。

我們應該怎樣做?

  鏈向外部站點並非不能給你帶來益處。它可 以增加你的網站在搜索引擎中的排名和用戶瀏覽的機會。唯一的負面影響就是它也會同時造成頁面等級的漏損。正是因為如此,我想把我們討論的頁面等級漏損這個 問題叫做“頁面等級付出”應該更為合適。這也就是我為什麼在文章的一開始並不急著給它一個確定名稱的緣故。

  最簡單的解決辦法就是,對那些帶給你的好處遠大於給你造成頁面等級損失的網站,你應該鏈向它們而不是拒絕分享你的頁面等級。

  如果我想買一件外套,一個商店是50元,而另外一個商店則賣到75元,那我當然是要買那件50元的了。我舉這個例子只是想說明:你應盡可能將頁面等級的漏損降到最小,但也不要因為害怕這種損失而拒絕同那些可使你獲益的網站來分享你的頁面等級。

2003 的11月16號--這個日子可能會成為搜索引擎歷史的一個重要里程碑。正是在這次被大家稱為" GoogleFlorida"的更新中,Google對其排名算法進行了大規模改動,並導致很多原來排名很好的網站在一夜之間如夢魘般直落孫山。每個更新 週期可能會對排名算法做一些小小的改動Google一貫的做法,但這次如此大手筆的改動,不能不讓網站管理員乃至整個搜索引擎優化行業都倍感震驚和始料不 及。不但很多原來排名一直保持前矛的商業網站丟掉了排名,同時亦使得許多做網站排名優化的公司都受到了不小的衝擊。但由於Google幾乎占據了搜索市場 的大半江山,倘若此時棄而轉用其它搜索引擎進行生意推廣,並不見得為明智之舉。

對於Google新算法到底採用了什麼新機制,仍然是 SEO界爭論的焦點。目前有兩種主要理論。一種是"專家系統",即Hilltop算法,也就是本文將要闡述的;另外一種則是以Dan Thiesw為首的TSPR(Topic-Sensitive-PageRank:主題性頁面級別技術)理論,其大概思路為:查詢發生時,Google將 對查詢條件和CIRCA數據庫中包含的主題進行匹配,查詢與主題的關係越密切,則主題性頁面級別得分效果越佳。此外,由於一個給定的查詢條件可能會與數據庫中 多個主題匹配,所以頁面級別計算中出現的任何小錯誤都將由關聯的一定數量的主題性頁面級別得分平攤,因而近似的主題性頁面級別得分即可提供高質量的搜索結 果。詳細論述可參看"TSPR理論-如何應對GooglePageRank排名新算法"。我們相信,無論Google採用什麼新算法,其目的均旨在向用戶 提供更為精準的搜索結果。

HillTop (LocalScore) 算法

作者:Atul Gupta

Google 新算法的廬山真面目到底是什麼?這仍然是個迷。而在Google網站上,從其"對高質量內容網站進行獎勵及對採用惡意技術的網站進行懲戒"內容中,亦無什 麼新內容可尋端倪。自然,作為搜索引擎,這種做法是完全可以理解的。搜索引擎的算法應該是保密的,因為它們對新算法的任何評論,同意或否定的言行都會泄露 其新算法,而任何對排名系統的一丁點泄漏都有可能被一些人鑽了空子,並用來惡意操縱搜索結果,從而破壞搜索結果的客觀公正性。

我們根據一些比較具有可行性的推測,並結合實際研究、試驗,以及對搜索引擎行為的發展趨勢和歷史的知識基礎,得出了一些發現。首先,我們來看看對於Google新算法的一些比較值得注目的發現:

1.Google新算法種種之種種傳言 & 猜測

對於Google新算法主要有下面這樣一些傳言和猜測:

開始使用詞典對號入座;

意圖施壓使商業站點使用Adwords廣告服務;

開始使用"基於貝葉斯定理的SPAM過濾系統" ;

開始處罰互惠鏈接,"優化"網頁,或"鏈接文本" ;

眾多猜測中,"Google意圖施壓使商業站點使用Adwords廣告服務"顯然占了上風。許多搜索引擎優化分析家都認為:Google通過一個保密的過濾系統"黑名單"來對商業網站進行篩選,從而達到上述目的。對此觀點我實在不敢苟同。解釋如下…

1.1 是否若查詢條件中包含"商業性關鍵詞"時,Google會對搜索結果進行篩選?

因為這次更新中損失最慘重的是一些商業網站,所以有很多搜索引擎優化專家都認為Google開始對那些含有所謂"商業性關鍵詞"的查詢條件所產生的查詢結果進行篩選。而從優化專家針對此所做的一些最初的測試結果來看,確實也表明了一些看起來似乎能夠證實這種推測的徵兆。

1.2 Google此舉動機何在?

如 果這是真的,那麼Google為什麼要這樣做?這種推測的後盾在於Google算法更新的時間正好在聖誕購物季節之前,並適逢其IPO上市之際。分析家認 為:Google這樣做是為了向商業性站點施加壓力,如果這些商業網站期盼在一年一度的美國傳統的聖誕購物季節得到豐厚贏利的話,就得花錢做 AdWords自助廣告。免費午餐看來是沒有了。還有一些人則認為Google此舉旨在為其最終業績(即基線)塗抹上一點光明的色彩來打動其未來投資者。

1.3 那麼又是誰取代了商業站點原來的交椅?

從 結果頁上看,前20個結果好象都是一些官方站點(.gov),教育類站點(.edu),公益組織性站點(.org),目錄及非美國本土的站點。由於這些站 點一般並不太需要做廣告,所以分析家們據此相信:提升這些類型的網站不會影響到Google的廣告收入,同時還可以對商業性站點施壓並迫使其加入 Google的AdWords自助廣告陣營中來。

1.4 Google從何獲得"商業性關鍵詞"名單?

從Google的AdWords廣告系統,Google已然擁有一個大型的"商業性關鍵詞"的數據庫。有趣的是,等於是那些廣告客戶和商業性站點的所有者自己把哪些是"好的商業詞語"告訴給Google了-Google通過廣告者對關鍵詞語的競標價格的變化完全可以看出每個關鍵詞語的"價值"來。

1.5 事實究竟如何?Google是否確是在用"商業關鍵詞"名單來過濾掉商業站點?

我 個人認為:這種想法實在與事實太過相悖,而且我堅信:Google並不象分析家們所認為的在"過濾"站點。而且我相信,Google壓根就沒有什麼"商業 關鍵詞"名單。一度流行的這種"過濾名單"理論是分析家們從自己所看到的跡象上得出的,而事實上這些所謂的跡象是由於其它原因所引發的,而並不是什麼"過 濾"所導致的。後面我會就此問題向大家詳細解釋和闡述。

不可否認,從實踐中我們確實可以看到一些象"過濾"的結果,但我們有理由相信這樣的結果實際上是Google新算法的一種"副產品",而非Google本意。新算法意圖對商業性網站而不是公益性網站施加影響。稍後我會向大家詳細解釋…

Scroogle.org, 這個由不喜歡Google的群體所建立的網站,原來可以通過一種巧妙的方式從Google上提取數據,並向用戶提供一種可檢查網站在Google上的"未 過濾"的往日排名結果的工具。不過由於Google現已更新了算法以禁止此類查詢,故Scroogle.org現已無法提供這樣的工具。不過,該網站仍顯 示有一個從其網站上多方搜索而收集到的所謂"Filter Hit"名單。我研究過這個名單。我覺得,它充其量也只能證明了Google並未使用任何如上所說之名單。不然的確話,如何解釋"California DivorceAttorney"位於名單之首而"Books"或"Adult"卻屈居最下席?難道在Google眼裡,"California DivorceAttorney"比"Books"或"Adult"更有商業價值?

Google任何從正常的排名機制中過濾掉把商業 性站點的企圖都是對Google品牌,乃至對其公正的搜索結果信譽的嚴重損害。若真有這樣的企圖,那Google真是太短視了,根本配不上它的品牌和它的 服務。Google的股票上市(IPO)和最終業績都將因此而毀於一旦。此外,Google也說過,其"搜索服務"和"AdWords自助廣告"服務分屬 兩個不同的工作部門,且互不搭界、互不影響。對此我還是相信的。

2.Google搜索技術的幾個明顯變化

2.1 Google開始採用詞乾技術(stemming)

Google 確已在搜索結果中採用了詞乾技術。在早先,如果搜索一個單數查詢條件如"home garden",則搜索結果中不會出現如"homegardens","homegardening"這樣的關鍵詞變化形式,反之亦然。對於Google 的用戶來說,這種特性可能是一件好事情,因為搜索提供的結果更多了,但站在搜索引擎優化的立場來看,由於搜索結果的驟然增加,對關鍵詞的競爭亦驟然加劇。

2.2 Google於搜索結果中使用了拼寫糾錯工具

Google開始將其拼寫檢查工具用於搜索結果中。例如,當輸入 查詢條件為"Search EngineOptimisation"後,以往Google只會提示你是否是要找"Search EngineOptimization",但顯示的還是符合"Optimisation"的搜索結果。不過現在則能看到"Optimization"的搜 索結果。再如:"e-mail solution"和"emailsolution"的搜索結果一致,而"e-commerce"則與"ecommerce"的搜索結果是一致的,這樣就 增加了數據的競爭性。

3.對Hilltop算法的分析和推測

3.1 為什麼採用新算法

大多數網迷們都知道,頁面等級算法是由Google的創始人Sergey Brin和Larry Page所倡起的,用以精良網站在搜索結果中的排名。這也是自1998年Google發布以來的取得種種驕人成績的重要因素之一。

但 頁面等級系統亦存在著一個基本的缺陷,Google也深知這一點。它根據一個網頁上被鏈接的站點數量和質量來給該網頁分配一個絕對的"重要性值"。同時亦 將鏈接頁面的頁面等級考慮在內。指向一個網頁的外部鏈接頁的頁面等級越高,則該鏈接頁面傳遞給該網頁的頁面等級值也就越高。但是,"頁面等級值"並非針對 查詢詞語,因而一個網頁即使只是在內容中偶然提到了一個和查詢主題偏離的關鍵詞語,也會因其居高的頁面等級值而獲得一個比較高的排名。

美 國加州的克利須那。伯哈拉特(Krishna Bharat)意識到基於頁面等級的排名系統中所存在的這種瑕玼,並於2000年提出了一種新算法,他稱其為"Hilltop"算法,並於2001年的一 月份申請了Hilltop專利權,Google成為受讓方。不言而喻,Google已然意識到這種新算法與其頁面等級系統的整合將為Google的排名系 統帶來良好的效果。

我深信,在Google最近的更新中,不但運用了Google自身的頁面等級和相關性算法,而且還結合使用了Hilltop算法用於精工調整頁面等級的效果,只不過Hilltop算法可能已迥異於它最初的模樣了。

3.2 什麼是Hilltop算法?

對 此算法有興趣了解並想挖根究底的人可以看看克利須那。伯哈拉特當年所寫的Hilltop論文及詳細的Hilltop專利信息。但對我們大多數人來說,只要 知道Hilltop算法到底是個什麼東東就可以了。簡單地說,頁面等級決定一個網頁的"權威性",而Hilltop(LocalScore)則決定匹配一 查詢條件的一個網頁的"權威性"。

Bharat提出:在利用"頁面等級"來尋找"權威"網頁時,不應單純依賴於值的大小來定奪,而應 將重點放在它與查詢主題的相關性上;即不但需要考慮網頁的頁面等級,還要考慮該網頁的頁面等級與查詢主題的相關性是否相稱。若一個網頁只與查詢主題只沾點 邊,那麼即使其頁面等級非常之高,對用戶來說也是沒有意義的。如此一來,於網頁而言,那些來自於"相關主題"的文檔的鏈接就更有意義了(Bharat稱這 種"相關主題"文檔為"專家文檔"),一個網頁的所有外部"專家文檔"鏈接構成了該網頁的"權威性值"。Hilltop算法的意義在於:相同主題網站之間 的鏈接應比非相關網站的鏈接具有更高的價值。

Hilltop算法以如下方式計算一個網頁的"權威值"(這只是極為簡單的一個例子):

以該關鍵詞進行一次普通查詢找專家文檔"文集"。"專家文檔"的定義有嚴格標準,因該"文集"應是數量上易於管理的一組網頁。

從返回的專家列表中把成員站點(見下注解*)和鏡象站點去掉。

根據所獲得的上述專家文檔對其投票的數量和質量,網頁被分配以一個“局部分數”(LocalScore)。然後按網頁的“局部分數”進行排名。

*注解:成員站點指來自同一個域,或域相同而後綴不同的站點,如ibm.com,ibm.co.uk,ibm.*****等等,或指來自相鄰的IP地址的站點 (前三位IP地址相同,形如64.129.220.xxx)

此外,若兩個站點均為相同IP地址下的宿主,則認為其中一個是另外一個站點的成員站點。(即:若ww.abc.cowww.ibm.com均為相同IP地址下的宿主,則www.abc.com是www.ibm.co.uk的成員站點)

Hilltop 算法的一個極其重要的特徵在於:若沒有找到搜索引擎認為數量足夠的“專家文件”(要求至少需有兩票),則該算法失效,即返回結果為零。換言之,對於高度明 確化的查詢條件(查詢詞語),Hilltop算法的結果很可能為“0”。這是該算法的一個獨特特性。如此一來,造成了SEO一族中的大部分人都深信 Google的確在用“商業詞”過濾名單來過濾掉商業網站。

事實上,在Hilltop算法無法奏效時,將顯示“舊”Google的搜 索結果。這些查詢條件的集合就是SEO一族所收集並稱之為的“商業詞名單”。這一效果無意中卻提供了一個強有力的證據,表明Google確是採用了 Hilltop算法。2003年11月15號,Google基於新算法的更新之後,某分析家就指出:在進行查詢時,若對某一查詢條件加上一些“不包含”的 無意義字符,如“car rental –ghjkl”,則Google將會顯示以往(算法變化前)的搜索結果,而繞過所謂的“商業詞”過濾名單。

例 如,若查找“realestate –hdfkdhgk”,則Google將試圖返回所有關於“realestate”,同時內容中又不包含“hdfkdhgk”的頁面。又由於包含 “hdfkdhgk”這種字眼的網頁幾乎沒有,所以按道理來講,Google返回的查詢結果應該和“realestate”的查詢結果是相同的。然而結果 卻出人意料:Google所顯示的查詢結果和採用新算法之前的搜索結果的排名是相同的。事實上,Scroogle.org這個網站就是捕捉Google的 搜索結果在排名上的不同,並以此得出一個所謂的“商業詞”過濾名單。

在所謂的“商業詞”背後到底是什麼?

我們相 信,“商業詞”過濾式效果只是Hilltop算法的一個衍生癥狀。每當用戶進行類似“real estate–hdfkdhgk”的查詢時,Google都會對整個查詢詞語進行Hilltop運算,當無法找到足夠的包含這種查詢詞語的“專家文件” 時,該算法將返回一個零值(即零效果)。 這就意味著我們通過這種多少有些滑稽的特殊排除詞語繞過了Hilltop算法,這時候Google的其它算法就該出頭髮揮作用了,而它們所提供的查詢結果 明顯地和算法更新前的查詢結果是一樣的!後來Scroogle.org的聲名鵲起讓Goolge發現了這個bug。後來Google為了防止此類漏洞,索 性把查詢分成兩步走,先把排除條件詞語放一邊,將查詢條件送至Hilltop進行運算,如此一來,由於Hilltop不再同時對排除條件進行解析,所以可 保證其正常發揮效用,並提供相應的搜索結果,然後再將此結果傳遞給Google算法,Google根據最初查詢中的排除條件從Hilltop提供的結果中 將符合排除條件的網頁剔除,然後再將結果顯示給用戶。這也就是為什麼我們現在用上面的法子再也無法看到“舊Google”的搜索結果的原因了。

Google新算法意義何在

Hilltop算法與Google的頁面等級算法及頁面相關性算法的結合看起來是超佳組合,幾乎無懈可擊。其聯姻對於鏈接流行度/頁面等級和來自專家文件(LocalScore)的鏈接對你網站的排名的影響程度有著深遠的意義。

我列了一個簡單的公式來說明新算法的效果和影響 (謹供參考):

“舊”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)}

“新”Google排名公式 = {(1-d)+a (RS)} * {(1-e)+b (PR * fb)} *{(1-f)+c (LS)}

其中:

RS = 相關性得分:基於網頁標題(Title)。元標識(Meta tags), 正文標題(Headlines),正文(Body text)。URL,圖片Alt文字,錨文字(Anchor Text)等元素中出現的關鍵詞得出的分數。

PR= 頁面等級:(基於鏈接至你網站的網頁數量及其PR值得出的分數。原始公式為PR (A) = (1-d) + d (PR (t1)/C (t1)+ …+ PR (tn)/C (tn)),其中D為阻尼因子,一般設為0.85;公式可描述為:A網頁的其PR值等於鏈向該頁面的所有鏈接頁面的PR值分別除以各自的外部鏈接數量的總 和。

LS = 行業得分(LocalScore):根據專家文件計算得出的分數。

a,b,c = 調節控制比重:Google用於精工調整查詢結果

d,e,f = 阻尼控制:Google用於精工調整查詢結果。目前“f”值可能為“0”。

fb= 因子基數:Google工具欄山所顯示的頁面等級得分範圍從1到10,但它實質上並不是一個線性函數,而是一個指數/對數函數。經過分析,我們認為它有一 個趨近於8的基數。即PR為5的網頁的值比PR為4要多8倍之多(PR5=PR4X8),同樣,一個PR值為8的網站比一個PR值為4的網站的值要高出 4000多倍(PR8=PR4X8X8X8X8)。

Google新算法的優勢/優點

頁面因子極易被人利用和控制, 例如最早被用作排名因子的METATAGS,就由於很多網站無度的關鍵詞充斥泛濫而不得不被搜索引擎喊停。此外,在開始的時候,由於顧忌到真實來訪者的感 受,對網站內容一般作手腳的並不多,但後來亦難免誘惑,過度優化,甚至頁面上放上許多“隱形”的內容已是屢見不鮮的伎倆。頁面因子確實無形中賦予網站管理 員太多“惡意”控制權。而在Google的新算法中,各排名因素所占比重分別如下:

總“排名”得分由三部分組成:相關性得分(頁面因素),頁面等級得分(非頁面因素)和行業得分(非頁面因素):

相關性得分(RS)= 20%,頁面等級值(PR) = 40%,行業得分(LS) = 40%

其中:

RS (相關性得分:頁面相關度) --是所有SEO努力的轉換結果;

PR (頁面等級得分:外部鏈接度) --是所有建立鏈接的努力的轉換結果;

LS (行業得分:專家文件鏈接度) --是得自專家文件的鏈接的轉換結果;

從 上述結果不難看出,頁面優化的得分只占到20%,Google顯然已將重心轉至非頁面因子上,而把排名控制權越來越多地從網站管理員手中奪回來。假若一個 水平一般般的優化專家可以拿到RS中的10分,而一個水平很高的優化專家最高也不過能拿到18,19分,大家可以看到:這兩個水平懸殊的優化專家之間的差 別僅僅只有8分而已!

Hilltop算法是否以實時方式運行

Google所擁有的服務器體系架構就是網絡上分布的 一萬台奔騰級服務器。而一旦了解了Hilltop算法後,我們很難相信這樣的奔騰服務器能夠具備如此的處理能力:試想一下,首先要從成千上萬的主題性文件 中找到“專家文件”,然後計算目標網頁自這些專家文件的鏈接的得分,然後再將數值返回Google算法的其它排名系統,並做進一步處理—而所有這些要在大 約0.07秒內--這個讓Google舉世聞名的搜索速度內完成。確實使人難以置信。

Hilltop算法的運行頻率及涵蓋範圍

我們認為,要保證Google一貫的“閃電般”搜索速度,Google會對搜索頻率較高(熱門)的查詢詞(即所謂的“商業詞”黑名單)定期運行批處理,並將結果存儲起來供日後使用。Google的數據庫擁 有數目龐大的高查詢頻率的查詢詞,收集自實地搜索和其AdWords自助廣告系統中所使用的關鍵詞。Google很可能對關鍵詞搜索次數設置了上限值,凡 搜索頻率高於此閾值的查詢詞都將被納入Hilltop系統,然後Hilltop系統再對收集的所有高查詢頻率關鍵詞定期運行批處理,可能一個月一次。增量 級的稍小規模的批處理可能會頻繁一些。 同時,每個月將對Hilltop系統運行批處理後的結果對Google的萬台服務器的數據庫進行同步更新,但稍小規模的批處理的數據庫更新會更加頻繁一些。

對於那些用戶查詢頻率不算高,因而無此“榮幸”被納入Hilltop算法的查詢詞語,Google仍將使用原來的算法並顯示原來的排名結果。因而對於那些高度明確或專業化的關鍵詞,由於它們被排除在新算法的範圍之內,因而有望保持原來的排名。

Hilltop算法為何經過如此長時間才投入使用

Google 早在2003年2月就獲得了該專利,但在實際投入使用前,需要首先保證新算法和Google當時所使用的頁面等級和頁面相關性系統的完全兼容性,所以需要 對其兼容性做大量測試,然後再評估算法整合後所提供的結果,再做精工調整,然後是進一步的繁複測試…我想所有這些都需要大量時間。

Google新算法的不利方面/瑕疵

經過進一步分析,我們發現了該算法存在著的若干缺陷和不足:

Hilltop的前提是每個專家文件都是完全公正的,且無欺*和人工操縱成分。然而情況可能並非如此理想。專家文件的一個小小污點就可以對排名產生極大的負面影響。

Hilltop意圖通過“權威性”專家文件的鏈接來確定一個網頁的行業可信度,但又不能夠明確保證這些所謂的“專家文件”的”“量”確是名副其實。

運 行Hilltop算法需要大量的計算機處理能力,因而我們猜測Hilltop算法(可能)是每個月對收集到的全部高頻率(熱門)查詢詞運行一次批處理。由 於Google算法將40%重心轉移至Hilltop,且Hilltop算法運行後的得分會保持至下一次批處理,因而在此期間搜索結果很可能不會有太大變 動。此外,由於“專家”網頁的投票方式往往不會有太大變動,因而在某段時期內我們可能只會看到一些“陳舊”的搜索結果。這一點悖離了搜索引擎的“提供最 新、最好”的查詢結果的宗旨。除了“權威網頁”,用戶同樣希望看到一些新鮮的內容,然而對“新”Google而言,用戶只有寄望於那些查詢頻率不太高,從 而未被納入Hilltop系統的查詢詞語上看到“新鮮”的查詢結果了。

新站點對熱門查詢詞的排名的難度將越發加大。看來對於那些特別熱門的查詢詞,Google對新網站或新內容的排名的門檻是越來越高了。

商業性站點要鏈向網絡分類目錄,貿易協會,政府貿易機構,教育機構,公益性組織的站點並非難事,故而這樣的站點會占據搜索結果的前十名位置。

哪些站點是Google新算法最可能的殃及者?

成員站點/域群集/運行於相同服務器下的MLM(多層營銷系統程序)程序。

過度依賴“頁面”優化因子的網站。

依賴高度競爭性的查詢詞語來獲得訪問量的網站。

對網站擁有者的若干建議:

排名規則已發生重大改變,網站的成功推廣需從提高PR值及獲得更多來自“專家文件”的鏈接著手;

盡可能為更多主流網上分類目錄(DMOZ,Yahoo,About,LookSmart等),貿易目錄,黃頁,貿易協會和資源頁等所收錄;

避免使用域群集/成員程序或帶有成員性質的系統;

避免來自可疑的FFA站點及鏈接工廠的互惠鏈接。

若干需要澄清的傳言:

關於“過度優化會受到懲罰”之說--過濾優化本身就是一種SPAM,因而受到懲罰也是理所當然的事情。然而當前大多數商業網站所受到的排名衝擊並非由於受到懲罰,而是由Google將重心從頁面因子轉至非頁面因子而造成的。網站的良好優化仍必不可少。

關於“建立外部鏈接不再重要”之說--建立鏈接流行度還是和從前一樣舉足輕重,甚至還有可能會更加重要。Google專利的頁面等級算法仍舊占據舉足輕重的地位。

關於“Google開始使用‘商業詞’過濾名單”之說--Google並沒有使用任何“過濾名單”來懲罰商業站點。Google也無意去“懲罰”或“篩掉”任何東西,它所力求的只是建立一個能夠識別最具備相關性網頁的系統。

站點收錄進DMOZ,Google目錄和商業目錄收錄會讓Google認為該站點屬商業性網站,從而對其進行懲罰--正相反,由於這些目錄都是質量非常之高的“專家文件”,因而得到這些目錄的鏈接不但不會受到懲罰,反而會帶給你較高的收益。

隨 著Google對其算法的大更新,我們不得不承認,要想讓網站得到好的排名真是越來越不容易了。若只採用簡單的優化技術,如元標識(Meta)或頁面優 化,幾乎沒辦法得到理想排名。我們需要顧及很多的算法變量,而不僅僅是一個MetaTags。搜索引擎優化會更為專業化。老式的優化伎倆已經不管用或收效 甚微了。現在需要計劃和實施的是全方位的SEO策略。為保證成效,SEO專家現在需要做的是投入更多的智慧、研究、分析、計劃和時間。這樣的話,SEO的 優化“成本”亦將逐漸增高。

PPC(付費點擊)的價格會繼續攀升。PPC廣告方式不但會成為網上營銷策略的一個主要組成部分,而且需 要保證相應的搜索引擎訪問量。現在,網站的外部鏈接和頁面等級愈加重要。它對排名的影響更加重要。搜索引擎優化和建立鏈接的結合已勢在必行。此外,搜索引 擎排名算法的更新不僅會越加頻繁,而且幅度會越來越大。現在,定期的搜索引擎優化維護變得尤為重要。對網站的搜索引擎優化不僅是必須的,而且大有裨益。

很多網站都丟掉了它們原來的好排名,因而尤其需要搜索優化專家。每一次更新算法都是對搜索引擎優化人員名單的一次縮水。搜索引擎的優化和排名生意變得愈加困難,然而也愈加重要了。

supplyprice 發表在 痞客邦 PIXNET 留言(0) 人氣()