在網(wǎng)站建設的過程中,經(jīng)常會出現(xiàn)一個讓人煩惱的問題,那就是網(wǎng)頁相似度很高,而一旦出現(xiàn)這種問題,就很難提升網(wǎng)站的排名,甚至還會造成百度的降權或者懲罰。那么什么是網(wǎng)頁相似度呢?
通常網(wǎng)頁的相似度主要指的是兩個網(wǎng)頁的內容有很多部分相同。當搜索引擎對比兩個網(wǎng)頁時,會通過兩種方法進行對比分析。第一是根據(jù)網(wǎng)頁內容上的摘要模塊進行分析,如果兩個網(wǎng)頁上MD5值數(shù)據(jù)一樣,那么這兩個網(wǎng)頁的相似性就非常高。第二,就是根據(jù)網(wǎng)頁上的關鍵詞頻度和排序進行分析。在一個網(wǎng)頁上獲得詞頻較高的關鍵詞,然后進行MD5賦值,如果兩個網(wǎng)頁的關鍵詞MD5值一樣,那么說明具有較高的相似度。
目前搜索引擎能夠認可的網(wǎng)頁相似度不能夠超過60%,如果超過60%,那么就會被相應的搜索引擎懲罰,導致被降權或者屏蔽。那么造成網(wǎng)頁相似度的因素有哪些呢?具體來看主要有兩個方面的原因:第一,同一個網(wǎng)站里,經(jīng)常將過去舊的內容進行簡單的翻新,在翻新的過程中,描述、關鍵詞和標題以及內容等改動極少,或者就是簡單的偽原創(chuàng),這樣就容易造成網(wǎng)頁相似度高。第二,將其他網(wǎng)站已經(jīng)收錄的內容拿過來,進行簡單的調整,比如改變一下標題,將段落重新打散,然后發(fā)布到自己網(wǎng)站上,這樣的內容雖然和自己網(wǎng)站中的內容對比不會存在相似性,但是從互聯(lián)網(wǎng)的角度上對比,那么這種重復性就會變得十分明顯了。
當出現(xiàn)網(wǎng)頁相似度明顯的時候,就需要立刻改變之前的內容建設戰(zhàn)略,否則一旦超過60%這個警戒線,就很容易網(wǎng)站被判定為垃圾網(wǎng)站,從而很難獲得成功。對此可以從下面兩個方面來降低網(wǎng)站內容相似度。
第一,盡可能的進行原創(chuàng),因為原創(chuàng)的內容不會存在相似度的問題,而且就算是別的網(wǎng)站被轉載,甚至收錄時間超過你,但是經(jīng)過一段時間之后,百度的智能化算法同樣會判定你作為第一原創(chuàng)者,從而給予更高的權重。
第二,偽原創(chuàng)要進行升級,畢竟一個網(wǎng)站豐富的內容,通過站長個人或者一個小團隊往往很難搞的非常豐富,適當?shù)膫卧瓌?chuàng)無可厚非,可是偽原創(chuàng)卻需要進行升級,不能夠進行簡單的更換標題,打亂段落的方式,這種方式隨著百度智能化的升級,已經(jīng)很難適應,最佳的方法就是通過人工改寫的方式,而且盡可能達到70%以上的原創(chuàng)度,才能夠降低網(wǎng)頁的相似度。
第三,采用iFrame框架技術對于一些重要內容進行多次展示,因為一個網(wǎng)站上的內容可能會在多個頻道上展示,比如首頁上具有一些推薦的內容,而相應的欄目頁上也存在著這些一模一樣的內容,那么此時就需要采用iFrame框架技術,對于重復的內容根百度說不,讓百度不要抓取這些內容,這樣就能夠規(guī)避網(wǎng)頁相似度的風險。
總而言之,網(wǎng)頁相似度不能夠太高,但是一點沒有也不夠現(xiàn)實,關鍵是掌握一個度,如果站長時間充分,那么盡可能的做好原創(chuàng),再加上對代碼進行合理的優(yōu)化,這不僅能夠降低網(wǎng)頁相似度,同時還能夠優(yōu)化對用戶的體驗,起到一箭雙雕的作用。謝謝閱讀,希望能幫到大家,請繼續(xù)關注腳本之家,我們會努力分享更多優(yōu)秀的文章。