關于網站死鏈的若干問題
在網站的日常運營中,出現死鏈,那是一件很正常的事情。但是,如果我們不盡快處理網站的死鏈,不僅會影響到網站的用戶體驗,同時還會影響到網站的搜索效果。
那么,今天小編就為大家講解一下,死鏈是如何產生的;死鏈對網站又有何影響;我們應該如何去發現死鏈;我們應該如何正確處理死鏈。
導致網站出現死鏈的因素有很多。而最常見的因素有6個:
1、網站內部添加了錯誤的內部鏈接:由于編輯員的失誤或者是程序員的大意,導致網站產生了一些不存在的頁面,而這些頁面就是死鏈。
2、網站出現暫時無法訪問的情況:由于服務器、空間或者程序出了問題,導致網在短時間內無法訪問,那么網站就會產生大量返回碼為5開頭的服務器錯誤頁面。
3、外部鏈接的錯誤:用戶或者站長在站外發布了錯誤URL;別的網站復制或采集了你們含有錯誤鏈接的頁面。
4、爬蟲提取了不完整的url:由于網站個別url中存在不規則字符,或者url與后面的文字鏈接起來,導致個別爬蟲在提取頁面url時,提取了不完整的url,使得url變得無效。
5、網站改版:這是最容易產生死鏈的一個因素。因為網站在改版的時候,會刪除許多的老頁面,從而會導致網站產生大量的死鏈。
6、管理員刪除頁面:網站管理員刪除被黑、廣告、過時、被灌水頁面導致很多死鏈接。
死鏈對網站的影響有三方面,分別是:
1、影響搜索引擎對網站的評分。
2、會浪費掉搜索引擎抓取網站頁面的配額并且會影響其他正常頁面的抓取。
3、會影響網站的用戶體驗。
網站的鏈接那么多,我們可以通過什么方法去發現死鏈呢?
1、百度站長工具中的抓取異常工具可以查看最近一個月產生的各種死鏈,并支持導出功能。
1、百度站長工具:站長工具有一個抓取異常工具,可以查看最近一個月所產生的鏈接,而且可以導出。
2、使用相關爬蟲軟件:比如Xenu,可以爬取全站所有鏈接并分析頁面狀態,分析完成后,還可以導出,對于我們提取死鏈接很方便。
3、在網站運營中,特別是論壇,經常需要刪除某些頁面,在刪除頁面時一定要記錄對應的Url以便后期提交死鏈。
通過上述兩種辦法提取的死鏈列表,一定要經過刪重和驗證,比如用wps表格進行刪除重復鏈接,然后再使用Http狀態批量查詢工具驗證下是否確實是死鏈接。
1、網站改變是最容易產生死鏈接的,所以我們在改版網站的時候,盡量不要刪除或修改一些有價值的url。如果我們一定要更換域名或者url分配規則的話,那么我們一定要對之前有價值的url進行一個301跳轉,使其跳轉到相關的url上。如果我們真的要刪除老的數據的話,那么我們必須要對刪除的頁面的url進行整理以及提交死鏈。
2、對于那些已經整理好的死鏈粘貼到網站根目錄的一個文檔中,然后將這個文檔地址提交到百度站長工具--網頁抓取--死鏈提交--添加新數據--填寫死鏈文件地址,這樣就可以處理網站所發現的死鏈了。當然,如果這些死鏈是有一定規則的話,我們可以用規則開提交死鏈的。
相關注意事項:
1、在百度站長工具中提交死鏈前,一定要確保提交的死鏈數據不存在活鏈接。一旦存在活鏈,會顯示提交失敗導致無法刪除。
2、由于很多網站程序問題,很多打不開的頁面返回碼并非404,這是一個大問題,比如明明是打不開的頁面返回碼是301、200、500,如果是200的話,會導致網站中出現不同URL獲取相同內容。比如我的一個站,社區的帖子刪除后,返回碼卻是500,后期發現了,立馬進行了處理。大家盡量找出所有錯誤URL格式,并設置HTTP狀態碼為404。
3、把所有的錯誤頁面找到后,一定要尋找此類頁面URL相同特征,并且和正常頁面的特征有區分,寫對應規則到robots文件中,禁止蜘蛛抓取,就算你已經在站長工具中提交了死鏈,也建議robots封禁抓取。
4、robots只能解決蜘蛛不再抓取此類頁面,但解決不了已經收錄頁面的快照刪除問題,若你的網站被黑,刪除了被黑頁面,除了robots封禁被黑頁面外,還應該將這些頁面提交死鏈。提交死鏈是刪除被黑頁面快照的最快辦法。