包頭網絡推廣的網站主要內容是JS生成的,對于用戶訪問,沒有優化;然而,該網站對爬蟲捕獲進行了優化,并直接將圖片二進制內容放入HTML,導致頁面長度過長;然而,經過優化后,發現內容不包括在百度中。頁面質量很好,針對爬蟲進行了優化。為什么不包括內容?
SEO工程師分析:
1.網站對爬蟲進行優化,將圖片二進制內容直接放在html中,導致頁面長度過長,網站頁面長度達到164k;
2.整個站點SEO優化后將主體內容放在后面,但圖片放在前面;
3.爬蟲抓取內容后,頁面內容過長被截斷,抓取部分無法識別主要內容,導致頁面被認定為短而不包括在內。
SEO工程師建議:
1.不建議使用js生成主要內容,比如js渲染錯誤,很可能導致頁面內容讀取錯誤,無法抓取頁面;
2.對于爬蟲爬行做優化,請將主要內容放在前方,避免抓取截斷造成的內容抓取不完整。
3.對于爬蟲爬取做SEO優化的站點,建議頁面長度在128k以內,不要過長;
*免責聲明:轉載內容均來自于網絡,如有異議請及時聯系,本網將予以刪除。