<em id="1jlvv"></em>

<address id="1jlvv"><sub id="1jlvv"><address id="1jlvv"></address></sub></address>
<sub id="1jlvv"></sub>

<video id="1jlvv"></video>

<font id="1jlvv"><mark id="1jlvv"><mark id="1jlvv"></mark></mark></font>

<em id="1jlvv"><sub id="1jlvv"></sub></em>
<ins id="1jlvv"><ruby id="1jlvv"></ruby></ins>

您的瀏覽器版本過低,為保證更佳的瀏覽體驗,請點擊更新高版本瀏覽器

以后再說X
圖片名 圖片名

當前位置: 首頁>> 新聞中心>>

優化網站的抓取與收錄

發布時間:2019-10-29 點擊:988

很多有關于網站結構、抓取與收錄、甚至是排名的問題都可以被歸結為一個中心問題,那就是:搜索引擎能夠多么容易的抓取您的網站?我們在最近的幾次活動上都談到過這個話題,下面您將會看到我們關于這個問題的演講內容以及要點概括。 

網絡世界極其龐大;每時每刻都在產生新的內容。Google 本身的資源是有限的,當面對幾近無窮無盡的網絡內容的時候,Googlebot 只能找到和抓取其中一定比例的內容。然后,在我們已經抓取到的內容中,我們也只能索引其中的一部分。

URLs 就像網站和搜索引擎抓取工具之間的橋梁: 為了能夠抓取到您網站的內容,抓取工具需要能夠找到并跨越這些橋梁(也就是找到并抓取您的URLs)。如果您的URLs很復雜或冗長,抓取工具不得不需要反復花時間去跟蹤這些網址;如果您的URLs很規整并且直接指向您的獨特內容,抓取工具就可以把精力放在了解您的內容上,而不是白白花在抓取空網頁或被不同的URLs指引卻最終只是抓取到了相同的重復內容。

阻止Google爬蟲抓取他們不能處理的頁面

通過使用你的robots.txt 文件,你可以阻止你的登錄頁面,聯系方式,購物車以及其他一些爬蟲不能處理的頁面被抓取。(爬蟲是以他的吝嗇和害羞而,所以一般他們不會自己 “往購物車里添加貨物” 或者 “聯系我們”)。通過這種方式,你可以讓爬蟲花費更多的時間抓取你的網站上他們能夠處理的內容。

一人一票。 一個 URL, 一段內容

在理想的世界里,URL和內容之間有著一對一的對應:每一個URL會對應一段獨特的內容,而每一段內容只能通過的一個URL訪問。越接近這樣的理想狀況,你的網站會越容易被抓取和收錄。如果你的內容管理系統或者目前的網站建立讓它實現起來比較困難,你可以嘗試使用rel=canonical元素去設定你想用的URL去指示某個特定的內容。