Monday, April 14, 2008

如何做搜索引擎的工作-網站抓取工具

它是搜索引擎,最終實現您的網站上以公告的準客戶。因此,這是更好地了解如何將這些搜索引擎,其實工作,以及他們如何,目前資料給客戶展開搜索。

有兩種類型的搜索引擎。首先是由機器人所謂的crawler或蜘蛛。

搜 索引擎使用的蜘蛛索引網站。當你提交你的網站頁面,以一個搜索引擎,完成其規定的提交頁面時,搜索引擎蜘蛛會索引你的整個網站。 『蜘蛛』是一個自動程序,是由搜索引擎系統。蜘蛛訪問一個網站,閱讀到的內容就實際的工地上,工地的梅塔標籤,並按照聯繫該網站連接。蜘蛛,然後回報所有 這些資料都回到一個中央存管,如數據檢索。它還將訪問每一個環節,你對你的網站和索引那些網站一樣。一些蜘蛛只會指數一定數量的頁面上你的網站,所以不要 創造一個站點500頁!

蜘蛛會定期回到工地檢查是否有任何資料,這種情況已經改變。頻率與這種情況時,是由版主的搜索引擎。

蜘蛛幾乎是像一本書,它包含的內容表,實際內容和聯繫,並參考各網站發現,在它的搜索,並可以根據指數高達100萬頁,每天。

例如:興奮, Lycos公司, AltaVista和Google公司。

當你問一個搜索引擎來查找信息,它實際上是通過對指數,它已創造和實際上沒有搜索網頁。不同的搜索引擎,會產生不同的排名,因為並非每一個搜索引擎使用同樣的算法來搜索通過指數。

事 情之一,一個搜索引擎算法掃描的是頻率和位置的關鍵詞就一個網頁,但它還可探測人工關鍵字餡或spamdexing 。那麼算法分析的方式,頁面鏈接到其他網頁,在網上。通過檢查如何頁面鏈接到對方,發動機都能確定哪些是在頁面上的,如果關鍵詞的鏈接的網頁都是類似的關 鍵字就原一頁。

No comments: