1樓:一度微盤點
搜尋引擎「蜘蛛」指的是網路爬蟲(又被稱為網頁蜘蛛,網路機械人,在foaf社群中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動地抓取資訊的程式或者指令碼。
基於目標網頁特徵的爬蟲所抓取、儲存並索引的物件一般為**或網頁。根據種子樣本獲取方式可分為:
(1) 預先給定的初始抓取種子樣本;
(2) 預先給定的網頁分類目錄和與分類目錄對應的種子樣本,如yahoo!分類結構等;
(3) 通過使用者行為確定的抓取目標樣例,分為:
(a) 使用者瀏覽過程中顯示標註的抓取樣本;
(b) 通過使用者日誌挖掘得到訪問模式及相關樣本。
其中,網頁特徵可以是網頁的內容特徵,也可以是網頁的鏈結結構特徵等等。
2樓:匿名使用者
首先,**是由各個網頁組成的,就像個蜘蛛網,然後搜尋引擎抓取**是一層一層抓取的,就像蜘蛛編織蜘蛛網一樣,所以把搜尋引擎爬行抓取**的過程叫做「蜘蛛爬行」
3樓:匿名使用者
在網際網路發展初期,**相對較少,資訊查詢比較容易。然而伴隨網際網路**性的發展,普通網路使用者想找到所需的資料簡直如同大海撈針,這時為滿足大眾資訊檢索需求的專業搜尋**便應運而生了。
現代意義上的搜尋引擎的祖先,是2023年由蒙特婁大學學生alan emtage發明的archie。雖然當時world wide web還未出現,但網路中檔案傳輸還是相當頻繁的,而且由於大量的檔案散布在各個分散的ftp主機中,查詢起來非常不便,因此alan emtage想到了開發乙個可以以檔名查詢檔案的系統,於是便有了archie。
archie工作原理與現在的搜尋引擎已經很接近,它依靠指令碼程式自動搜尋網上的檔案,然後對有關資訊進行索引,供使用者以一定的表示式查詢。由於archie深受使用者歡迎,受其啟發,美國內華達system computing services大學於2023年開發了另乙個與之非常相似的搜尋工具,不過此時的搜尋工具除了索引檔案外,已能檢索網頁。
當時,「機械人」一詞在程式設計者中十分流行。電腦「機械人」(computer robot)是指某個能以人類無法達到的速度不間斷地執行某項任務的軟體程式。由於專門用於檢索資訊的「機械人」程式象蜘蛛一樣在網路間爬來爬去,因此,搜尋引擎的「機械人」程式就被稱為「蜘蛛」程式。
搜尋引擎蜘蛛是什麼意思?
4樓:匿名使用者
夫唯學bai院裡面提過搜尋
du引擎蜘蛛,是自己研發的zhi乙個搜尋引dao擎抓取程式。它主要抓取互版
搜尋引擎蜘蛛的作用是什麼 10
5樓:
搜尋引擎蜘蛛,又稱網頁蜘蛛。
作用是抓取各個**上的內容。簡單來說,**上的內容如果要想被搜尋引擎收錄,就必須要經過網頁蜘蛛的索引。
什麼是搜尋引擎爬蟲,搜尋引擎和爬蟲的區別
搜尋引擎爬蟲指的是搜尋引擎用於自動抓取網頁的程式或者說叫機械人。這個就是從某乙個 為起點,去訪問,然後把網頁存回到資料庫中,如此不斷迴圈,一般認為搜尋引擎爬蟲都是沒鏈結爬行的,所以管他叫爬蟲。他只有開發搜尋引擎才會用到。我們做 只需有鏈結指向我們的網頁,爬蟲就會自動提取我們的網頁。搜尋引擎爬蟲 又被...
搜尋引擎英語怎麼翻譯,預設搜尋引擎用英文怎麼說
search engine search engine i think it is search engine. engines of search 預設搜尋引擎用英文怎麼說 滿意請採納喲 預設搜尋引擎 網路 default search engine 例句 指定要顯示的預設搜尋引擎。specifi...
國外有哪些搜尋引擎 常見的搜尋引擎有那些?
常見的搜尋引擎有那些?搜尋。360綜合搜尋,屬於元搜尋引擎,是搜尋引擎的一種,是通過乙個統一的使用者介面幫助使用者在多個搜尋引擎中選擇和利用合適的搜尋引擎來實現檢索操作,是對分布於網路的多種檢索工具的全域性控制機制。谷歌搜尋引擎是谷歌公司的主要產品,也是世界上最大的搜尋引擎之一,由兩名史丹福大學的理...