當(dāng)前位置: 首頁 > 設(shè)計知識 > 企業(yè)官網(wǎng)設(shè)計 > 搜索引擎是如何工作的
簡單來說,搜索引擎是由網(wǎng)絡(luò)爬蟲、索引數(shù)據(jù)庫、其他輔助程序和搜索結(jié)果顯示頁面組成的。搜索引擎首先會排除能夠從網(wǎng)絡(luò)上自動搜集信息的搜索引擎蜘蛛(spider),通過互聯(lián)網(wǎng)之間的URL鏈接來獲取到網(wǎng)頁的內(nèi)容,接著,搜索引擎會把找到的這些信息帶回數(shù)據(jù)服務(wù)器,由分析索引系統(tǒng)對搜集廣州網(wǎng)站設(shè)計回來的信息進行分析處理,例如提取url、提取頁面編碼、獲取網(wǎng)頁各項內(nèi)容和頁面生成時間等。搜索引擎根據(jù)大量的相關(guān)度算法對這些網(wǎng)頁進行計算,得出網(wǎng)頁與關(guān)鍵詞之間的相關(guān)度,在將得到的結(jié)果進行分類、消重、清除SPAM(搜索引擎垃圾網(wǎng)頁)等一系列的工作后,搜索引擎會把這些信息錄入到索引數(shù)據(jù)庫中。當(dāng)用戶進行相關(guān)關(guān)鍵詞的查詢時,搜索引擎會從索引數(shù)據(jù)庫中找到最匹配的信息,反饋給用戶。在這個工程中,大部分工作是由計算機程序完成的,只有在處理一些特殊數(shù)據(jù)的時候,才會采取人工干預(yù)手段。如果要優(yōu)化好這樣百度指數(shù)高的關(guān)鍵詞,就要多做工作了哦。
什么是搜索引擎蜘蛛(spider)
? ?? ???把互聯(lián)網(wǎng)看做是一個蜘蛛網(wǎng),那么spider就是在網(wǎng)上爬來爬去的蜘蛛。網(wǎng)絡(luò)蜘蛛是通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從某一頁面開始,讀取網(wǎng)頁的內(nèi)容,然后找到其他頁面,一直循環(huán)下去,知道抓取完所有頁面信息。
? ?? ???簡單介紹一下蜘蛛在網(wǎng)站上采集內(nèi)容的過程。
? ?? ???1、檢查網(wǎng)頁是不是有過更新。蜘蛛會和服務(wù)器上的快照相比,如果不同,就抓取新的內(nèi)容頁面,將其帶到搜索引擎的數(shù)據(jù)庫,并更新原來的網(wǎng)頁快照。
? ?? ???2、如果是新網(wǎng)頁,蜘蛛不但要抓取網(wǎng)頁的內(nèi)容,還要將URL帶到搜索引擎數(shù)據(jù)庫。
? ?? ???3、經(jīng)過數(shù)據(jù)處理,將蜘蛛帶回來的數(shù)據(jù)建立新的網(wǎng)頁索引,并按照與關(guān)鍵詞的相關(guān)排序
版權(quán)聲明:以上文章信息來源于網(wǎng)絡(luò),等僅代表原作者本人的觀點。除了已經(jīng)標(biāo)注原創(chuàng)的文章外,其它文章版權(quán)和文責(zé)屬于原作者。文章中出現(xiàn)的商標(biāo)、專利和其他版權(quán)所有的信息,其版權(quán)屬于其合法持有人。對可以提供充分證據(jù)的侵權(quán)信息, 我們將在確認(rèn)后的1小時內(nèi)刪除。
本網(wǎng)站之聲明以及其修改權(quán)、更新權(quán)和最終解釋權(quán)均屬廣州古柏廣告策劃有限公司所有。
掃一掃關(guān)注古柏
GOOBAI AD.
Brand Whole Case Design
4000-882-993
trdesktopweb.com
微信加好友咨詢
廣州古柏廣告策劃有限公司
地址:廣州市天河區(qū)東圃長盛商務(wù)大廈B213-215
Copyright?2004-2020 GOOBAI Inc.All rights reserved
粵公網(wǎng)安備: 44010602001481號
備案號:粵ICP備09222445號
與古柏對話
關(guān)注古柏