搜索引擎如何顯示搜索結(jié)果? 以下是搜索引擎工作原理的快速說明。 從創(chuàng)建網(wǎng)站到出現(xiàn)在搜索結(jié)果中,有三個主要步驟。 參考資料:Google 搜索的工作原理(適合初學(xué)者) | Google 搜索中心 | Google Developers 小型企業(yè)需要 SEO 嗎? 專業(yè)人士暢談如何吸引客戶和對沖風(fēng)險
步驟 1. “爬網(wǎng)”以收集網(wǎng)站上的信息
一種稱為爬蟲的搜索機器人會抓取 Internet 上的每個頁面并獲取信息。 這種巡邏操作稱為 “偽裝”。 爬蟲有效地跟蹤從一個頁面到另一個頁面的鏈接,等等。 但是,據(jù)說互聯(lián)網(wǎng)上每天都會創(chuàng)建數(shù)十億個頁面,而且頁面數(shù)量巨大。 因此,不值得抓取的頁面可能無法檢索到信息。 此外,僅僅通過創(chuàng)建一個網(wǎng)站,爬蟲將無法找到它并在未經(jīng)許可的情況下對其進行巡邏。 您網(wǎng)站中的每個頁面也應(yīng)該易于抓取。
使爬網(wǎng)更輕松的措施示例
- 創(chuàng)建 XML 站點地圖 (sitemap.xml),這是搜索引擎的站點地圖 - 安裝面包屑 - 創(chuàng)建吸引來自外部站點鏈接的高質(zhì)量內(nèi)容
第 2 步:“索引”以在數(shù)據(jù)庫中存儲信息
如果爬蟲只是收集信息,則不會顯示在搜索結(jié)果中。 爬網(wǎng)程序收集的信息被組織并存儲在數(shù)據(jù)庫中。 存儲在此數(shù)據(jù)庫中的工作稱為索引。 因為它不僅收集信息,而且還組織和存儲信息,所以索引往往需要更長的時間。 此外,并非所有信息都已注冊,并且由于“已存在相同的內(nèi)容”或“內(nèi)容很薄”等原因可能不會被索引。
簡化索引編制的措施示例
- 具有文檔結(jié)構(gòu)的純內(nèi)容(標題、h 標簽、正文) - 檢查重復(fù)頁面 - 發(fā)布原始信息
第 3 步:“評分”,將數(shù)據(jù)與用戶搜索的關(guān)鍵字進行比較
用戶搜索的關(guān)鍵字將與索引信息進行比較,進行評分,并顯示在搜索結(jié)果中。 評分的過程稱為 “評分”,評分規(guī)則稱為 “算法”。 據(jù)說算法每天都在變化。 參考:什么是質(zhì)量得分? 解釋改進的好處和提高的三點
確保良好評分的措施示例
?根據(jù)主題提供內(nèi)容 ?為用戶提供原創(chuàng)和有價值的內(nèi)容