關於搜索引擎seo值得思考的幾個問題?

好吧,原來是在這裡寫說明的,操作框一直寫的是可選。

那我來問幾個問題,請各位大神回答一下。

一、抓取索引

1、搜索引擎的蜘蛛爬行策略是怎麼樣的!?

2、蜘蛛的索引策略又是怎麼樣的?

二、用戶檢索

當用戶發起檢索指令時,搜索引擎又是怎麼樣工作的呢?

三、演算法

在處理索引入庫的時候,就已經進行了排序的記錄,並且緩存好後,待用戶檢索輸出?還是在用戶檢索後,進行臨時排序?

來來來,見證你們牛逼的時刻到了,不要推三堵四、藏著掖著,你回答了,別人不一定可以看懂!OK?


這些問題如果深入到細節,非常繁瑣,諸如抓取策略,必是極多邏輯的複雜結合。其中會主要包括域名/IP/子域名的抓取配額,各網站甚至行業級別的調控,頁面級別的抓取優先順序、重訪規則等等等等。

探究它們的具體實現,難度較高,甚至其中部分可能在理論上,就無法通過網站上的最終結果,來反解搜索引擎本來的邏輯。不如僅稍了解大致的原理,從而猜測什麼做法可能有效,最終更多的關注於做什麼操作能有什麼效果,這般的效果指標。

至於這些問題的大概原理,認為屬於基礎常識範疇,討論是不必要的。針對這些個問題相對最適合的書籍可能是《這就是搜索引擎》。

-----------------

另,針對問題三,因為吳星的回答開始跑偏方向了,稍說明:

在處理索引入庫的時候,就已經進行了排序的記錄,並且緩存好後,待用戶檢索輸出?還是在用戶檢索後,進行臨時排序?

大型搜索引擎一定是結合前後兩者共存的。哪怕不看書,通過邏輯也能直接想明白這問題:

1. 用戶可能搜索以前從未有人搜索過的詞,所以不可能所有結果都來自於緩存;

2. 如果是臨時的排序,比如「價格」、「圖片」等常見詞,有對應的數以億計的網頁包含它們,以現今技術,在毫秒級的搜索時間內給數億個網頁從頭評分是不可能做到的。

至於一般情況下哪些屬於線下部分(比如緩存等)、哪些屬於線上部分(用戶查詢後才觸發計算),一些比較不錯的搜索引擎書籍裡面應該都有提到。

-----------------

我做了SEO六年多,這些搜索引擎書大多是在頭一年看的。SEO這行業,把太多搜索引擎的基礎常識當成高端技術了。這些年來,目光所及僅光年、ITSEO等少數圈子的理論知識整體上算是合格的,其他圈子的理論知識大多可以用不堪入目來形容,彼此共同的知識僅有一些行業名詞——其中很多還是靠百度站長平台普及的。

少瞎想,多看書。

說到這,知乎上還一直沒廣告過。痞子瑞的《SEO深度解析》第二版前幾個月已經出版,加入了我和其他一些SEO人員的合著內容。其中有些我寫的關於SEO學習的,可能不甚全面的見解,兩年多前寫的了。

利益不相關。合著者的稿費固定為每人二十本樣書,已結算。大家應該多是為了給這行業留些東西而寫的。


說多了,又要引起不必要的麻煩。

只講一點,搜索引擎排序可以人為修改,因此是在用戶檢索後,進行臨時排序

用問題作為查詢詞,證明沒有事先準備過

這是普羅大眾看到的百度搜索結果

這是隨便改個參數後的百度結果,這是 @zero 提供的 sort = pagerank

再用個人網站的百度站內搜索結果置頂,反正想看什麼結果,用什麼模板可以任意修改。 @路人甲


一、抓取索引

1、搜索引擎的蜘蛛爬行策略是怎麼樣的!?

//個人理解:搜索引擎蜘蛛爬行應該還是跟以前一樣順著a標籤爬,不過現在搜索引擎也會爬取寫在JS標籤裡面的http內容,google能夠很好的識別js,但百度還是沒能很好的對js裡面的鏈接進行識別,經常在日誌裡面看到百度爬取一些奇怪的鏈接。

2、蜘蛛的索引策略又是怎麼樣的?

//個人理解:Google還是一樣,不管什麼內容,先抓進它的庫里再說,百度的話是需要看網頁質量的,或者說需蜘蛛爬取很多次後才會收錄。

二、用戶檢索

當用戶發起檢索指令時,搜索引擎又是怎麼樣工作的呢?

//個人理解:搜索引擎在不同的地區有不同的緩存伺服器,這個是幾乎肯定了的。所以一般情況下我們查到的排名應該都是緩存,不過搜索引擎也會間隔一段時間刷新一下這些緩存,也就是更新排名。

三、演算法

在處理索引入庫的時候,就已經進行了排序的記錄,並且緩存好後,待用戶檢索輸出?還是在用戶檢索後,進行臨時排序?

//個人理解:入庫的時候可能會有一個簡單的判斷,如果網頁質量實在是太差,那就肯定進入底層庫。排名問題見上面第二點。


不要被BD牽著鼻子走啊……

要麼就本本份份做,要麼就上黑帽手段

看要走長線還是短線


Z大 你上當了 明明就是想從你這套點乾貨 又不好意思問 然而最終還是爆料乾貨了。。


一直覺著吳星回答的很有范

~


Z大竟然在這裡撕起來了(手滑)


搜索引擎蜘蛛爬行很簡單,就是模擬常規訪客網頁,URL樹形機構記錄返回數據。

蜘蛛索引策略:這個就不是我們「局外人」所能講清楚的了,但核心是圍繞用戶體驗!歷史數據、用戶體驗數據、認證數據、信譽數據、安全數據等.....


還是老套路,現在搞套流量兄弟,分分鐘排名第一


SEO是一個團隊行為,什麼索引,什麼演算法,其實說的再多,懂的再多,對結果幾乎沒影響。品牌的影響力遠比你琢磨這些邊邊角角的技術占的比重大千倍萬倍,提供有價值的內容,進而形成品牌,這才是seo的主要方向。這段時間很多網站的索引量都大幅下滑,還有很多人在採集做站,可是能有流量的有幾個,採集充其量就是碰運氣而已,因為以前內容少,採集就有流量的幾率大一些,現在內容多的百度都要大批刪除了,這時候採集就有流量的幾率很小了。


推薦閱讀:

這種seo手法專業術語叫什麼?
請問若需提高一批詞或者一批(類型)頁面的seo流量,有什麼思路或方法?
在 Google 上做搜索引擎優化 (SEO),你覺得最重要的是哪幾點?

TAG:搜索引擎優化SEO | 百度SEO | 谷歌SEO |