我們推出了 極客搜索 1.0
加盟極客邦科技已經四個多月了。很多關心我和極客邦的朋友最近常常詢問:
最近在忙什麼?(意思是這麼久了怎麼一點動靜沒有,到底行不行啊)
整合資源,研發產品什麼時候發布?(能不能做出來啊)正在快馬加鞭好,坐等(我倒要看看你什麼時候發)
今天就和大家說說我們新上線的一款副產品,極客搜索(極客搜索)。
這個產品的域名是:http://s.geekbang.org
極客邦科技最初是一家媒體加會議的公司,前身是 InfoQ 中國,我們產出的產品是 InfoQ 網站資源和各種技術大會、沙龍、社區活動。微信時代到來,InfoQ 中國也演進成了極客邦科技,我們依託微信平台推出了一系列公眾號,形成了極客邦的公眾號矩陣,在各個領域與我們的用戶建立連接和溝通,同時推出了直播節目「大咖說」和短視頻「二叉樹」,並積累了上百萬的用戶。這種業務布局可以實現業務的快速增長,帶來的問題是我們的用戶和資源是不統一的,散落在各個平台。我的職責就是去把這些珍珠串起來,整合成更有價值的鏈條,然後呈現給客戶。
做 極客搜索 的初衷其實是整合公司的資源庫,給我們另一個新產品所用。結果做的過程中,搜索慢慢形成了自己的特點。我想,乾脆做個 SideProject。
如前所述,產品一誕生,就會有自己的生命力,最終這個內部的資源庫項目,演化成了今天的「極客搜索」。
極客搜索
極客搜索是一款針對極客邦科技全站內容資源的輕量級搜索引擎,內容覆蓋了 InfoQ 中文站資源和極客邦旗下的公眾號矩陣,其中包括:InfoQ、AI、前線、大數據雜談、聊聊架構、移動開發前線、細說雲計算、前端之巔、高效開發運維、EGONetworks、StuQ、極客官舍、極客邦科技。
有了谷歌和百度,為什麼我們還要做一款垂直的極客搜索呢?
極客邦科技為用戶提供的主要服務之一就是生產高質量的泛技術化內容,隨著公司形態的變遷,這些內容散落在 InfoQ 中國網站和大量的微信公眾號內。
InfoQ 中國站的內容以國外技術文章翻譯和國內技術人原創為主,本身是提供了站內搜索的,但是網站的移動版並不盡如人意,研發和伺服器都在海外,訪問速度也是個問題。在互聯網時代,如果你的訪問速度超過3秒,就會損失掉一大部分沒有耐心和時間的用戶。
公眾號矩陣則從技術主題出發,生產更為專業和獨立領域的內容,與該領域的讀者建立連接通道。隨著技術知識的泛化和對技能全棧的要求,越來越多的技術人員需要了解更多領域的信息。如何打通隔閡建立一個快捷、方便和統一的通道呢?
特性
我們構建了極客搜索。它可以讓你快速、精準的觸達極客邦科技的所有內容資源。
- 快速:我們對極客邦科技的所有技術資源進行了索引,通過對前端和後端服務的優化,每次檢索時間在50毫秒以內,並以非常簡約的方式呈現給讀者。
- 長尾:挖掘技術文章的長尾效應,尤其是針對公眾號文章。大量的公眾號資源在發布三天以後就沉沒了,無論對作者還是讀者,這都是資源的極大浪費。
- 精準:如果你是一個懶人,直接在極客搜索的輸入框里鍵入你想要搜索的內容就可以了。如果你想走的更遠,我們提供了多緯度的搜索方式。我們實現了按照 InfoQ 中文站的主題搜索,按照公眾號的內容搜索和全站搜索。
舉例說明,如果你想搜索 InfoQ 中國網站的 AI 資源,點擊首頁下方的 AI 主題,進入搜索頁,在輸入框輸入深度學習,就可以找到 InfoQ 站 AI 主題下所有深度學習相關的文章。
如果你想搜索公眾號「InfoQ」的機器學習資源,點擊首頁下方的「InfoQ」圖標,進入搜索頁,在輸入框輸入機器學習,就可以找到「InfoQ」公眾號內所有機器學習相關的文章。
如果你想全站搜索 Python 和機器學習的文章,在首頁輸入「Python 機器學習」即可。
最後,我們把搜索結果按照類型進行了分類:新聞、文章、迷你書、演講和訪談。取你所需。
技術實現
產品的技術實現並不複雜,重要的是解決用戶的痛點,並構建輕量級的用戶體驗。系統的數據分析模塊根據網站的不同主題資源進行結構化和特徵抽取,結合公眾號資源的特徵,進行公眾號自動識別。數據採集模塊要處理歷史數據和新增數據,基於隊列機制,並根據特定的規則進行數據去重處理。同時我們要針對數據進行清洗,處理臟數據,保證數據質量,得到標準乾淨的數據,供存儲和呈現使用。
檢索系統採用了開源的 Elasticsearch,從近實時、可擴展、中文分詞、搜准率和授權率平衡、同義詞等幾個角度出發,對聚合結果按規則進行索引構建,並進行了部分同義詞調優。
展現層面使用了 vue2 + webpack 技術開發的單頁應用,打包時小圖片和圖標字體資源會被 webpack 編碼成 base64 代碼嵌入 CSS 里, 其他靜態資源會被 webpack 打上該文件的 hash 推送到 CDN 上。得益於輕巧高效的 vue2,極客搜索的響應和渲染速度相當快,幾十毫秒內就能完成一次請求和頁面渲染。
可愛的程序員
最後給我們的研發人員畫個像。負責極客搜索研發的是兩位工程師,一個叫濤哥,一個叫司令。倆人工作風格迥異。無論產品經理給濤哥提什麼需求,他的回答就兩個字「好的」,沒過一會就告訴你「做完了」。有時候提的需求比較多,產品經理老白會不好意思的說「這個不急哈,往後面放放也可以」。濤哥會說,「咦,這個很容易做啊」,一會又做完了。測試人員提 bug 的時候絮絮叨叨,結果 bug 還沒錄入測試系統,濤哥就會靦腆的說「那什麼,bug 已經修完了」。私下裡我們都叫他快手濤神。
司令就不一樣,每天皺著眉頭在座位上咔咔寫代碼,你去提需求的時候他總是一臉不高興「又要改?你們這幫產品啊,知不知道我壓力特別特別大」,有時候還會給你講一些產品實現的技術細節,搜准率啊,近實時啊,權重什麼的,講到一半會說「我知道怎麼改了」,沒過一會他就完成了 A 需求,還順手把 B 需求給做了。
這能怪誰呢?我們只好可勁給他們提需求了 —— 未來我們會為極客搜索接入更多第三方的高質量技術資源。
體驗一下快如閃電的極客搜索吧,我們的域名是:http://s.geekbang.org。
Mac 和 Windows 用戶請把它放到自己瀏覽器的收藏夾里,移動用戶可以這麼操作 —— 以 iOS 用戶為例:
在 Safari 里打開網址 http://s.geekbang.org,點擊分享,選擇「添加到主屏幕」:
點擊添加,極客搜索的圖標就會放到你的桌面上,下次使用直接打開即可。安卓手機類似操作。
這次隨著極客搜索上線的還有 極客邦科技官網 的更新,突出了極客邦科技為用戶提供的核心價值和知識社區屬性。
2017年的下半年,我們會陸續上線極客邦科技的新產品,包括軟體和內容。最終,我們會按計劃發布2017年技術社區的年度產品。
極客搜索 發布後,收到了大家非常多有價值的反饋。在1.0版本,我們力圖用 20% 的力量解決極客邦用戶 80% 的搜索需求。未來會逐步優化搜索結果,接入更優質的技術社區資源。
再給我們一些時間,謝謝。
推薦閱讀:
※搜狗要在美國上市?請問有多少營收來自莆田系醫院的墮胎收入?
※全球十大搜索引擎,你聽過幾個?
※Google 和 Baidu 常用的搜索技巧
TAG:搜索引擎 |