我打算做一些東西來幫助消化知乎
為了對這些問題的答案進行數理分析,我希望獲得類似這種效果:
我嘗試了多種方法,但是總體來說都很麻煩。
比如,我嘗試通過網頁採集工具來獲取回答的關鍵信息及正文,試圖對答案進行分析。這種方法對答案中的HTML代碼處理較麻煩,主要是圖片和鏈接的有關代碼,還需要進一步完善。這個方案的目標是能夠獲取到非常精簡的純文字版本,便於列印閱讀或編程分析。
比如,我嘗試通過調整頁面顯示方法,使之僅呈現出答案正文相關的部分,但是能正確顯示圖片、鏈接及其他頁面元素,這樣可以在瀏覽器上清爽的閱讀,或者簡單的複製粘貼到word等文本編輯器中列印。這個方案的目標是能夠獲取顯示正確、信息完整的答案內容,用於列印或在顯示器上閱讀,在信息不丟失的前提下盡量減少其他不必要的元素,減少列印成本和方便在顯示器上閱讀。
對於上面提到的第二類嘗試,目前我找到的一個較為便捷的方法。如下:
首先,進入以時間排序的頁面。方法是在單獨的問題頁面網址後面添加 "sort=created"。例如:https://www.zhihu.com/question/20395761?sort=created
然後,使用瀏覽器的ABP插件,針對知乎域名添加過濾規則如下:
##div.zu-top
##div.zh-footer
##div.zu-main-sidebar
##a.zm-item-link-avatar
##div.zh-question-answer-form-wrap
##meta.viewport
##div.zm-votebar
例如:
如果希望連問題段落也屏蔽掉,可以再增加幾行過濾規則:
##div.zm-tag-editor
##div#zh-question-title
##div#zh-question-detail
##div.zh-answers-title
##div.zm-item-meta
這樣就能獲得類似本文開頭的圖片那樣的瀏覽效果——一個僅顯示答案正文的頁面。甚至你還可以更進一步的,再添加幾行過濾規則:
##div.question-page-pager
##div#zh-question-collapsed-link
##div.zh-backtotop
##div#zh-footer
##button.FeedbackButton-button-3waL
你能夠獲得一個簡潔得要命的頁面,可以直接列印,也可以ctrl+A選中全頁面元素複製到文本編輯器中。
當然,這個方案目前也還存在一些不夠完美的地方。比如:
無法調整CSS樣式單使得僅顯示答案正文的頁面寬度充滿屏幕(這樣可以減少滾屏充分佔滿屏幕)
無法設置每個頁面顯示答案的個數(這樣可以增加頁面長度減少頁面讀取次數便於一次複製性粘貼更多的答案)
等等。
如果你知道怎麼調整優化,請給我留言。
推薦閱讀:
※知乎知影:解決人生的第二大難題,提升生活品質 18.3%
※知乎的「優質回答」中,哪些是有較大錯誤卻依然受捧而未被摺疊的?
※知乎大V面對的人性挑戰
※知乎各領域的大V都有誰?
※知乎在運營和體驗上有哪些不足?怎樣可以做得更好?