今天,我們聊聊如何找資料

最近,遇到很多找資料相關的活兒,但過程總感覺低效、雜亂。所以,想要自己整理一下這個流程,以提升後續的工作效率。也希望能夠與各位知友就一話題多多交流

找資料,這活往往被認為人人都能做、「體力活」,甚至「low」。但實際上,這是個技術活!你肯定試過,或者見過其他人「迷失」在資料中,花了很多時間,卻並沒有什麼結果,甚至忘了自己到底要找什麼。

OK,回歸正題。

找資料,可以分為4大步驟:明確目的→基於目的,梳理關注點→找→整理

為了方便敘述,我們以下面的這一場景作為例子:

【假設場景】:最近你需要做一個品牌推廣素材的眼動研究,以確定哪些元素有利於塑造品牌(並非品牌素材前測,而是希望能得到一些通用的原則)。但你不論對於素材測試還是眼動研究,都沒有了解。

| 步驟一:明確目的

即,你希望通過找的資料回答什麼問題。這很重要!很重要!很重要!

「做一個品牌推廣素材的眼動研究」,這裡有2個關鍵點:素材+眼動,而素材也可以理解為眼動研究的實驗材料。故,進一步拆解:

需要牢記:後續所有的工作,都必須是為了回答上述這些問題,別讓自己「迷失」在資料中。

| 步驟二:梳理關注點

圍繞上述的問題,我們需要進一步拆解到具體的維度。

1、明確的基礎信息,在不同資料應該得到一樣的解釋,如例子中眼動的指標。此類信息一般比較好找。例子中的眼動指標,可從區分為如下3個方面:

2、不同的資料,可能會得到不一樣的結果。如圍繞品牌素材的研究,不同的研究或因控制的變數不同,得到的結論是不同。但這些結論始終圍繞著某個特定的主題。這種資料比較難找。

到此,就已經得到比較明確的維度了,在找資料的時,我們就可以有的放矢了。

需要注意的是,要記錄好資料來源,一是在報告中需要註明來源,二是有可能需要返回去查詢資料。

但在某些場景下(譬如,對一個你完全陌生的領域),最開始我們可能根本就拆解不到維度,或者即便拆解,也是非常不準確的。這時該怎麼辦呢?

給自己限定一個時間(如,2個小時),通過百度、宏觀研究等,快速形成對這個領域的初步認知。然後再基於這個初步認知,梳理出需要關注的維度。這裡的關鍵是,限定時間!!!到了時間,必須停下來梳理,因為在找資料的過程中,資料會不同牽扯出資料。

| 步驟三:找資料

經過了上述2個步驟的梳理,我們終於進入了找資料的步驟了。

這一步驟,其實包括1、在哪裡找,2、如何找 兩個問題。

1、在哪裡找

這是一種資源的表現,需要我們在日常工作的過程中,不斷積累。(*注意管理好收藏夾哈)

如下是部分我個人用得比較多的網站,供參考。

互聯網相關的報告(綜合性)

? 互聯網數據中心-199IT | 發現數據的價值-199IT | 中文互聯網數據研究資訊中心-199IT

? 報告 | CBNData

? 今日報告網-最受歡迎的行業研究分析報告分享網站

行業數據

? 觀產業_產業資訊_產經資訊_產業分析_產業數據_行業資訊-中商情報網-中商情報網

? 外貿行業報告_最新外貿行業分析_跨境電商行業報告-敦煌網

app排名/下載等

? QuestMobile - 報告下載

? 七麥數據(原ASO100)- 專業移動推廣數據分析平台|ASO/ASM優化大師專家工具|App Store&Android榜單排行榜查詢官網

最近很火的小程序(榜單+市場+報告)

? 阿拉丁指數-首家小程序指數平台

? 文章 | 知曉程序

另外,知乎上也不少的文章/回答/話題,能找一些很有用的資源,譬如zhihu.com/question/2367

PS. 現在有不少網站(譬如前面提到199it)都推出了付費會員,找一個你認可的數據報告源,然後購買,可以節省不少找報告的時間。同時,也需要避免過分依賴某一個來源。

2、如何找

關鍵在於如何設置核心關鍵詞+衍生關鍵詞。譬如,「眼動」是一個核心關鍵詞(因為專業的名詞,故無衍生關鍵詞);而「品牌推廣」則有一些衍生關鍵詞,如「推廣」、「品牌」、「廣告」、「平面設計」、「包裝」等。

搜集資料的前期,建議使用核心關鍵詞,而在使用核心關鍵詞搜到的結果不夠準確或過少,又或者感覺已經差不多了,則可考慮更換衍生關鍵詞。

另外,有幾個注意事項:

a、基於目的,聚焦關注點。在找資料的過程中,如果出現了不在預設的關注點的信息,此時,句需要判斷「這些額外的資料對於達成目的是否有價值」,若有價值,就應該增加到關注點中;如果價值不大,那麼,在後續的查找中,就可以直接忽略。

b、邊找邊看,避免囤積。之前我找資料有個很不好的習慣,就是喜歡根據標題,把「相關」的資料都先下載下來,覺得搜索到差不多的時候,再一併看資料。這會降低效率:I)未能夠根據已有的資料,及時調整關鍵字,提高「找」的效率;II)僅根據標題下載,往往會有重複資料,增加了資料的整理成本)

| 步驟四:整理

這是最能體現個人思考的步驟,也是最容易被忽略的步驟。

在步驟三,我們將找到的資料,都填入到了「大表格」中了。但並不是說先完成步驟三,再進入步驟四,實際上,步驟三和四,可以理解為一個不斷迭代的過程。因此,需要設置一個周期,譬如半天,或者1天,就必須整理1次(步驟四)

在步驟4,需要重點關注如下幾個問題:

1、基於現階段的資料,已經回答了哪些問題?還有哪些需要補充的資料?

2、在找資料的過程中,是否發現了新的關注點?

3、基於已有的資料,對於業務有什麼啟示呢?

需注意,必須給找資料,限定一個「完成時間」,譬如2天。如果需要找的資料量實在比較大,就需要做好計劃,分為不同的資料模塊,並為每一個資料模塊分配好時間。

總的來說,關鍵在於:目的明確、及時整理、限定時間


推薦閱讀:

013【數據分析】利用Python進行數據分析 第二版 (2017) 中文筆記
魅族粉絲畫像:七成不滿30歲,男愛理財女愛學習
為什麼Kaggle對找工作有幫助?如何入門?
《與有8年健康醫療服務領域探索經歷的專業人士的討論》沈理然
大概是最全的數據分析平台整理了

TAG:資料搜集 | 互聯網數據分析 |