學會在數據中找出「黑馬」消費品牌,你也能秒變投資達人
文/數據俠 水瓜
品牌的出現並非無跡可尋,除了廣告的投放外,供應鏈、品質與服務、信任成本、資源優勢等參數,都能夠成為品牌出現的決定條件。來自華蓋資本的數據俠水瓜,就嘗試通過數據分析為「獨立大品牌」的出現機會構建一個通用的量化決策模型,並通過研究具體品類的特徵,總結出更加細分的「投資策略」,希望對大家有所啟發。
用大數據挖掘的方法,我們嘗試通過111個品類23個維度的數據為「獨立大品牌」的出現機會構建一個通用的量化決策模型(不同於以往的研究,我們不進行Case Study分析),去幫助我們在充分考慮當前產業特點和競爭環境的情況下,如何去判斷一個品類的獨立品牌機會,以及如何去發現背後的關鍵因素。我們通過邏輯回歸和隨機森林方法得到了不少有意思的結論,比如:
1. 廣告推廣是影響最大、顯著性最高的參數,沒有恰當廣告策略、沒有大量有效廣告覆蓋,幾乎很難成為品牌。
2. 在廣告的基礎之上,信任難度大、產品化程度高、供應鏈成熟的品類,出現品牌的機會更多
3. 需求變化或者技術進步導致某些因素的改變將非線性的改變一個品類的品牌機會,比如需求的產品化或者供應鏈的成熟
數據準備
為了盡量避免特徵選取過程中的主觀偏見和逆向選擇,我從產業結構、產業特點、產品和需求屬性、核心能力和競爭策略這5個角度選擇了23個最基礎的特徵維度,具體名字和解釋如下表所示。其中「是否有獨立大品牌」是我們本次研究的目標特徵。
(圖片說明:特徵維度選擇)
基於上圖,我們就可以對111個細分品類進行標註,最終形成如下圖的111*24的大表。
(圖片說明:品類及特徵數據,後台回復「大品牌特徵」,獲取清晰大圖)
分析方法
下圖是兩個模型對數據進行5次交叉驗證的結果(80%的數據訓練模型,20%的數據進行驗證,共5次)。
相對於隨機方法50%的正確率,線性回歸平均正確率87%,隨機森林平均正確率75%,可見本文的特徵選擇確實有助於我們提高判斷能力,品牌的出現也並非無跡可尋。
(圖片說明:演算法分類準確度,5次交叉驗證)
演算法結果及特徵分析
1 線性回歸
我們使用Stata對數據進行了線性回歸分析,得到結果如圖2所示。
(圖片說明:線性回歸結果及各參數相關性)
我們重點關注置信度大於90%(P>|t|小於10%)的參數:
+ 大規模廣告(正相關):廣告是相關度最高、顯著水平最高的參數,當然這裡說的廣告並不局限於傳統廣告,也包括社交網路等數字營銷。這一點有些出乎意料,但似乎又是最容易被忽略的一個事實:再好的產品也需要讓用戶知道、需要教育用戶、需要觸及用戶
+ 供應鏈成熟程度(正相關):供應鏈越成熟,出現品牌的機會越大。最典型的例子是傢具,設備和信息化技術的進步大幅提高了傢具定製化生產的效率,從而在極度分散的傢具市場中產生了尚品宅配、索菲亞等優秀企業。可以預見這個市場的集中度還會進一步提高。同樣的,隨著供應鏈的不斷成熟,手機、冰箱、洗衣機、電視機等行業的集中度已經得到了極大的提高。當然,供應鏈的成熟是一個與品牌成長相輔相成的過程,但這為我們尋找1到100的投資時點提供了線索。
+ 強供應鏈/強品質/強服務(正相關):都是為了用戶價值,建立情感連接。這個特徵其實囊括了本次研究並未具體提出的品牌定位等。
+ 信任成本(正相關):信任成本越高的品類,越有機會產生大品牌。比如汽車、家電、手機、奶粉等,建立信任的門檻高,也因此容易形成門檻。
+ 產品化程度(正相關):越能夠貼近用戶最終需求的產品,越容易形成品牌。比如食材很難形成大品牌,除了供應鏈的原因之外,還在於用戶最終端的需求是方便的遲到安全健康美味的食品。反之我們看到速食麵、火腿腸、速凍湯圓等品類由於能夠滿足用戶隨時果腹的需求,都產生了大品牌。從這一點看,國內即烹美食會有很大的品牌機會。
+ 歷史傳承、配方、IP(正相關):這是歷史和文化的沉澱,是品牌簡歷的重要因素。
+ 所屬上級行業是否有巨型公司(負相關):同行業的巨頭公司,不利於該行業細分市場獨立品牌的出現,除非你又不一樣的供應鏈(這一點下一節可以看到),比如電商、奶製品、零食行業等
+ 上遊資源優勢(負相關):需要上遊資源優勢的品類往往比較難在市場化的競爭環境下規模化,所以是顯著性最高的負相關參數。
其它參數雖然沒有足夠高的顯著性,但由於特徵之間並非完全正交獨立,可能導致其特徵權重被疊加到其它特徵之上。比如我們剔除大規模廣告特徵後再做一次線性回歸,「資本進入門檻/固定資產投入」的要重要性就凸顯出來了。
(圖片說明:剔除廣告特徵後的線性回歸結果)
2 隨機森林
通過線性回歸演算法我們可以看到單一特徵的重要性,那麼通過隨機森林構建決策樹,我們可以看到不同特徵參數之間的關係與互動。下圖是演算法的結果。
(圖片說明:隨機森林演算法結果,後台回復「大品牌特徵」,獲取清晰大圖)
在決策樹中,越上游的節點,包含信息量越大(對應格子中gini係數越大),比如特徵「大規模廣告」是所有特徵中信息量最大的。根據樣本是否滿足這個特徵(比如「大規模廣告<0.5」),樣本被分成左右兩個子集,基於同樣的過程,這兩個子集會分別被信息含量最高(或者分類效果最好的)特徵(比如左側子集的「強供應鏈/強品質/強服務」和右側子集的「信任成本」)的進行分類。這個分類過程將一直持續下去,直到最終的葉子節點只包含同一種類的樣本,那麼就形成圖4所示的決策樹。
我們可以得到如下一些觀察:
+ 如果滿足「大規模廣告」+「信任成本-高(>0.75)」,那麼這個品類基本上可以出現大品牌,除非「供應鏈成熟度差」+「供應鏈與上級品類的差異性小」+「資本進入門檻低」(典型如裝修行業),或者除非「所屬上級行業有巨型公司」+「供應鏈與上級品類差異小」(典型如飲料、零食行業)。
+ 「信任成本-中」的行業同樣有一定的機會品牌,但情況更加複雜,但總體看滿足「供應鏈與上級品類的差異性-高」、「功能性>個性的需求」、「有用歷史傳承、配方門檻、IP」將有助於品牌的建立
+ 而對於不滿足「大規模廣告」特徵的行業來說,品牌出現的機會會小很多,但仍然有一些轉機,如果品類滿足「強供應鏈/強品質/強服務」、「擁有歷史傳承、配方門檻、IP」、「供應鏈成熟度高」、「信任成本高」和「產品化程度高」中的一樣或者多樣條件
從單個特徵的角度來分析,兩個演算法結論基本一致,但隨機森林給了我們不一樣的分析視角。
投資啟示
回到我們研究的初衷,除了我們可以通過這些特徵維度對品類、品牌進行判斷之外,還能給我們投資方向的選擇帶來哪些啟發呢?
我覺得至少有兩點:
- 選擇1->100的機會。互聯網和科技類的投資更多是0->1,但品牌的建立永遠是1->100的過程,而某些特徵的改變將會加速這個過程,比如供應鏈的成熟(手機、家電)、產品化的加強(定製傢具)、資本進入門檻的提高(汽車)等等,都將為我們提供10->100的投資機會。
- 選擇逆境反轉、老樹新芽的機會。對於滿足 「擁有歷史傳承、配方門檻、IP」、「供應鏈成熟度高」、「信任成本高」和「產品化程度高」的品類和行業,如果加上合適的產品定位和廣告策略,有機會出現大的獨立品牌。比如王老吉/加多寶,比如白酒
具體品類分析
在上面一部分中我們並沒有把構建的決策模型用來測試任何具體品類,所以在下面的分析中,我們將把無人貨架、酸奶、沙拉、曲奇/糖果、堅果、果汁、酒類、化妝品/洗護用品、傢具、服飾/鞋、3C電器這11個品類各23個維度的數據的數據應用到我們建立的邏輯回歸模型中,來看看它們的獨立品類機會和背後的原因(我們並沒有選擇任何有品類特殊色彩的維度,主要是為了構建的模型具備更好的通用性,當然同時也會犧牲一些準確度)。
總體上我們可以得到三類結論,同時也能得到三類投資策略:
1. 基本無機會:如無人貨架、酸奶、沙拉、曲奇/糖果、果汁這5個品類。
2. 存在較大機會:如化妝品/洗護用品、服飾/鞋、3C電器這3個品類,但競爭也最為激烈
3. 存在條件機會:如堅果、酒類和傢具這個3個品類,獨立品牌的出現需要某些行業條件
測試數據準備
如下圖所示,我們按照之前的數據維度和同樣的標準,列出了無人貨架、酸奶、沙拉、曲奇/糖果、堅果、果汁、酒類、化妝品/洗護用品、傢具、服飾/鞋、3C電器這11個品類的數據。為了看到一些核心參數變化對結果的影響,我們為每個品類準備了三組數據:
第一組數據反應了基礎的行業特性、競爭格局和競爭策略,但是並沒有大規模廣告(因為廣告是最重要的維度之一)。
第二組數據在第一組數據的基礎上加入了大規模廣告策略的影響,以及部分參數的提高(比如品質/供應鏈/服務等),以反映在品質或服務上的特殊提高。
第三組數據在第二組數據的基礎上進一步加強了競爭策略的假設(比如線下渠道和線上渠道策略的加強),但更重要的是我們也反映了某些行業參數和需求的變化,比如產品化程度、供應鏈成熟程度、IP等等,我們可以看到這些參數的變化對品牌成功概率的影響。
(圖片說明:11個品類的測試數據)
測試結果
下圖第二列是我們通過線性回歸模型得到的「概率」,概率越大反應該品類出現獨立大品牌的機會越大。我們將75%的概率設定為「成功出現獨立品牌」的判斷標準(畢竟隨機判斷得到概率是50%,所以不能用50%作為判斷的準則),並將其用紅色標註了出來。
(圖片說明:測試結果,11個品類的獨立品牌機會)
通過對結果的分析,我們可以將我們的測試結果分為三類:
1. 基本無機會:無人貨架、酸奶、沙拉、曲奇/糖果、果汁這幾個品類出現獨立大品牌的機會很小,即便是在廣告、渠道、服務等方面做到很好;所以這些品類要麼是巨頭的戰場,要麼被分散的渠道把控:
+ 無人貨架:無人貨架是最近最火熱的品類之一了,在幾乎沒人看好其競爭格局的情況下,依然有大量資金看好其在終端連接消費者的能力。從我們的3組測試結果來看,無人貨架品牌突圍的機會堪憂,主要還是因為過低的競爭門檻和不利的行業格局。
+ 酸奶:在3組數據下酸奶的獨立品牌機會都未超過我們設定的門檻,其核心問題還是行業存在乳業巨頭公司,同時供應鏈和上遊資源也存在一定瓶頸。
+ 沙拉:沙拉麵臨更加複雜的品牌挑戰,無人貨架存在的問題以及酸奶存在的問題沙拉都有,即便是在沒有行業巨頭的情況下,沙拉 3組數據的測試結果都未達到品牌門檻。
+ 曲奇/糖果:面臨和酸奶類似的問題,在供應鏈上略有優勢,核心的問題是未生逢其時,行業已存在巨頭公司(技術和模式顛覆並不在本文所考慮範圍之內)。
+ 果汁/飲料:面臨和沙拉類似的問題,雖然供應鏈相比之下更加成熟,但行業已存在大型公司
2. 存在較大機會:在產品和定位沒有問題的情況下,化妝品/洗護用品、服飾/鞋、3C電器這3個品類最容易出現獨立品牌,即便行業已經有大型公司、即便沒有大規模廣告的協助下依然存在相當的機會,這與一定的進入門檻、成熟的產業鏈、產品化的需求、較高的信任門檻不無關係。但是由於獨立品牌和行業巨頭基本在同一起跑線上,所以面臨非常激烈的行業競爭。
3. 存在條件機會:堅果、酒類和傢具品類在廣告的協助下,還需要一些因素的輔助才有出現獨立大品牌的更大可能:
+ 比如堅果品牌的出現關鍵在於行業沒有出現過大品牌,這點是堅果與曲奇/糖果最大的區別(提升11%概率,雖然只是幫助堅果略微高於75%的門檻)。
+ 酒類新獨立品牌的出現最好有歷史傳承或者IP的輔助(提高20%概率),所以老酒廠發新芽的機會遠大於純粹的新品牌。江小白是否能成功現在還很難看清楚,但它確實在IP化方面做得不錯。
+ 而傢具品牌出現的關鍵在於更加產品化和生產效率的提升(共提高40+%概率,比如定製傢具和對應的模塊化生產技術)。
投資啟示
面對這三類結果,我們能得到哪些投資思考?無機會的品類就不適合投資,或者有機會的品類就一定適合投資?
我倒是認為這三種品類都有投資機會,但適合不同的階段和不同的投資策略。
第一類「基本無機會」的品類更適合產業投資者。
這其中比較特殊的產業投資者其實是美元基金,因為他們作為早期互聯網產業的推動者,已享受到了中國互聯網發展帶來的紅利,也與互聯網產業有著特殊的聯繫,所以他們敢為了潛在的價值和想像空間投類似「無人貨架」的品類,這是因為美元基金有特殊的產業聯繫和安全感,而正是所有人民幣基金所缺失的。
第二類「存在較大機會」的品類更適合早期投資和二級市場。
品類的機會並不代表個體公司的機會,由於競爭激烈,該類公司的成功概率其實並不高,所以適合早期投資人進行系統布局;反之也適合在品牌初步建立之後,通過後期投資甚至二級市場投資獲得公司規模擴張的收益。
第三類「存在條件機會」的品類需要獨特的眼光和產業理解。
這類行業非常適合快速成長,又需要建立差異化能力的新基金。我個人也更加喜歡這類投資機會,因為有一定的判斷門檻,同時在研究清楚後能夠得到足夠多的確定性,這一點也正好在最近完成的幾個項目中得到了很好的實踐,有機會再和大家分享。
最後,需要聲明的是本文所用的數據以及模型參數的選擇都存在一定主觀判斷,所以得到的結論肯定會有所偏差;另外本文所有得出的判斷本質上只是一個概率,並不意味概率小就一定沒有品牌機會。
但如果我們建立的決策框架能從某些方面幫助我們思考亦或帶來一些啟發,那麼創作這篇文章的初衷也算是實現了。
注里寫:本文根據數據俠水瓜發布在水小瓜投資筆記(ID:guaxiaoshui)的文章《深度消費:111個品類 * 23個維度,大數據挖掘揭示如何成為大品牌 | 投資瓜》,《深度消費:大數據量化11個品牌機會與3類投資策略 | 投資瓜》編輯整合而成,已獲作者授權。本文僅為作者觀點,不代表DT財經立場。
編輯 | 趙楠
題圖 | 視覺中國
期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。
數據俠門派
本文數據俠水瓜,華蓋資本TMT基金副總裁,主要關注電商/零售/消費,大數據/Fintech/企業服務。
加入數據俠
「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。
推薦閱讀:
※他人消費習慣對你的影響,遠比你想像中要大
※有哪些一線品牌的低端產品讓你購買之後後悔?
※雖然你賺得少了,但是花得多了呀
※大小馬壕聯手搞事情,這下我要發了……
※日本消費考察隨想