Kindle是否值得包月
花了三天三夜,從亞馬遜網站上爬去了所有的Kindle Unlimited電子書,分析是否值得每年花118元購買Kindle的包月服務。 Kindle電子書分類有頂層分類的子分類,比如「小說」→「偵探、推理、懸疑小說」。按照子分類,將獲得的電子書存到不同的csv文件,獲取的信息包括電子書在亞馬遜的唯一ID,頂層分類,子分類,書名,評論數,評分,非包月價格,出版時間等。一共獲取405個csv文件,即所有電子書有405個子分類。 為了分析方便,在分析前,對405個文件進行了合併。
一共抓取了119909本電子書,但實際電子書並沒有這麼多。在網站顯示一共是70000+本。出現這個問題的原因是有些電子書會有不同的標籤,在數據集中會重複出現。
刪除重複項後,一共是67618本電子書,與網頁顯示的73000+依然存在差距,原因是:
1. 某個標籤下的實際電子書與標籤旁顯示的數量有差距;
2. 網站有400頁的顯示限制,因此某個標籤下的電子書超過6400(16×400)時,只能獲得6400條數據。
電子書分布情況
在數量上,居前三位的分別是小說,進口原版和文學。對於文學青年和英語學習者來說,這是一個好消息。
在出版時間上,Kindle Unliimited提供的大部分電子書是2000年以後出版的,特別是2014和2015年,出版的電子書最多。所以從時間上來看,Kindle Unliimited提供的電子書還是比較新。
但是在電子書的評分上,似乎不太盡如人意。從分布上看,在67618本電子書從,近4000本電子書的評分是0,也就是說這40000本電子書看的人很少,或者根本就沒人看。這可能有兩個原因1. 這40000本電子書的質量很差,幾乎無人問津;
2. 這40000本電子書是冷門或者偏門書,讀者更喜歡讀熱門或者暢銷書。
電子書的篩選
雖然有20000+本電子書評分不為0,但也存在讀的人少,而給出高分的情況。在這種情況下,只能代表個別讀者的喜好,不能反映這本書的實際情況。因此設定篩選條件,評論數>100,評分>4,一共得到1287本電子書。
這1287本電子書中,小說和文學的佔比仍然很高,總數超過550,即使一天讀一本書的牛人,也能看一年。
但是在出版時間上,分布情況稍微有點變化。在符合條件的電子書中,2012和2013年出版的電子書數量最多。2000年以前出版的書,在讀者中的反饋沒有2000年以後出版的書反饋好。這個時間的分布對於文學類書籍影響不大,但是如果想追求最新的技術,這個不是很好的選擇。
Kindle Unlimited是否划算
抱著書到用時方恨少的原則,暫時認為這些書都可能看,看看包月服務的投資回報如何。因為討論的是電子書,購買Kindle屬於沉沒成本,不在這裡考慮。
篩選後,電子書的平均價格是5.88元,如圖中藍色線,其他四條線從下往上,分別是每個月讀1本,2本,3本和4本。從圖中可以看出,如果每個月讀兩本書,包月服務比單獨買書划算。
上圖是我比較感興趣的幾類書的價格箱形圖。計算機類的平均價格最高,進口原版的價格相對其他更集中,勵志成功,少兒,心理學的平均價格最低。
計算機與互聯網類電子書,平均價格最高,包月服務是最划算的。 勵志與成功,少兒和心理學,平均價格最低,每個月如果能讀三本以上,可以考慮包月。 其他幾類,如果每個月讀兩本以上,可以包月。
結論
- Kindle Unlimited提供的書籍在整個電子書中佔13%左右;
- Kindle Unlimited提供的電子書,超過一半的評分和評論數量都為0,電子書的質量並不是很好;
- Kindle Unlimited提供的電子書,大多是近三年出版的書,在時效性上還可以接受。但是如果追求最新最熱的暢銷書,可以忽略包月;
- 如果每個月讀兩本以上的書,包月比單獨購買划算。
- 如果是以讀小說,讀英文原版,讀兒童書籍,除非以學術研究為主,否則強烈建議包月。
Talbeu Public上的可視化鏈接
推薦閱讀:
※銷售運營管理業務應用案例--如何應用Excel創建會講故事的銷售漏斗分析儀
※吉利帝豪GS--車主洞察研究
※Python學習(二)
※零基礎學習Python數據分析:科學計算庫NumPy(2)
TAG:數據分析 |