第三關:奸商的一個小目標
但是意猶未盡,感覺不過癮。這個醫院這麼好的數據為啥不再好好利用利用呢?
於是我給自己又設置了一個身份:假設我是奸商
從一個醫藥奸商最本能的角度出發:我怎麼才能夠從這些數據中找到最賺錢的那種葯呢?
以及,怎麼才能找到買葯最多的那一部分人呢?
於是這個奸商就利用自己所學的一點數據分析技術,開始了他的挖寶之旅....
#新任務1,哪個月份什麼藥物賣的好#比如一月份timeSplit2<-str_split_fixed(excelData1$購葯時間,"-",3)excelData1$購葯時間<-timeSplit2[,2]
從事實出發的話,你可能說直接就分析全年的數據,這樣的話大而不當。
就像中 國 人的平均收入一樣會鬧笑話的!
所以我的出發點就是按照每個月份來分析。這樣的話,分析出來的結果更接近於現實
所以我就先從一月份開始。
把購葯時間這一列用「-」分成三節,取其中的第二節
#找出所有為1月份的數據month_a<- excelData1[excelData1$購葯時間=="01",]#把每一種葯都算出總價格然後用as.data.frame.table這種數據框形式#賦值給「價格1」price1<- as.data.frame.table(tapply(excelData$實收金額,list(excelData$商品名稱 ),sum))
在猴子老師的演示代碼里是按照日期進行分類處理的,但是如何按照其他的形式進行分組不知道!
我很是苦惱了一陣子,中間走了好多彎路。
下面不怕笑話,給你演示一下我的彎路,
#版本1藥品1<- tapply(excelData1$實收金額,excelData1$商品名稱=="G降壓片(6盒/療程)", sum)藥品3<- tapply(excelData1$實收金額,excelData1$商品名稱=="硝苯地平控釋片(拜新同)", sum)藥品2<- tapply(excelData1$實收金額,excelData1$商品名稱=="x氯沙坦鉀片(科素亞)",sum)藥品4<- tapply(excelData1$實收金額,excelData1$商品名稱=="苯磺酸氨氯地平片(絡活喜)", sum)藥品5<- tapply(excelData1$實收金額,excelData1$商品名稱=="非洛地平緩釋片(波依定)", sum)#版本1,由於學的還不多就用笨辦法吧,先來5個藥品1<- month_a[month_a$商品名稱=="G降壓片(6盒/療程)",]價格1<- sum(藥品1[, c(7)])藥品2<- month_a[month_a$商品名稱=="x氯沙坦鉀片(科素亞)",]價格2<- sum(藥品2[, c(7)])藥品3<- month_a[month_a$商品名稱=="硝苯地平控釋片(拜新同)",]價格3<- sum(藥品3[, c(7)])藥品4<- month_a[month_a$商品名稱=="苯磺酸氨氯地平片(絡活喜)",]價格4<- sum(藥品4[, c(7)])藥品5<- month_a[month_a$商品名稱=="非洛地平緩釋片(波依定)",]價格5<- sum(藥品5[, c(7)])#將以上這些價格放到名為w的數據框內w<- data.frame(價格1,價格2,價格3,價格4,價格5)#行列翻轉w<- t(w)#放到數據框里,才能命名w<- data.frame(w)#命名names(w)<-c("v")#排序過之後取的名字不能和元數據相同w1<- w[order(w$v),]#畫點圖plot(w1)
畫出來的圖是這個樣子的
建值不忍直視......後來把PDF的R語言實戰轉化成了word形式,直接檢索tapply。在最後幾章中找到了tapply函數的例子。才知道具體分類的話應該用list()
哈哈,好高興。
#改行名names(price1)<- c("name1","price_z")#排序,保留前十名的觀測(行)attach(price1)price1<-price1[order(-price_z),]price1<-price1[10:1,]detach(price1)#用barplot畫圖par(mar=c(5,8,4,2))par(las=2)barplot(price1$price_z,names.arg = price1$name1, horiz=TRUE, cex.names=0.9, col=brewer.pal(10, "Set1"))
畫出來的圖是這個樣子的
最為一個奸商我感覺這才像點樣子嗎!好了,我們現在差不多都把一月份前十的銷量都分析出來了。
這說明了什麼?
說明在一月份這個時間段,心臟病,高血壓多發嗎!
如果我是一家醫藥公司,那麼第一步我要首先在上游市場上,多多爭取這些明星藥品的進貨量。其他的藥品能放棄就都放棄吧。
第二,在不同的時間段(比如一月份,二月份等等)內,針對不同的發病高峰,進行精準的營銷。由於放棄了其他的低銷量藥品,我就更有可能通過價格手段,來佔領這些最賺錢的渠道。
第三,我不但能夠根據不同的月份,我還能根據不同的人(這一數據分析其實跟月份的分析差不多,這裡不再重複)把消費最高的前20%的病人的資料都搜集起來,把他們最常賣的葯也都分析出來(同上)。針對不同的人,進行更加精準的個人營銷!
當然,我沒有接觸到醫藥行業,也沒有什麼實戰經驗。什麼葯好賣什麼不好賣,相信這個行業的從業者心裡都是有數的。
但是我只是拋磚引玉而已,不單單這一個行業,其他的行業也同樣適用。
我用更加先進的工具,做出來的事情效率肯定更高,效果一定更好!
推薦閱讀: