R語言簡單數據分析-朝陽醫院2016年銷售數據

一、初始數據與分析目標

  • excel表格數據

  • 分析目標: 月均消費次數、月均消費金額、客單價、消費趨勢

二、數據準備工作

  • 導入數據(使用了readxl包導入)

#讀取表格數據nlibrary(readxl)nCY2016_sales <- read_excel("E:/lutao/Documents/CS/3/2016 sales.xlsx")nView(CY2016_sales)n

  • 導入後的數據

  • 對導入後的數據做預處理

#重命名列名nnames(CY2016_sales)<-c("date","cardNO.","drugID","drugNAMES","saleNO.","virtualmoney","actualmoney")n#缺失數據處理nCY2016_sales<-CY2016_sales[!is.na(CY2016_sales$date),]n#處理日期nlibrary(stringr)ndatesplit<-str_split_fixed(CY2016_sales$date," ",n=2)nCY2016_sales$date<-datesplit[,1]n#字元串轉換成日期格式nCY2016_sales$date<-as.Date(CY2016_sales$date,"%Y-%m-%d")nclass(CY2016_sales$date)n#數據類型轉換nCY2016_sales$saleNO.<-as.numeric(CY2016_sales$saleNO.)nCY2016_sales$virtualmoney<-as.numeric(CY2016_sales$virtualmoney)nCY2016_sales$actualmoney<-as.numeric(CY2016_sales$actualmoney)n#對數據進行按照銷售時間的升序排序nCY2016_sales<-CY2016_sales[order(CY2016_sales$date),]n

三、簡單數據分析

1.月均消費次數(得出結果是[1] 899.6667)

#去掉一天內的重複消費nkpi1<-CY2016_sales[!duplicated(CY2016_sales[,c("date","cardNO.")]),]n#總消費次數nconsumerNO.<-nrow(kpi1)n#總消費區間nstarttime<-kpi1$date[1]nendtime<-kpi1$date[nrow(kpi1)]n#總天數nday<-endtime-starttimen#總消費月數nday<-as.numeric(day)nmonth<- day%/%30nmonthn#月均消費次數nmonthconsumer<-consumerNO./monthnmonthconsumern

2.月均消費金額(得出結果是[1] 50771.71)

#月均消費金額ntotalmoney<-sum(CY2016_sales$actualmoney,na.rm = TRUE)nmonthmoney<-totalmoney/monthnmonthmoneyn

3.客單價(得出結果是[1] 56.43391)

#客單價npct<-totalmoney/consumerNO.npctn

4.消費趨勢

銷售金額隨時間的變化趨勢,以金額為Y軸,時間為X軸繪製圖形

#各周消費總額分組nweek<-tapply(CY2016_sales$actualmoney,format(CY2016_sales$date,"%Y-%U"),sum)nweek<-as.data.frame.table(week)nnames(week)<-c("time","actualmoney")nweeknweek$time<-as.character(week$time)nweek$timenumber<-c(1:nrow(week))nweekn#繪製圖形nplot(week$timenumber,week$actualmoney,n xlab = "時間:年份-第幾周",n ylab="消費金額",n xaxt="n",n main="2016年朝陽醫院消費曲線",n col="green",n type="b")naxis(1,at=week$timeumber,labels=week$time,cex.axis=1.5)n

四、小結

  1. 跟著做這個例子的時候主要出現了2個錯誤:
  • day不為數值型變數,所以不能被除,使用day<-as.numeric(day)命令解決

  • 誤吧labels=week$time寫成lables=。。。,出來的圖像和例子有些差別,這個反覆看了多遍才找出來這個問題,給跪~~

  • 獨立使用函數還有些困難,需要查找外部資料,後面還需要多用案例練手,加強解決問題的能力。

推薦閱讀:

第三關:簡單的數據處理
做個數據分析,都是愛你的形狀
如何買賣「椰子鞋」最划算?大數據揭秘潮鞋江湖
從零學數據分析-簡單數據處理與分析
Excel如何使用數據透視表進行「中國式」排名

TAG:R编程语言 | 数据分析 |