雲課堂Excel課程數據可視化分析

我一直是網易雲課堂的重度用戶,從大二開始就一直在上面學習各種技能類課程,作為互聯網在線教育的知名品牌,雲課堂在某種程度上彌補了我們從校園到職場過渡過程中,很多技能類知識不足的缺口。

今天這一篇是接著上一篇雲課堂Excel課程板塊爬蟲數據進行多角度的可視化分析,上次的爬蟲一共爬取了425條課程信息,一共提取了9個欄位。

英文欄位名稱 中文含義 類型productId 課程ID 定性productName 課程名稱 定性lectorName 教師名稱 定性provider 發布機構 定性learnerCount 學習人數 數值discountPrice 折扣價 數值discountRate 折扣率 數值originalPrice 原始價格 數值score 評分 數值scoreLevel 評分等級 數值description 課程描述 定性

以上是本次爬取的欄位描述,按照這些欄位屬性,結合我個人的需求以及雲課堂的課程評價體系,我將本次分析的目標及思路梳理如下:

課程來源分析

  • 課程來源
  • 作者貢獻數

課程內容分析

  • 高頻技能需求

課程價格分析

  • 折扣率分析
  • 均價

課程知名度分析

  • 用戶數分析

課程口碑分析

  • 評分分析

根據以上幾個模塊,我們開始今天的可視化分析之旅!


首先分析課程數量分析,我感興趣的是在這425門Excel在線課程中,哪些作者發布課程頻率最高,排在最前列的分別是那些機構或者個人,在所有作者中,多少是機構名義講課,多少是以個人名義講課。

課程來源分析

以下是雲課堂Excel課程模塊的高頻課程作者統計:

排在前五位的老師是劉萬祥老師、楊文星老師、Excel報表顧問、肖邦主、遠目教育。前十名老師中,也能看到一些耳熟能詳的名字:在PowerBI領域頗有建樹的劉凱老師、秦川老師和小蚊子數據分析以及PowerPivot工坊的趙文超老師。

其中劉萬祥老師在一共發布了17門課,奪得Excel板塊最勤奮講師桂冠,劉老師的多產與勤奮實在讓人佩服。

前十位位作者中,有7位老師的課程發布量都在10門以上,從課程發布頻數的累計分布圖中可以看到,累計頻數分布圖走勢先陡峭後平緩,這反映了什麼呢,說明課程資源的集中程度很高,想想前十位作者大部分都發布了10門以上的課程。

我按照五門課程的分割點對課程作者進行了切分,結果發現,有29名老師曾發布過5門以上的課程,佔比21.64%,發布課程不足5門的老師一共105人,佔比78.36%。

其中發布過5門以上課程的老師發布課程總計為242門,佔總課程比率57.21%,發布課程不足五門的老師累計發布了181門課程,佔比42.79%。這進一步驗證了上面的結論,即Excel板塊的課程來源集中度很高,將近20%的高頻作者貢獻了將近60%的課程資源。

按照課程發布作者和機構分類,以個人名義發布課程的作者一共271人,佔比63.8%,而以機構名義發布課程的作者僅佔36%左右。

這個說明什麼呢,說明在當今網路無處不在的時代,個體的崛起以及個人品牌的塑造,已經滲透到互聯網在線教育行業。真正掌握資源和技能的個體,完全可以依靠互聯網完成技能輸出和品牌塑造。

課程內容分析

關於課程內容方面,我的原始數據中僅有課程名稱和課程描述涉及到課程內容,暫時想不到很好地內容分析方法,課程描述的文本非常雜亂,使用文本分詞暫時個人還處理不好(哪位文本分析的大神感興趣可以來挑戰下),這裡僅就課程名稱詞頻做一下簡要分析:

library("wordcloud2")library("ggplot2")mydata<-read.csv("E:/微信公眾號/公眾號——數據小魔方/2017年9月/20170918/Excel技能需求頻率統計.csv",stringsAsFactors = FALSE,check.names = FALSE) library(wordcloud2)wordcloud2(mydata, size = 1, fontFamily = "微軟雅黑",minRotation = -pi/6, maxRotation = -pi/6,rotateRatio = 1)

ggplot(mydata[1:10,],aes(reorder(x,Freq),Freq))+geom_bar(stat="identity",fill="#B1DB85")+geom_text(aes(label=Freq))+coord_flip()+ggtitle("Excel課程高頻需求技能頻率分布")+theme_void(base_size=25)%+replace%theme(axis.text=element_text(size=15))

從分詞結果上來看,函數、VBA、圖表、數據透視表、數據處理需求佔了巨大部分詞頻,函數高居榜首,高達32次,VBA、圖表、數據透視表、數據處理則各有千秋,相差不大。

而PowerBI、PowerPivot、PowerQuery、動態圖表、信息圖表等需求也很強勁。由此可見,商務智能工具PowerBI的問世,給商務場景下業務需求帶來了巨大便利的同時,也激發了新的技能學習需求。

即將進入職場的小白領們一定要注意了,傳統的函數、透視表、圖表技能固然重要,及時關注商務智能工具也將是今後讓你獨具優勢、彎道超車的潛在路徑。

課程價格分析

在所有課程中,有354門付費課程,占課程總數的83.29%,其中付費課程中有折扣優惠的課程有185門,占所有付費課程的比重為43.53%,平均折扣率為55%。

免費課程的平均學習人數為27000人,付費課程的平均學習人數為270,天哪這個數字太巧合了,剛好相差100倍。

還是提醒廣大Excel在線學習者,不要只顧著課程價格就盲目的去選擇課程,不要抱著一種佔便宜的心態,無論免費還是付費,你的時間都是無價的,學了對你沒有任何用處的免費課程,浪費的是你自己的寶貴時間。倘若你想入門,可以謹慎選擇那些與自己技能需求匹配的課程,倘若想要進階或者在某一個領域深入學習,付費課程是難免的,為知識付費是一種很值得驕傲的事情。

我詳細統計了付費課程價格TOP20的折扣率變化、課程類型以及最具價值課程作者信息。

結果呈現如上,在12門最具價值的課程中,劉萬祥老師一個人包攬了7個,其中最為知名的課程要屬《向經濟學人學圖表》《向華爾街日報學圖表》系列課程,這些系列我個人都買過,確實不錯,劉老師在商務圖表領域的積澱有目共睹,其核心實力也得到了市場的檢驗以及大家的認可。

課程知名度分析

對於課程知名度的分析,主要基於學習者數量這個指標,我簡略統計了以下所有免費課程和付費課程的學員數量排名。

在最受學員歡迎的付費課程TOP20中,秋葉老師的和秋葉一起學習Excel獨佔鰲頭,學員人數高達14419,當然考慮到秋葉老師是團隊化運作,而這裡沒有區分個人和機構,所以僅從學員人數規模評價受歡迎程度可能有失偏頗,僅供參考。

這裡還有一個很有趣的現象是在最受歡迎的TOP20課程中,同樣有作者一人包攬多門課程的情況,劉萬祥老師和PowerPivot工坊的趙文超老師分別佔據了4門課程,令人包攬最受歡迎的TOP20中的40%,秋葉老師團隊和李則見老師分別佔據兩門課程。在所有TOP20課程中,學員人數均在1000以上,可以說真正有顏有料有乾貨的課程,還是能夠吸引大家的興趣的。

課程口碑分析

從課程口碑分析中,網易雲課堂課程評價實行的5分制,區分度並不是很高。

不過從得到大於4.9分的近22個課程分布來看,劉萬祥老師仍然牢牢把握著Excel高品質高口碑課程的頭把交椅,一共佔了7席4.9分高質量課程,累計評分樹狀圖分布顯示,劉萬祥老師總分58.1,排名前五的分別是劉萬祥、肖邦主、上海職領網路科技、劉凱老師、第五位(未知),第六位PowerPivot工坊的趙文超老師也表現出色。

以上便是本次雲課堂爬蟲數據分析的全部,由於對在線教育行業了解並不是十分深入,特別是指標構建,分析角度、可視化邏輯上有諸多不成熟之處,還望各位數據分析行業前輩高人多多指點。

最後感謝網易公司對中國在線教育行業的貢獻,相信憑著丁磊先生的個人遠見和網易公司的社會責任感,網易雲課堂可以為中國在線教育行業提供更多優質學習資源。

Excel課程選擇與學習建議:

(個人建議,僅供參考,並不代表雲課堂官方排名)

商務圖表類:

  • 劉萬祥ExcelPro

透視表與函數:

  • 肖邦主

商務智能工具類:

  • 劉凱
  • 趙文超

以上分析和建議僅供各位想要在職場充電的Excel學習者參考,因為數據爬取無法保證客觀,因而結論無法保證客觀公允,請大家謹慎參考。

個人在線課程:ggplot2入門及R語言在商務場景中的應用

Hellobi Live | 9月12日 R語言可視化在商務場景中的應用


推薦閱讀:

數據可視化:打造高端的數據報表
老羅不跟羅振宇玩了,8月最好看的電影 | 數據周報
揭開R語言中環境空間的神秘面紗
數據學習之路—每周好文分享(第二期)

TAG:数据可视化 | 数据分析 | PowerBI |