八斗學院到底怎麼樣 ?
八斗學院到底怎麼樣 ?
各位同學們你們好,我是八斗學院甘世玉,針對上面的評論八斗學院覺得有必要闡述一些客觀事實,供大家自行判斷,八斗學院的辦學宗旨一直是「對結果負責」,很感謝這個小事件,能讓八斗學院與大家面對面真誠溝通。
一、
1.1 關於百度鳳巢廣告系統和C++問題
百度鳳巢廣告系統非常龐大,完整系統由幾十甚至上百個大小子系統共同組成,包括有計費引擎、日誌引擎、反作弊引擎、數據流分發、模型在線引擎、報表引擎、報警系統等等,每個系統和引擎都可以拆分很多個更小的子系統,每種系統都會涉及從離線調研實驗到在線預服務,甚至到最後的完全服務,每個環節都涉及非常多的細節。
像這種龐大的系統,無論是支付寶系統,鳳巢系統還是搜索系統,不是通過一種或者幾種語言就可以搞定的。對於評論中提到的C++,鳳巢系統的確是使用的,但不論是鳳巢還是其它系統,通常c++用來進行網路開發,比如高性能高並發的伺服器,就好比是個網路服務框架。
這部分在大數據裡面相對封閉,主要是保證高並發高性能,不會牽扯太多數據挖掘的工作,和數據挖掘不是一個方向(我們的課程側重數據挖掘方向)。
1.2 關於使用Python語言的問題
用Python開發大數據集中在數據挖掘階段,相對來說數據挖掘是比較容易切入到大數據職業軌道的一個方向,而且市場需求和職業發展前景都非常好。這個方向集中於演算法的調研分析以及實現,在語言上通常以Python、Scala、Java為主,但每家公司要求不一樣,通常跑不出這個範圍。
大數據內容涵蓋廣泛,很難僅通過一門或幾門語言或技術來完成,不具有世界通用且明確的標準,不同環節適合使用不同的語言實現。我們的課程偏重數據挖掘,因此不涉及C++ ,涉及到的語言是python、scala和java。
二、
2.1 關於Flink、Kylin、Druid框架問題
作為技術人員,對新知識、新思想、新工具框架有一種主動擁抱的態度非常好,但這種擁抱一定不要盲目,否則浪費時間、精力不說,反而收效甚微。既然提到了Flink、Kylin、Druid這三個框架,這裡也做一個簡單的分析。
(1)Flink:
很多人認為它是Spark的繼任者,通常認為Spark是第三代計算引擎,Flink是第四代。乍一聽上去Flink比Spark厲害,實際上Spark目前發展迅猛,得到業界的廣泛支持。
很多傳統機器學習、數據挖掘的項目都已經遷移到Spark,並且表現良好,同時又得到資本市場的認可,而Flink的成熟度與Spark相差甚遠,參與Flink社區的人不到Spark的1/5,FLink想大規模覆蓋並取代Spark,還有很長的一段路。
(2)Druid:
Druid可以短時間內處理數十億行,這個是它非常厲害的一點,但實際使用起來相對麻煩,周邊平台支持也很差,用該框架的公司還不多,遠沒有sparksql更貼近市場主流。
(3)Kylin:
Kylin非常不錯,是中國人第一個頂級的Apache項目,配套社區也非常活躍,中文文檔居多,屬於良心作品。
關於這3個框架的詳細介紹,大家可以自行查看:
Flink :https://www.ibm.com/developerworks/cn/opensource/os-cn-apache-flink/
Kylin:http://kylin.apache.org/cn/
Druid:http://www.csdn.net/article/2014-10-30/2822381/2
上面提到的3個框架雖屬於大數據範疇但並不是基礎內容,這種忽視基礎重要性的思維是錯誤的,會誤導初學者走彎路,讓他們分不清哪些是必須掌握的,哪些是可選項。實際上只要基礎紮實,再要學習幾個新的框架就會非常簡單。
2.2 關於課程內容的問題
簡單羅列與大數據相關的一些框架:Hadoop、MapReduce、HDFS、YARN、Storm、Zookeeper、Hive、Hbase、Kafka、Flume、Spark、Mahout、Avro、Chukwa、Ambari、Whirr、Bigtop、Hcatalog、Hue、Pig、Sqoop、Cassandra、Hama、Giraph、Oozie、Crunch、Samza、MongoDB、Redis、ElasticSearch、LogStash、Impala、Flink、Kylin、Druid,這些就已經有35種之多但仍不是全部。
大數據時代才剛剛開始,技術的更新迭代每時每刻都在發生,類似上面提到的框架還有很多,但基本原理萬變不離其宗,任何一個人都沒有精力也沒有必要完全掌握時下的所有框架。
而只有紮實掌握了基礎,才有能力隨時根據企業的需求獨立學習新的框架技術,而不是還要依靠參加培訓去學習幾個簡單的框架。
公司里的項目有無數種解決方案,每種方案可以採用不同的框架和工具支撐。企業主要使用的還是一些基礎的、主流的框架,很多傳統方法仍然適用,不能把已經過無數次穩定驗證的方案一棒打死。
每種工具和方案都有其適合的場景,方案沒有完美的,實際生產中的方案設計全靠經驗。而企業對大數據人才真實的需求還是基本功紮實、解決實際問題能力強。
說一下我們的課程究竟都講了什麼,下面的截圖是我們的課程大綱,其中紅框部分是我們會講到的Hadoop生態圈的框架,藍框中是我們會講到的演算法相關的部分。
我們在課程中講到的是現在企業中主流的技術,對於一些不太重要的、邊緣化的技術我們在課上只做簡單介紹,這樣安排課程的目的是為了保證大家能夠在4個月時間內更紮實的掌握大數據核心技術、常用技術,只有把這些學紮實才能具備獨立學習新技術的能力。
我們的課程是八斗學院的老師根據多年的工作經驗和目前企業中的常用技術以及迭代趨勢,歷時近4個月時間研發的,我們會提供一個「音樂推薦系統」項目和百萬級的數據,用於實踐,貫穿整個學習周期。
這是我們提供的商業項目一個簡單的框架圖,這個項目的架構包括檢索系統、資料庫存儲、數據分析、數據預處理、在線、離線數據挖掘等,市場上其他公司的技術架構都和它類似,擁有和它相通的業務實現思路。
稍有不同的是,每家公司的數據和具體業務不同,他們會根據自身資源和數據特點對某些環節進行調整,但只是在業務細節上不同。
我們講的框架、演算法包括我們的實踐項目的架構,都是企業中最常用,也是大多數企業都在用的,我們的課程中講到的知識可以無縫應用到企業的真實開發環境中。
通過對拉鉤網各家公司對大數據相關人才的招聘要求就可以發現,精通Hadoop、spark、storm、HBase、MapReduce等是大多數用人單位的要求,這裡舉一個簡單的例子:
詳細信息可以去拉鉤官網查看,這個是Hadoop相關職位頁面鏈接:
https://www.lagou.com/jobs/list_Hadoop?labelWords=fromSearch=truesuginput=
2.3 關於試聽課程的問題
對待同一事物,每個人有著不同的背景,有自己的認知範圍、評價體系和需求。但要明確的一點是,我們的課程是針對有開發基礎但是並沒有大數據相關基礎的學生開發的。
對於未接觸過大數據的學生來說,如果我們直接讓他看一些較深的知識會很難理解,既不能從中獲取到知識也不能有效體驗我們的課程。很可能導致學生無法對我們的課程做出客觀、正確的評價,所以我們選擇分享一些偏基礎的課程,用於入門學習和課程體驗。
大家應該從視頻中老師講課的邏輯,內容講解的是否清晰明了來判斷我們的課程質量和老師的授課經驗,而不是僅僅通過一小部分試聽課程就評價一套108學時的課程內容膚淺,這無異於管中窺豹。
對於我們試聽課程沒能幫到的同學,我們深表遺憾。如果您想體驗我們的深層次的課程,可以聯繫甘老師,我們非常樂於給您提供有價值的信息。
三、
3.1 關於Hadoop的版本問題
Hadoop2.0與1.0的本質區別在於引入了YARN資源管理系統,2.0中的離線計算框架依舊是MapReduce,運行於資源管理框架YARN之上。YARN上面可以運行各種計算框架包括MapReduce、Spark、Storm等,所以相比於Hadoop 1.0,Hadoop 2.0功能更加強大,且具有更好的擴展性、性能,並支持多種計算框架。
關於Hadoop1.0和2.0本質區別的詳細介紹文章:
http://blog.sina.com.cn/s/blog_17ab314080102xb7j.html
1.0和2.0的架構雖然不同,但編程開發和跑程序一模一樣,如果做開發,公司不會特別關心你用哪個版本,開發能力更重要,開發的代碼在哪個版本都可以運行。
通過我們的課程大綱也可以很明顯的看到,我們的課程中包含Hadoop2.0的相關內容。課程前期使用了Hadoop1.0來講,這樣更有利於大家完整的認識Hadoop的版本迭代,有助於更深刻的理解Hadoop在分散式處理上的基本原理。
3.2 關於官網不能被搜索到的問題
非常感謝這位同學提到的官網問題,網頁要想被搜索到首先要被百度收錄。我們的官網在10月份期間進行了整體的改版,完全啟用了一個新站,之前老站的優化已經失去了效果,所以新站不能馬上被百度收錄並且獲得較好的排名。
目前官網已經能夠在百度搜索到(如下圖),後續我們會繼續對網站進行優化來提高在百度的排名,方便大家搜索,對於期間給您造成的困惑我們深表歉意。
這是八斗學院的官網:www.badouxueyuan.cn ,歡迎大家訪問。
4.八斗學院對該問題的態度以及我們的辦學宗旨。
對於知乎上用戶的評論,我們非常重視,這表示用戶對八斗學院非常關注,所有問題我們都會客觀對待。
對於我們確實存在的問題,會虛心接受用戶提出的意見,比如「官網在百度排名較差」我們會不斷優化改善。但也有一些問題,用戶對我們產生了不恰當的評價,我們秉持客觀的態度整理了相關問題的正確信息對此予以了修正。
我們的課程面向沒有大數據開發基礎的用戶研發,所講內容是從大數據0基礎到精通。課程側重數據挖掘方向,並不能覆蓋所有用戶,對於沒能服務到的高階用戶我們表示遺憾,另我們在日後會上線AI人工智慧等更高層級的系列課程,屆時歡迎大家試聽。
八斗學院自成立以來,一直以「對結果負責的大數據培訓」為辦學宗旨,秉承這一信念八斗學院在線班已經歷經了4期,大數據課程也進行了3次迭代升級。每次上課我們都會依據學員的反饋進行動態調整,以期達到最佳的授課效果,能夠讓學員在短時間內掌握更多的知識。
「對結果負責」不止是八斗學院的一句承諾,更是對每一位學員的責任。我們正在通過八斗學院所有人的努力,幫助學生紮實掌握課程知識,找到滿意的工作,至此八斗學院已經服務400+正式學員。
八斗學院向來以用戶利益為先,不管是付費用戶還是免費用戶,您都可以向甘老師直接表達您的意見和建議,我們樂於廣泛聽取來自用戶的意見,不斷提升我們的課程和服務水準,為學員提供市面最好的大數據課程。
技術行業是一個邏輯縝密、思維嚴謹的行業,0和1代表了IT技術的客觀、明確,雖然網路環境言論自由,但希望大家都能保持客觀、公正。
另,1樓和2樓第3、4位用戶的客觀的、不同角度的分析給大家帶來了不同的觀點,感謝兩位的認真回答。
這個小事件給大家帶來困擾我們深表歉意,由於溝通不夠及時,如果相關評論用戶覺得回復不夠全面,可以和我們進一步溝通,解決相關問題。
最後,無論是否會在八斗學院學習,我們希望每個人都能才高八斗,每位大數據從業者都能前程似錦。
既然是學院的標題表明是側重點很明確。
先聊聊培訓:
培訓這東西要看學的人的心態,不管學什麼,如果經常逐字逐句的摳細節,然後抽象出自己的知識點,肯定在理論上會有提升,但是為什麼這麼多開源的東西,網上的學習資料也很多,為什麼還是需要培訓呢?
核心問題是: 需求方需要系統的學習,將離散的知識點串起來,解決自己的就業/提升問題
資料和博客能解決的問題很局限,通常每個博客都是作者在一個特定的背景環境下寫的,所以能解決的問題(困惑)還是需要你親身經歷這個背景環境,或者正處於這個環境下才會深有體會。而且資料是離散的,側重點參差不齊。
通常培訓和學校一樣,只是培訓側重於某個領域的就業,目的很明確。
相當於有了一個評價指標,就看就業情況,或者看是不是能解決你的就業問題,如果這個培訓能解決你的就業問題,顯然這對於你是好的。(因為大部分培訓只要是解決就業問題,少部分是因為工作的轉型,或者因為工作環境差異,原先的公司的那套在新的公司不適用,但是要快速上手,這培訓就是捷徑,這好壞評價就是能不能解決你目前的問題)
還是要回到主題,怎麼評價?
首先大數據方面的內容一方面的是偏開發,另一方面是偏演算法,我看了內容大綱方面既有MapReduce,HDFS,hive,Zookeeper,storm,kafka,flume,yarn,spark.
這部分也主要是針對大數據開發崗位的內容,以後想做大數據平台的人對這部分的內容會比較吸引。
首先這些內容點比較全,但是公司裡面工作的話,未必都能涉及到,比如有些只涉及到kafka,hive,spark,hdfs這些的,這主要還是看公司和在公司中的哪個部門,主要的業務場景了,我了解到的是很多別的培訓可能只是這些子集。
然後就需要看質量,大而全肯定不會太深,雖然我沒有聽過,但是這點不管什麼培訓都存在的問題。但是從需求方來說,大部分想要培訓的人都是沒有這方面的工作經驗,這就沒毛病。
如果一個工作多年的數據開發去參加這個培訓說,這是什麼東西么!
首先既然有這麼多工作經驗,想培訓自己肯定是因為哪個點,工作沒有涉及到,自己可以結合別的工作經驗,花點時間自己就能搞定,沒必要培訓了。
具體如果你要去參加這個培訓的話,
注意幾點,
- 有沒有實踐,實踐的內容是不是偏工作的。
比如:主要對哪些模塊開發,模塊的一些簡單的調試問題。如果是有工作經驗的這些肯定還是都是經歷最多的。而且這些點是最重要的,至少在面試的時候能用上,但是也不能單方面都依靠培訓,需要你自己多經歷,才會更有體會和理解。(其實說到底還是需要多練,多遇到問題,然後解決問題才是收菜的節奏)
好比wordcount,這肯定是必須要有的,但是看是不是還有結合這個例子的一些業務場景的拓展,前提要自己先會wordcount。
為什麼實踐放在第一,這是衡量類似培訓很好的點,你哪知道講師是不是照本宣科,所以多留意有沒有提到工作哪些類似的業務場景,這是短期,或者經驗的最好的途徑。這是你面試應該具備的。
2.講理論的某些點時候,會不會提到一些工作中的問題。
因為這會讓你理解概念和工作接軌,這樣不會走偏。理論其實都是一樣,但是面試的話還是主要就是拿其中的一些點和實際工作中的問題來問。一般面試都愛問這些,這些簡單的小問題,分分鐘就能掛掉一些來忽悠的。
數據開發方面主要還是更需要有經驗的,只是聽理論沒動手做的,我覺得肯定沒必要培訓了,過段時間就忘記的一乾二淨了,不親身體會就不知道哪些痛點,沒有痛點,就沒學到東西。既然有時間學習,就盡量拿著這些時間自己去犯錯,現在犯的錯也是你以後裝逼的資本。沒有問題的學習就沒有收穫。這些是個人的體會,僅供參考。
裡面還有一些機器學習演算法:常用的分類聚類回歸。
不算特別難,但是在公司肯定夠用。
從這點其實我看到這培訓還是有點靠譜,至少,會數據開發的這些基本的演算法就可以了,就算剛開始做數據挖掘,機器學習的,這些演算法也夠工作中用的。
雖然現在深度學習什麼的很火,但是真的工作中還是應用比較少,因為有大量的參數,這需要很多工作經驗。只有裝逼用,工作中還是這些簡單的演算法效果來的更快,而且相對參數比較少,容易調整。
注意點和上面的一樣,
具體項目,需要看具體項目,看能不能幫助你自己走完整個過程。這是重中之重,也是評價標準。
很多書籍其實也都不錯,有具體項目,但是因為很多人基礎的原因,有問題得不到解決,這是阻礙看技術書學習的最大障礙。而且書很多內容老,實際的一些環境有變化,也出現很多這問題那問題的。
現在的大數據,機器學習比較火,但是很多公司確實不太厚道,希望這幾個點能幫助你辨別。不管是這家培訓,別的培訓也是一樣,用這個去衡量。
還有一點,一分錢一分貨。看值不值。
培訓就是用錢買時間。
試聽了一節課,首先百度鳳巢廣告系統是用c++做的,而他們的講師居然再用python搞起大數據了,這太不主流了,我個人覺得他們吹的很牛的老師只是在鳳巢系統里做邊角料的雜工。
據我所知 八斗學院 是騙局 還是自己摸索吧 別去了
其他的就不說了,工信部的這個怎麼不來解釋下。有點坑~
關於他們網站的問題,自己看吧
這是他們的網站北京八斗學院教育科技有限公司
http://badouxueyuan.cn二者查詢結果國家企業信用信息公示系統網站
http://www.gsxt.gov.cn(這裡點不了,自行百度)並沒有找到這家公司ICP/IP地址/域名信息備案管理系統
http://www.miitbeian.gov.cn裡面右下角公共查詢備案信息查詢輸入域名http://badouxueyuan.cn備案信息就自己看吧這是我剛剛查的,再結合這幾個時間...完畢1、hadoop授課版本竟然還是1.0的,然後所謂的官網現在百度也找不到。。。。。
2、補充一點,其實我比較好奇百度大神身份真偽。。。 哈哈
推薦閱讀:
※2017 年國內房價是漲了還是跌了?
※大數據方面核心技術有哪些?
※大眾眼中的大數據是怎樣的?
※測試比較 Hive, impala 和 shark/spark 的性能,可以從哪些具體方面入手?
※數據分析師是程序員嗎?