從python爬蟲,到更愛這個世界
16年的10月份正式接觸編程,現在回想,似乎就在昨天。從最基本的數據類型開始,到能夠寫一個簡單的爬蟲。掉過的坑,只有經歷過才知道,什麼叫「從入門到禿頂『』。
每一個勵志要轉行編程,利用工作間隙和業餘時間學習編程的人,都要精通如何快速切換電腦桌面並面不改色心不跳,這是過來人給你們的葵花寶典。
想想那段偷偷學習代碼的日子,現在回首還心有餘悸。但所幸走過了那段心酸歲月,17年5月,憑藉各種妹子圖,1024,微博女神追蹤等上不來檯面的爬蟲奇淫技巧。我順利獲得了現在公司面試官的青睞。印象中我面試的時候,把面試官說的一愣一愣的。當時特別驕傲,覺得自己特別溜。我覺得只要給我一個request、beautifulsoup,我就能給你整個世界。
後來正式入職了,我才知道當時的嘴臉,是多麼傻的一本正經。直到現在,我每次和面試我的主管交流項目時,都心有愧疚地想找個地縫鑽進去。它就像舊傷口,雖然不痛了,但傷疤還在,但人不能永遠活在過去,為了心安理得一些,我這麼安慰自己——成長,不就是一種承認自己過去是個傻逼的過程嗎?
入職之後的那段日子,是我恐懼感最強烈的時期。妹子圖一個簡單的for循環我能拿到好幾百套妹子果照。然鵝,入職第一天,爬的某政府網站,用js加密url,每一次的鏈接都?是變化的?內心日了狗的我覺得整個世界都崩塌了,懵逼地搞了三天,除了給對方伺服器發了很多無效請求,我啥也沒實現,領導看我的表情是這樣的
敏感的我,讀出了眼神中滿滿的期望與失落混雜的無奈感。估計他也很絕望,自己招上來的人,跪著也要把他帶大。只能細緻地跟我講解js加密的實現原理,好在領悟能力不錯,以死磕到底的耐力把它破解了。從這之後,我也不飄了。知道自己有多麼菜逼了,LOL卸了,朋友圈關了,聚會不去了。花幾乎全部精力學爬蟲。這麼著,過了3個月我開始上手了,我覺得我自己超棒棒,「文能隨意抓包解原理,武能無腦批量換cookie「。誒,我咋能這麼溜?LOL裝起來,朋友圈zhuangbility起來,聚會high起來。老大估計看出了我的浮躁,找我去公司的小黑屋,促膝而談:「我對你的未來很焦慮啊!……(此處省略一萬字)「
我開始自責,對啊,窩草,我怎能如此自甘墮落?不行,我是社會主義的接班人。我要報效祖國!我要改變世界!LOL卸了,朋友圈關了,聚會不去了。我開始定位我自己的方向,看業內大牛爸爸們都在玩什麼。尋尋覓覓又幾天,發現世界太大,我太渺小了,各種職位的大牛爸爸們,每一個都厲害地讓你恨不得打回娘胎里再投胎做人。不行,卧槽,太迷茫了,我到底擅長啥啊?不行,太煩了,誒喲,卧槽煩死了,翻手機吧?不行,越翻越焦躁。看書吧,嗯看書可能好點。
之前看過《人類簡史》不錯,聽說作者又出了本新書《未來簡史》,買來看看吧。哇!6666,這不就是我要尋找的方向嗎?書中說生物演算法可能在不久的將來構建整個未來世界,我深以為意。行吧,不行我就搞生物演算法科技吧,聽起來高大上的樣子。關鍵到底這玩意是幹嘛的?我得先入門呢,找點資料來看看,逛了知乎,被安利了《智能時代》和《數學之美》,看完之後豁然開朗,我要搞人工智慧!嗯沒錯,擼起袖子就是干。
動動嘴皮子太容易了。關鍵怎麼學啊?學哪些知識啊?谷歌走起,又不知道過了多長時間,我饑渴,疲憊,對於知識的渴望讓我焦躁難耐。我深深地體會到喬老爺那句話(「keep hungry, keep foolish」)的深意。
越過山丘,才發現之前越過的那個是土坡。橫亘在自己面前的是線代之山、積分之山和數理統計之山,每一個山都跟喜馬拉雅一樣高。「誒,不行,要不放棄吧?太累了,玩玩LOL,找個女票每天打豆豆過得也挺舒服的」,我內心的小右勸我,「你怎麼如此噁心,沒想到你是這樣的人,你不是說你要挑戰自己嗎?你不是說你還有詩和遠方嗎?」我內心的小左義憤填膺地怒斥道。最終小左咄咄逼人,還滿臉猙獰,小右看著恐怖,想想算了。
光說不練假把式,接下來的時間安排就必須嚴格執行,要不然指不定哪天要凍死在其中一座山上。了解了基本路線之後,我基本確定下來,要從線代之山跨過數理之山,最後翻越積分之山,但也很有可能因為路況和經驗問題,間或從積分之山過渡。為了更好的執行計劃,也請小夥伴多監督。由於路況實在複雜,自己經驗也不是很足,所以列一個初略的計劃:
線代之山
難度指數:☆ ☆ ☆ ☆ ☆
計劃路線:向量基本概念-向量空間基礎-線性映射-本徵值特徵向量-內積空間-運算元-行列式
計劃完成度:了解基本的線代概念,建立線代空間感覺,完成最小二乘法預測相關實例
計劃用時:3個月
相關資料:
《線性代數這樣學》麻省理工公開課:線性代數_全35集_網易公開課可汗學院公開課:線性代數_全143集_網易公開課嗶哩嗶哩 ( ゜- ゜)つロ 乾杯~ Bilibili
數理統計之山
難度指數:☆ ☆ ☆ ☆ ☆
計劃路線:暫略(計劃三個月後補充)
計劃完成度:貝葉斯演算法相關實例
計劃用時:3個月
相關資料:
可汗學院公開課:統計學_全85集_網易公開課可汗學院公開課:概率 _全55集_網易公開課積分之山
難度指數:☆ ☆ ☆ ☆
計劃路線:暫略(計劃六個月後補充)
計劃完成度:理解基本概念,實際用的時候不要一臉懵逼
計劃用時:3個月
相關資料:
網易公開課嗶哩嗶哩 ( ゜- ゜)つロ 乾杯~ Bilibili推薦閱讀:
※第四章:動態網頁抓取 (解析真實地址 + selenium)
※汽車之家字體反爬破解實踐
※爬取張佳瑋138萬知乎關注者:數據可視化
※python爬蟲之圖片下載APP1.0
※Python3如何將圖片保存到本地?