閑聊

閑聊

來自專欄 Python數據

本文首發公眾號 pydatame 可以關注。

記錄一下最近的工作以及生活狀態。會提及一些技術以及自己的想法。

工作的話,入職一個多月了。感覺很不錯,值得買是一家好公司。

最開始接到的任務是實現淘寶的大規模抓取,經過測試,程序能達到單IP每日抓取超過30萬商品價格和優惠券數據不被限制。其實給到我的本是個挑戰性的探索任務,並未期待能達到這麼好的效果,可以說是獲得巨大成功了。另外之前自己為了做公開分享寫的淘寶模擬登錄以及京東模擬登錄的代碼也直接貢獻給了公司,也派上了很大用場。

最近一直在做公司大數據抓取的架構設計,後面會持續跟這個項目一段時間。大數據平台的架構設計我已經在知識星球分享了,其中包含我參加QCon世界軟體開發大會的總結,感興趣的小夥伴可以在知識星球下載。

我的任務總體來說是探索性的,並不像業務邏輯那樣靠堆時間來解決,而更多是需要大量的知識儲備和搜索能力。我一直推薦我的好朋友們用Google來獲取信息,其實一方面也是有這個原因的。

還有一部分任務是ElasticSearch相關的,CTO跟我說,期望是達到這樣的效果:比如用戶先搜了ThinkPad,然後再搜蘋果,出現的應該是Macbook相關的而不是蘋果水果和蘋果手機;再就是搜皮帶,出現的就不希望是鏈為皮帶的手錶,雖然它名字裡面也帶「皮帶」二字。這個可能涉及對ElasticSearch內部Score機制的改動,所以需要詳細研究以下它的架構,熟悉了內部的邏輯之後再考慮如何去做,這是一個長期的任務。

再說說工作之外的。因為公司有一些內部優惠,所以購買了戴爾的G7筆記本,其實我並不會花很長時間在遊戲上,可能很閑的時候會玩一下LOL和絕地求生,不得不說我的遊戲天賦還是很差的。拿英雄聯盟來說,我已經玩了5年了吧,人家玩一年就能上鑽石,兩年差不多就是王者了,而我還是連白金的都打不過。的確玩遊戲的時候不動腦子。絕地求生就更差勁了,本來就是個小白,所以一直在跳飛機——成盒這個過程中循環。

另外家裡還買了Tensorflow的書,會在閑著的時候翻翻看。女朋友最近因為《模式識別》課程需要,所以也在學習相關的內容。我可以教她Python相關的。另外Pytorch也很火,如果我有時間的話也會學習一下。也推薦給大家。

然後是買了兩部小米MIX2S,我和女朋友一人一個。手機很不錯,不過很快就被我摔碎了屏又花了1000+維修。

給女朋友買了個QC35,從香港找朋友買的,花了不到2000元,還有贈品。贈品送給幫我買耳機的朋友了。我之前用耳機都是8元錢包郵的,不得不承認貴的耳機自然有它貴的道理,戴上之後整個世界都清凈了。

然後女朋友還在試用了我的Filco紅軸87鍵之後也從天貓買了一個一樣的,她說感覺很好,直接把她原來20塊錢的鍵盤扔了不想用了。

瘋狂地買買買導致了信用卡不夠花,我是第一張信用卡,固定額度只有8000,即便是開了20000的臨時額度,還是不夠我花的。還好今天會發工資,來一輪大補血。

有個朋友找我做刷直播粉絲和熱度的程序,我看了下YY和快手,驗證碼不好解決。另外接碼平台的話帳號的獲取成本也比較高,不知道大家有什麼好的方案可以解決一下。我覺得做這個挺暴利的,有了帳號之後就沒什麼成本了,可能代理需要付費?反正代碼是一次完成一直可用的。周末會花時間研究一下這個。有興趣的小夥伴可以一起討論。

今天晚上部門團建,會去吃烤串~~

公眾號二維碼:

weixin.qq.com/r/ii8lPdD (二維碼自動識別)

知識星球介紹:

知識星球二維碼:

t.zsxq.com/aiYzByV (二維碼自動識別)

推薦閱讀:

Python 中的 for 循環如何使用?
[轉載]python 的日誌logging模塊學習
如何調取或下載數據文件?
假如我成了世界上最精通python的人,我能用python完成什麼偉大的事情?
利用Python打造短鏈服務(一)

TAG:大數據 | Python | 數據 |