千里挑一的我乎漂亮妹子照片牆(數據初探3)

來自專欄:Python數據採集處理分析挖掘可視化應用實例


自己挖的坑,接上一彈留下的作業:

千里挑一的我乎妹子大V排行榜(數據初探2)

千里挑一的我乎妹子大V排行榜(數據初探1)

過程實現:

1.根據抓取的url本地存儲圖片;

2.用face_recognition篩選出人臉,阿貓阿狗的刪除;

3.用pillow打上妹子的知乎ID;

4.人工剔除部分動畫類妹子圖片(可以省略);

5.處理華南理工大學數據集中的妹子顏值評分;

6.繼續用face_recognition庫中的face_distance獲取圖片的相似度(L2範數)。

原本是計劃用face_recognition提取面部特徵矩陣,

然後用Sklearn進行聚類分析,但是face_distance也可以做個大概判斷。


PS:這個face_recognition很強大

ageitgey/face_recognition

· 找到照片中的人臉Find faces in a photograph

github.com/ageitgey/fac

· 識別照片中的面部特徵Identify specific facial features in a photograph

github.com/ageitgey/fac

def face_distance(face_encodings, face_to_compare): """ Given a list of face encodings, compare them to a known face encoding and get a euclidean distance for each comparison face. The distance tells you how similar the faces are. :param faces: List of face encodings to compare :param face_to_compare: A face encoding to compare against :return: A numpy ndarray with the distance for each face in the same order as the "faces" array """ if len(face_encodings) == 0: return np.empty((0)) return np.linalg.norm(face_encodings - face_to_compare, axis=1)


試驗結果:

1.共提取了3600多張顏值較高的妹子圖片;

2.用隨機1000張生成照片牆,結果太大,我乎不能上傳;

3.文中插圖為照片牆的部分截圖,另完整一千妹子照片牆下載:

pan.baidu.com/s/1dFaVyC(17.1M)

4.需要原始數據(大圖及華南理工數據集)可以站內私信。

還想知道更多分析?

稍後一一奉上~~~

或者你自己擼吧:Python數據採集處理分析挖掘可視化應用實例


推薦閱讀:

R語言可視化——ggplot圖表系統中的輔助線
Excel才是繪圖王道
Leaflet在線地圖進階寶典——json素材操縱與圖層面板控制
GraphQL 中文官網上線啦 | 掘金翻譯計劃
Python數據分析及可視化實例之Pandas十分鐘入門

TAG:Python | 数据分析 | 数据可视化 |