千里挑一的我乎漂亮妹子照片牆(數據初探3)
來自專欄:Python數據採集處理分析挖掘可視化應用實例
自己挖的坑,接上一彈留下的作業:
千里挑一的我乎妹子大V排行榜(數據初探2)
千里挑一的我乎妹子大V排行榜(數據初探1)
過程實現:
1.根據抓取的url本地存儲圖片;
2.用face_recognition篩選出人臉,阿貓阿狗的刪除;
3.用pillow打上妹子的知乎ID;
4.人工剔除部分動畫類妹子圖片(可以省略);
5.處理華南理工大學數據集中的妹子顏值評分;
6.繼續用face_recognition庫中的face_distance獲取圖片的相似度(L2範數)。
原本是計劃用face_recognition提取面部特徵矩陣,
然後用Sklearn進行聚類分析,但是face_distance也可以做個大概判斷。
PS:這個face_recognition很強大
ageitgey/face_recognition
· 找到照片中的人臉Find faces in a photograph
https://github.com/ageitgey/face_recognition/blob/master/examples/find_faces_in_picture.py
· 識別照片中的面部特徵Identify specific facial features in a photograph
https://github.com/ageitgey/face_recognition/blob/master/examples/find_facial_features_in_picture.py
def face_distance(face_encodings, face_to_compare): """ Given a list of face encodings, compare them to a known face encoding and get a euclidean distance for each comparison face. The distance tells you how similar the faces are. :param faces: List of face encodings to compare :param face_to_compare: A face encoding to compare against :return: A numpy ndarray with the distance for each face in the same order as the "faces" array """ if len(face_encodings) == 0: return np.empty((0)) return np.linalg.norm(face_encodings - face_to_compare, axis=1)
試驗結果:
1.共提取了3600多張顏值較高的妹子圖片;
2.用隨機1000張生成照片牆,結果太大,我乎不能上傳;
3.文中插圖為照片牆的部分截圖,另完整一千妹子照片牆下載:
https://pan.baidu.com/s/1dFaVyCx(17.1M)
4.需要原始數據(大圖及華南理工數據集)可以站內私信。
還想知道更多分析?
稍後一一奉上~~~
或者你自己擼吧:Python數據採集處理分析挖掘可視化應用實例
推薦閱讀:
※R語言可視化——ggplot圖表系統中的輔助線
※Excel才是繪圖王道
※Leaflet在線地圖進階寶典——json素材操縱與圖層面板控制
※GraphQL 中文官網上線啦 | 掘金翻譯計劃
※Python數據分析及可視化實例之Pandas十分鐘入門