




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第用python寫個顏值評分器篩選最美主播目錄前言一、核心功能設計獲取主播直播封面圖主播顏值評分二、實現步驟1.獲取主播名稱和照片2.主播顏值評分
前言
晚上回家閑來無事,想打開某直播平臺,看看小姐姐直播。看著一個個多才多藝的小姐姐,眼花繚亂,好難抉擇。究竟看哪個小姐姐直播好呢?
今天我們就一起來做個顏值評分器,爬取小姐姐們的直播照片,對每位小姐姐的顏值進行打分排序,選出最靚的star。
一、核心功能設計
總體來說,我們需要做的是獲取直播顏值區的主播小姐姐的正在直播的全部主播名稱和封面圖并保存下來,用百度AI提供的人臉識別接口,進行顏值評分排序,選出顏值最高的。
拆解需求,大致可以整理出核心功能如下:
獲取主播直播封面圖
打開直播顏值區模塊對頁面進行分析
發送網絡請求,解析數據
保存數據
主播顏值評分
百度人臉識別接口
遍歷主播照片,調用顏值檢測接口對主播顏值進行打分
對評分進行排序
二、實現步驟
1.獲取主播名稱和照片
首先我們選擇的是某牙直播,進入首頁打開顏值區,按F12可以進入開發者模式。
importrequests
#1.找到數據所在url地址(系統分析網頁性質)
url="/g/2168"
headers={
'User-Agent':'User-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36'
'(KHTML,likeGecko)Chrome/87.0.4280.88Safari/537.36'
#2.發送網絡請求
response=requests.get(url=url,headers=headers)
html_data=response.text
print(html_data)
不難發現所有的小姐姐直播封面對應的都是在li標簽里面。我們只要解析獲取這些li標簽數據就可以了。
接著我們需要拿到直播小姐姐的封面圖片,通過分析上面li標簽里面的內容,可以發現下面有個a標簽,里面的img標簽中的data-original不就是我們要的小姐姐圖片嘛!
接下來我們想要獲取主播小姐姐的名字怎么辦呢?點開li標簽繼續分析,可以看到下面有個span標簽,其中的i標簽內容就是小姐姐直播的名字。
網頁結構我們上面已經分析好了,那么我們就可以來動手爬取我們所需要的數據了。獲取到所有的數據資源之后,把圖片保存下來即可。文件的下載保存的方式比較多,我用的是通過withopen打開文件的方式,比較簡單。
#3.數據解析
selector=parsel.Selector(html_data)
lis=selector.xpath('//li[@]')#所有li標簽
forliinlis:
img_name=li.xpath('.//span[@]/i/text()').get()#主播名字
img_url=li.xpath('.//a/img/@data-original').get()#主播圖片地址
#print(img_name,img_url)
#請求圖片數據
img_data=requests.get(url=img_url).content#圖片數據
#4.數據保存
#準備文件名
file_name=img_name+'.jpg'
withopen('img\\'+file_name,mode='wb')asf:
f.write(img_data)
print('正在保存:',file_name)
這樣小姐姐的直播名稱和照片都可以保存下來了,效果如下:
2.主播顏值評分
我們調用的是百度開放的人臉識別接口–百度AI開放平臺鏈接。
這里面我們可以創建一個人臉識別應用,其中的APIKey及SecretKey后面我們調用人臉識別檢測接口時會用到。
接下來我們可以看看官方提供的API幫助文檔,里面介紹的很詳細。包括如何調用請求URL數據格式,向API服務地址使用POST發送請求,必須在URL中帶上參數access_token,可通過后臺的APIKey和SecretKey生成。這里面的APIKey和SecretKey就是我們上面提到的。
那我們要的打分顏值分數是哪個呢?提供返回結果參數,可以看到里面有個beauty就是我們要的顏值分數。
這樣顏值檢測的接口流程基本就已經清楚了,可以進行代碼實現了。
其中獲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電梯困人培訓方案
- 初一寒假安全教育主題班會
- 護士入崗前教育
- 讀單詞游戲設計
- 頤和園說課課件
- 體育運動中燙燒傷防護與處理
- 頸椎的護理課件
- 界面設計風格解析與應用
- 《智能網聯汽車技術》課件-自動駕駛等級劃分的認知
- 預防流感主題班會課件
- 垃圾處理焚燒培訓課件
- 國家中小學智慧教育平臺培訓專題講座
- GMP附錄-細胞治療產品
- 2025年中國烘焙食品行業發展深度分析及行業發展趨勢報告
- 專業燒烤店管理制度
- GB/T 45668-2025地下空間信息系統建設技術要求
- DB32-T 4001-2025 公共機構能耗定額及計算方法
- 中醫護理技術創新思維
- 2025江蘇省惠隆資產管理限公司招聘30人易考易錯模擬試題(共500題)試卷后附參考答案
- 招標代理服務服務方案
- 學術規范與論文寫作講述課件
評論
0/150
提交評論