用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播_第1頁(yè)
用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播_第2頁(yè)
用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播_第3頁(yè)
用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播_第4頁(yè)
用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播目錄前言一、核心功能設(shè)計(jì)獲取主播直播封面圖主播顏值評(píng)分二、實(shí)現(xiàn)步驟1.獲取主播名稱和照片2.主播顏值評(píng)分

前言

晚上回家閑來(lái)無(wú)事,想打開(kāi)某直播平臺(tái),看看小姐姐直播??粗粋€(gè)個(gè)多才多藝的小姐姐,眼花繚亂,好難抉擇。究竟看哪個(gè)小姐姐直播好呢?

今天我們就一起來(lái)做個(gè)顏值評(píng)分器,爬取小姐姐們的直播照片,對(duì)每位小姐姐的顏值進(jìn)行打分排序,選出最靚的star。

一、核心功能設(shè)計(jì)

總體來(lái)說(shuō),我們需要做的是獲取直播顏值區(qū)的主播小姐姐的正在直播的全部主播名稱和封面圖并保存下來(lái),用百度AI提供的人臉識(shí)別接口,進(jìn)行顏值評(píng)分排序,選出顏值最高的。

拆解需求,大致可以整理出核心功能如下:

獲取主播直播封面圖

打開(kāi)直播顏值區(qū)模塊對(duì)頁(yè)面進(jìn)行分析

發(fā)送網(wǎng)絡(luò)請(qǐng)求,解析數(shù)據(jù)

保存數(shù)據(jù)

主播顏值評(píng)分

百度人臉識(shí)別接口

遍歷主播照片,調(diào)用顏值檢測(cè)接口對(duì)主播顏值進(jìn)行打分

對(duì)評(píng)分進(jìn)行排序

二、實(shí)現(xiàn)步驟

1.獲取主播名稱和照片

首先我們選擇的是某牙直播,進(jìn)入首頁(yè)打開(kāi)顏值區(qū),按F12可以進(jìn)入開(kāi)發(fā)者模式。

importrequests

#1.找到數(shù)據(jù)所在url地址(系統(tǒng)分析網(wǎng)頁(yè)性質(zhì))

url="/g/2168"

headers={

'User-Agent':'User-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36'

'(KHTML,likeGecko)Chrome/87.0.4280.88Safari/537.36'

#2.發(fā)送網(wǎng)絡(luò)請(qǐng)求

response=requests.get(url=url,headers=headers)

html_data=response.text

print(html_data)

不難發(fā)現(xiàn)所有的小姐姐直播封面對(duì)應(yīng)的都是在li標(biāo)簽里面。我們只要解析獲取這些li標(biāo)簽數(shù)據(jù)就可以了。

接著我們需要拿到直播小姐姐的封面圖片,通過(guò)分析上面li標(biāo)簽里面的內(nèi)容,可以發(fā)現(xiàn)下面有個(gè)a標(biāo)簽,里面的img標(biāo)簽中的data-original不就是我們要的小姐姐圖片嘛!

接下來(lái)我們想要獲取主播小姐姐的名字怎么辦呢?點(diǎn)開(kāi)li標(biāo)簽繼續(xù)分析,可以看到下面有個(gè)span標(biāo)簽,其中的i標(biāo)簽內(nèi)容就是小姐姐直播的名字。

網(wǎng)頁(yè)結(jié)構(gòu)我們上面已經(jīng)分析好了,那么我們就可以來(lái)動(dòng)手爬取我們所需要的數(shù)據(jù)了。獲取到所有的數(shù)據(jù)資源之后,把圖片保存下來(lái)即可。文件的下載保存的方式比較多,我用的是通過(guò)withopen打開(kāi)文件的方式,比較簡(jiǎn)單。

#3.數(shù)據(jù)解析

selector=parsel.Selector(html_data)

lis=selector.xpath('//li[@]')#所有l(wèi)i標(biāo)簽

forliinlis:

img_name=li.xpath('.//span[@]/i/text()').get()#主播名字

img_url=li.xpath('.//a/img/@data-original').get()#主播圖片地址

#print(img_name,img_url)

#請(qǐng)求圖片數(shù)據(jù)

img_data=requests.get(url=img_url).content#圖片數(shù)據(jù)

#4.數(shù)據(jù)保存

#準(zhǔn)備文件名

file_name=img_name+'.jpg'

withopen('img\\'+file_name,mode='wb')asf:

f.write(img_data)

print('正在保存:',file_name)

這樣小姐姐的直播名稱和照片都可以保存下來(lái)了,效果如下:

2.主播顏值評(píng)分

我們調(diào)用的是百度開(kāi)放的人臉識(shí)別接口–百度AI開(kāi)放平臺(tái)鏈接。

這里面我們可以創(chuàng)建一個(gè)人臉識(shí)別應(yīng)用,其中的APIKey及SecretKey后面我們調(diào)用人臉識(shí)別檢測(cè)接口時(shí)會(huì)用到。

接下來(lái)我們可以看看官方提供的API幫助文檔,里面介紹的很詳細(xì)。包括如何調(diào)用請(qǐng)求URL數(shù)據(jù)格式,向API服務(wù)地址使用POST發(fā)送請(qǐng)求,必須在URL中帶上參數(shù)access_token,可通過(guò)后臺(tái)的APIKey和SecretKey生成。這里面的APIKey和SecretKey就是我們上面提到的。

那我們要的打分顏值分?jǐn)?shù)是哪個(gè)呢?提供返回結(jié)果參數(shù),可以看到里面有個(gè)beauty就是我們要的顏值分?jǐn)?shù)。

這樣顏值檢測(cè)的接口流程基本就已經(jīng)清楚了,可以進(jìn)行代碼實(shí)現(xiàn)了。

其中獲

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論