




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、拿答案:1144766066答案來源:雅寶題庫網(wǎng)()-南開大學(xué)(本部)20 秋學(xué)期(1709、1803、1809、1903、1909、2003、2009)網(wǎng)絡(luò)爬蟲與信息提取在線作業(yè)試卷總分:100 得分:100第 1 題,()是 Scrapy 官方開發(fā)的,用來部署、運(yùn)行和管理 Scrapy 爬蟲的工具A、ScrapydB、ScrapyDeployC、DeployDScrapy_Deploy 正確答案:第 2 題,當(dāng)爬蟲創(chuàng)建好了之后,可以使用scrapy()”命令運(yùn)行爬蟲。A、startupB、starwarC、drawlDcrawl 正確答案:第 3 題,在 Scrapy 的目錄下,哪個文件負(fù)
2、責(zé)存放爬蟲的各種配置信息?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py 正確答案:第 4 題,使用 UIAutomatorr 根據(jù)坐標(biāo)來滑動桌面的操作是得到相應(yīng)控件后使用命令()A、swipeB、moveC、scrollDsfly 正確答案:答案來源:雅寶題庫網(wǎng)(),windows 中創(chuàng)建定時任務(wù)的命令為A、 taskB、schtasksC、createtasksDmaketasks:第 6 題,MongoDB 中數(shù)據(jù)存儲的形式類似于()AB、C、D、正確答案:第 7 題,requests 中 post 請求方法的使用為 requests.
3、post (data 為 ()A、B、C、D、正確答案:第 8 題,Python 中把列表轉(zhuǎn)換為集合需要使用#函數(shù)A、setB、listC、convertDchange正確答案:第 9 題, 使用了 RedisSpider 作為爬蟲的父類以后, 爬蟲會直接監(jiān)控()中的數(shù)據(jù), 并不讀取 start_urls中的數(shù)據(jù)。A、RedisB、RedisSpiderC、SpiderD.MongoDB正確答案:表組典合列元字集網(wǎng)址,data=data)中的表組典合列元字集答案來源:雅寶題庫網(wǎng)(),在 MacOS 下安裝 MongoDB用命令()installmongodbA、brewB、apt-getC、s
4、udoDapt正確答案:第 11 題,當(dāng)需要把 Python 里面的數(shù)據(jù)發(fā)送給網(wǎng)頁時,應(yīng)先將其轉(zhuǎn)換成()AJson 字符串B、GETC、POSTDRequest正確答案:答案來源:雅寶題庫網(wǎng)(),服務(wù)器端記錄信息確定用戶身份的數(shù)據(jù)是A、sessionB、cookiesC、moonpiesDlocalstorage正確答案:第 13 題,下列說法錯誤的是()A、小程序的請求極其簡單,基本上沒有驗證信息B、 用 Python 來請求小程序的后臺接口從而獲取數(shù)據(jù), 比請求異步加載網(wǎng)頁的后臺接口要復(fù)雜很多。C、如果目標(biāo)網(wǎng)站有小程序,那么一定要優(yōu)先調(diào)查能否通過小程序的接口來抓取數(shù)據(jù)。Dk 小程序的反爬蟲
5、能力比網(wǎng)頁版的低很多。使用小程序的接口來爬數(shù)據(jù),能極大提高爬蟲的開發(fā)效率。正確答案:第 14 題,下面 Python 代碼輸出為():defdefault_para_trap(para=口,value=0):para.append(value)returnparaprint(第步:.format(default_para_trap(value=100)print(第二步:。.format(default_para_trap(value=50)A 第一步:100第二步:100,50B、第一步:100第二步:50C、第一步:100第二步:口DK 第一步:100第二步:100正確答案:答案來源:雅寶
6、題庫網(wǎng)(),在 Scrapy 的目錄下,哪個文件負(fù)責(zé)存放爬蟲文件?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:第 16 題,xpath 中 extractA方法返回值類型是()B、C、D表組典合列元字集正確答案:第 17 題,參數(shù) headers=(),把請求頭添加到 Scrapy 請求中, 使爬蟲的請求看起來像是從瀏覽器發(fā)起的。AHEADERB、HEADERSC、HEADDBODY正確答案:第 18 題,Python 中 Object=(1,2,3,4,5),A、B、C、D則 Objcet 是()表組典合列元字集正確答案:第 1
7、9 題,在 Scrapy 的目錄下,哪個文件負(fù)責(zé)定義需要爬取的數(shù)據(jù)?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:答案來源: 雅寶題庫網(wǎng)(以()形式生成AB、C、D.表組典合列元字集正確答案:),Scrapy 中使用 Xpath 狄得的結(jié)果調(diào)用了.extract 方法,結(jié)果第 21 題,Python 中的容器有()A、B、C、D.表組典合列元字集正確答案:,B,C,D第 22 題,使用 Selennium 狄取網(wǎng)頁中元素的方法有A、find_element_by_nameB、find_element_by_idC、find_elem
8、ents_by_nameDfind_elements_by_id正確答案:,B,C,D第 23 題,一個可行的自動更換代理的爬蟲系統(tǒng),應(yīng)該下列哪些功能?A、有一個小爬蟲 ProxySpider 去各大代理網(wǎng)站爬取免費(fèi)代理并驗證,將可以使用的代理 IP保存到數(shù)據(jù)庫中B、在發(fā)現(xiàn)某個請求已經(jīng)被設(shè)置過代理后,什么也不做,直接返回C、在 ProxyMiddlerware 的 process_request 中,每次從數(shù)據(jù)庫里面隨機(jī)選擇一條代理地址使用DK 周期性驗證數(shù)據(jù)庫中的無效代理,及時將其刪除正確答案:,C,D第 24 題,下列關(guān)于在 IOS 上配置 Charles 的說法正確的是()A、不同 io
9、s 設(shè)備之間會有比較大的差別,所以配置的時候需要找到對應(yīng)的安裝證書的入口。B、手機(jī)和電腦需要在同一個局域網(wǎng)下。C、HTTP 代理可以使用自動選項。D 安裝好證書以后,打開 iOS 設(shè)備上的任何一個 App,可以看到 Charles 中有數(shù)據(jù)包在流動正確答案:,D答案來源:雅寶題庫網(wǎng)(),下列說法錯誤的是()A、mitmproxy 的強(qiáng)大之處在于它還自帶一個 mitmdump 命令。這個命令可以用來運(yùn)行符合一定規(guī)則的 Python 腳本,并在 Python 腳本里面直接操作 HTT可口 HTTPS 勺請求,以及返回的數(shù)據(jù)包。B、命令行中執(zhí)行 mitmdump-sparse_request.py
10、即可運(yùn)行 python 腳本C、使用 python 可以自定義返回的數(shù)據(jù)包,如 response.headers,就是返回的頭部信息 Dk 如果返回的是 JSONI 型的字符串,python 無法進(jìn)行解析。正確答案:第 26 題,以下 HTTP 狀態(tài)碼表示服務(wù)器本身發(fā)生錯誤的是A、400B、503C、302DK500正確答案:,D第 27 題,Python 中哪種容器生成后可以修改內(nèi)容A 列表B、元組C、字典D集合正確答案:,C,DIP第 28 題,以下 HTTP 狀態(tài)碼表示服務(wù)器沒有正常返回結(jié)果的是A、200B、301C、404D.500正確答案:,C,D第 29 題,如果目標(biāo)網(wǎng)站有反爬蟲聲
11、明,那么對方在被爬蟲爬取以后,可以據(jù)()來起訴使用爬蟲的公司A、服務(wù)器日志B、數(shù)據(jù)庫日志記錄C、程序日志記錄Dk 服務(wù)器監(jiān)控正確答案:,B,C,D答案來源:雅寶題庫網(wǎng)(),requests 中 post 請求方法的第二個參數(shù)可以為()A、字典B、列表C、json 數(shù)據(jù)D 字符串正確答案:,C第 31 題,process_spider_output(response,result,output)是在下載器中間件處理完成后,馬上要進(jìn)入某個回調(diào)函數(shù) parse_xxx()前調(diào)用T、對F、錯正確答案:F第 32 題,需要登錄的網(wǎng)站一般通過 GET 請求就可以實現(xiàn)登錄。T、對F、錯第 33 題,Pyth
12、on 中相比于 findall 方法,search 方法對于從超級大的文本里面只找第 1 個數(shù)據(jù)特別有用,可以大大提高程序的運(yùn)行效率。T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 34 題,UIAutomatorViewer 與 Pythonuiautomator 可以同時使用T、對F、錯正確答案:F第 35 題,device.sleep()方法是使用 UIAutomatorr 關(guān)閉屏幕的命令T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 36 題,在發(fā)送請求時需要注意 requests 提交的請求頭不能與瀏覽器的請求頭一致,因為這樣才能隱藏好自己達(dá)到獲取數(shù)據(jù)的目的T、對F、錯正確答案:F第 37
13、題,mitmproxy 的強(qiáng)大之處在于它還自帶一個 mitmdump 命令。這個命令可以用來運(yùn)行符合一定規(guī)則的 Python 腳本T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 38 題,MongoDB 是一個關(guān)系數(shù)據(jù)庫產(chǎn)品T、對F、錯第 39 題,Python 正則表達(dá)式中.*?”是非貪婪模式,獲取最短的能滿足條件的字符串T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 40 題,Charles 能截獲 HTT 評口 HTTPS 勺數(shù)據(jù)包,如果網(wǎng)站使用 websocket 就可以截獲T、對F、錯正確答案:F第 41 題,Charles 和 Chrome 開發(fā)者工具相比,只是多了一個搜索功能T、對F、錯
14、正確答案:第 42 題,爬蟲中間件的激活需要另外寫一個文件來進(jìn)行T、對F、錯正確答案:F第 43 題,Cookies 一般包含在請求頭 Headers 中T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 44 題,已經(jīng)創(chuàng)建好的 Scrapy 爬蟲*py 文件可以直接通過 Python 來運(yùn)行T、對F、錯正確答案:F第 45 題,如果目標(biāo)網(wǎng)站本身就是提供公眾查詢服務(wù)的網(wǎng)站,那么使用爬蟲是合法合規(guī)的T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 46 題,Redis 中使用 Irange 讀取數(shù)據(jù)后數(shù)據(jù)也會刪除T、對F、錯正確答案:第 47 題,開源庫 pytesseract 的作用是將圖像中文字轉(zhuǎn)換為文本T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 48 題,Scrapy 每一次發(fā)起請求之前都會在這里檢查網(wǎng)址是否重復(fù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 翻譯(法語)崗位考試試卷及答案
- 《洮藏黑山羊》地方標(biāo)準(zhǔn)編制說明2025
- 新型膜分離技術(shù)在水處理領(lǐng)域的效能評估
- 2025年江蘇省市場監(jiān)督管理局下屬事業(yè)單位招聘考試筆試試題【答案】
- 硝化工藝上崗證考試題及答案(含答案)
- 消費(fèi)電子行業(yè)概況
- 2025年2月實習(xí)版主個人述職報告范文
- 2025年P(guān)M10自動采樣器及測定儀項目發(fā)展計劃
- 2025年智能壓力發(fā)生器合作協(xié)議書
- 2025年實木類家具項目建議書
- 《思想道德與法治》學(xué)習(xí)通課后章節(jié)答案期末考試題庫2025年
- 清廉講堂活動方案
- 家居落地活動方案
- 2025年醫(yī)保知識考試題庫及答案:醫(yī)保信息化建設(shè)應(yīng)用法律法規(guī)試題
- 環(huán)境現(xiàn)場采樣培訓(xùn)
- 2025年 汕頭市公安局警務(wù)輔助人員招聘考試筆試試卷附答案
- 車輛傷害事故桌面功能演練方案、腳本
- XX公司年產(chǎn)10萬噸陽極銅及5萬噸銅桿項目環(huán)境影響報告書
- 陜西省專業(yè)技術(shù)人員繼續(xù)教育2025公需課《黨的二十屆三中全會精神解讀與高質(zhì)量發(fā)展》20學(xué)時題庫及答案
- 財務(wù)考試試題及答案大全
- 2024-2025學(xué)年人教版數(shù)學(xué)五年級下學(xué)期期末試卷(含答案)
評論
0/150
提交評論