數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)_第1頁(yè)
數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)_第2頁(yè)
數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)_第3頁(yè)
數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)_第4頁(yè)
數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)采集1+x初級(jí)練習(xí)題(含參考答案)一、單選題(共41題,每題1分,共41分)1.在xpath中,哪個(gè)軸可以選取當(dāng)前節(jié)點(diǎn)的所有屬性?()A、attributeB、descendantC、attrD、child正確答案:A2.以下選項(xiàng)中,不是Python語(yǔ)言特點(diǎn)的是()A、強(qiáng)制可讀:Python語(yǔ)言通過(guò)強(qiáng)制縮進(jìn)來(lái)體現(xiàn)語(yǔ)句間的邏輯關(guān)系B、平臺(tái)無(wú)關(guān):Python程序可以在任何安裝了解釋器的操作系統(tǒng)環(huán)境中執(zhí)行C、面向?qū)ο螅篜ython具有多態(tài)、運(yùn)算符重載、繼承和多重繼承等面向?qū)ο缶幊痰闹饕卣鱀、變量聲明:Python語(yǔ)言具有使用變量需要先定義后使用的特點(diǎn)正確答案:D3.取出html頁(yè)面中body下的所有子標(biāo)簽A、//*B、/body*C、/body/*D、/body/@*正確答案:C4.以下CSS中,不屬于font屬性的是()A、font-sizeB、font-weightC、sizeD、font-style正確答案:C5.XPath于1999年11月16日成為()標(biāo)準(zhǔn)?A、W3CB、XMLC、ROMCATD、以上都不對(duì)正確答案:A6.以下哪種爬蟲(chóng)又稱(chēng)為主題網(wǎng)絡(luò)爬蟲(chóng),是指選擇性的爬行那些與預(yù)先定義好的主題相關(guān)頁(yè)面的網(wǎng)絡(luò)爬蟲(chóng)A、通用網(wǎng)絡(luò)爬蟲(chóng)B、聚焦網(wǎng)絡(luò)爬蟲(chóng)C、深層頁(yè)面爬蟲(chóng)D、增量式網(wǎng)絡(luò)爬蟲(chóng)正確答案:B7.向數(shù)據(jù)表中插入一條記錄用以下哪一項(xiàng)A、CREATEB、INSERTC、SAVED、UPDATE正確答案:B8.HTML中能夠定義表單提交位置的屬性是A、actionB、methodC、titleD、name正確答案:A9.已知代碼:.a1{color:yellow;font-weight:bold;},其中利用了CSS中的哪種選擇器A、ID選擇器B、類(lèi)選擇器C、標(biāo)簽選擇器D、組合選擇器正確答案:B10.外鏈和反鏈的區(qū)別,說(shuō)法正確的是()A、兩者含義相同,只是不同名字而已B、外鏈?zhǔn)侵竿獠康木W(wǎng)站指向本網(wǎng)站,反鏈則是指向本頁(yè)面的內(nèi)部或外部鏈接C、外鏈?zhǔn)菍?duì)于全站而言,反鏈只是指首頁(yè)的鏈接D、外鏈對(duì)SEO有幫助,反鏈沒(méi)有任何幫助正確答案:D11.如果要在python中只用正則表達(dá)式,則需要引入哪個(gè)模塊A、xmlB、reC、etreeD、lxml正確答案:B12.以下哪種類(lèi)型的網(wǎng)絡(luò)容易遭受攻擊()。A、租用專(zhuān)線(xiàn)網(wǎng)絡(luò)B、無(wú)線(xiàn)網(wǎng)絡(luò)C、寬帶網(wǎng)絡(luò)D、撥號(hào)網(wǎng)絡(luò)正確答案:B13.半結(jié)構(gòu)數(shù)據(jù),是介于結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化之間的數(shù)據(jù),下面不屬于半結(jié)構(gòu)化數(shù)據(jù)的是()A、XMLB、JSONC、HTMLD、MPEG-1正確答案:D14.服務(wù)器端響應(yīng)狀態(tài)碼中,表示“NOTFOUND未找到”的是A、302B、404C、304D、200正確答案:B15.()是通過(guò)爬蟲(chóng)程序監(jiān)測(cè)某網(wǎng)站數(shù)據(jù)更新的情況,以便可以爬取到該網(wǎng)站更新的新數(shù)據(jù),對(duì)于未發(fā)生內(nèi)容變化的網(wǎng)頁(yè),則不會(huì)爬取。A、聚焦網(wǎng)絡(luò)爬蟲(chóng)B、深層頁(yè)面爬蟲(chóng)C、増量式網(wǎng)絡(luò)爬蟲(chóng)D、通用網(wǎng)絡(luò)爬蟲(chóng)正確答案:C16.Log4j定義的日志概念里不包含哪個(gè)()A、LoggerB、writerC、AppenderD、Level正確答案:B17.下列關(guān)鍵字可以用于創(chuàng)建新表的是()A、DELETETABLEB、CREATETABLEC、DROPTABLED、UPDATETABLE正確答案:B18.以下數(shù)據(jù)中,非結(jié)構(gòu)化數(shù)據(jù)不包括()A、日志文件B、圖像C、圖片D、音頻正確答案:A19.HTML中用于標(biāo)記表格的標(biāo)簽是()A、<frame>B、<table>C、<form>D、<tab>正確答案:B20.()法律中說(shuō)明“國(guó)家支持網(wǎng)絡(luò)運(yùn)營(yíng)者之間在網(wǎng)絡(luò)安全信息收集、分析、通報(bào)和應(yīng)急處置等方面進(jìn)行合作,提高網(wǎng)絡(luò)運(yùn)營(yíng)者的安全保障能力?!盇、《中華人民共和國(guó)網(wǎng)絡(luò)安全法》B、《中華人民共和國(guó)安全法》C、《電信和互聯(lián)網(wǎng)用戶(hù)個(gè)人信息保護(hù)規(guī)定》D、《民法總則》正確答案:A21.以下哪一項(xiàng)與網(wǎng)站優(yōu)化關(guān)鍵詞排名無(wú)關(guān)()A、網(wǎng)站空間穩(wěn)定性B、網(wǎng)站程序復(fù)雜度C、網(wǎng)站域名D、網(wǎng)站開(kāi)發(fā)語(yǔ)言正確答案:D22.()是進(jìn)行數(shù)據(jù)清洗的工具。A、tomcatB、logstashC、apacheD、filebeat正確答案:B23.下面哪種方式是普通用戶(hù)進(jìn)入網(wǎng)站的方式A、收藏夾B、直接打網(wǎng)址C、百度首頁(yè)D、導(dǎo)航類(lèi)網(wǎng)站正確答案:D24.哪個(gè)表達(dá)式用來(lái)從根節(jié)點(diǎn)選???A、..B、.C、/D、@正確答案:C25.Scrapy中,用于創(chuàng)建項(xiàng)目的命令是A、createprojectB、startprojectC、openprojectD、beginproject正確答案:B26.在SQL語(yǔ)言中提交事務(wù)的操作是通過(guò)()語(yǔ)句實(shí)現(xiàn)的A、CREATEB、REVOKEC、COMMITD、ROLLBACK正確答案:C27.當(dāng)前INTERNET上應(yīng)用最廣泛的服務(wù)是A、WWWB、E-MailC、30~40個(gè)D、40個(gè)以上正確答案:A28.在Linux環(huán)境下的Apache容器數(shù)據(jù)的采集中,啟動(dòng)apache服務(wù)代碼是()。A、httpdB、startup.batC、filebeatD、logstash正確答案:A29.修改數(shù)據(jù)庫(kù)表結(jié)構(gòu)用以下哪一項(xiàng)A、UPDATEB、CREATEC、UPDATEDD、ALTER正確答案:D30.能夠?qū)崿F(xiàn)數(shù)據(jù)鏈路層的互聯(lián)設(shè)備有()A、網(wǎng)管B、網(wǎng)橋C、路由D、中繼器正確答案:B31.哪個(gè)匹配空白行的正則表達(dá)式?A、sB、s*C、*D、以上都不對(duì)正確答案:B32.關(guān)于Python,算法是指()A、程序設(shè)計(jì)語(yǔ)言的語(yǔ)句序列B、對(duì)問(wèn)題的精確描述C、解決問(wèn)題的精確步驟D、數(shù)學(xué)的計(jì)算公式正確答案:C33.scrapy的哪個(gè)命令可以測(cè)試爬取網(wǎng)頁(yè)的整個(gè)過(guò)程A、scrapyshellB、scrapyfetchC、scrapyviewD、scrapybench正確答案:D34.哪個(gè)表達(dá)式用來(lái)選取屬性?A、@B、.C、/D、..正確答案:A35.哪個(gè)表達(dá)式用來(lái)選取當(dāng)前節(jié)點(diǎn)?A、@B、/C、..D、.正確答案:D36.ATM的基本單位是信元,其長(zhǎng)度為()A、5字節(jié)B、53字節(jié)C、48字節(jié)D、32字節(jié)正確答案:B37.數(shù)據(jù)定義語(yǔ)言的縮寫(xiě)詞為()A、DDLB、DCLC、DMLD、DBL正確答案:A38.將網(wǎng)絡(luò)認(rèn)為局域網(wǎng)、城域網(wǎng)、廣域網(wǎng)三種,是按照哪種方式進(jìn)行分類(lèi)的A、按地理范圍分B、按傳輸技術(shù)分C、按拓?fù)浣Y(jié)構(gòu)分D、按使用范圍分正確答案:A39.Tomcat的默認(rèn)端口是()。A、80B、8080C、8089D、7070正確答案:B40.以下BeautifulSoup4的描述中,錯(cuò)誤的是A、BeautifulSoup可以進(jìn)行html文檔的解析,但不能實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的抓取B、默認(rèn)使用的是標(biāo)準(zhǔn)庫(kù)解析器C、使用lxmlHTML解析器對(duì)文檔的糾錯(cuò)能力強(qiáng),但解析速度較慢D、自動(dòng)將輸入文檔轉(zhuǎn)換為Unicode編碼,輸出文檔轉(zhuǎn)換為utf-8編碼。正確答案:C41.用于將事務(wù)處理寫(xiě)到數(shù)據(jù)庫(kù)的命令是()A、insertB、commitC、rollbackD、savepoint正確答案:B二、多選題(共21題,每題1分,共21分)1.關(guān)于socket編程,對(duì)于服務(wù)端編程的主要步驟包括()A、打開(kāi)socketB、監(jiān)聽(tīng)客戶(hù)端連接C、綁定到一個(gè)地址和端口D、讀寫(xiě)數(shù)據(jù)正確答案:ABCD2.requests模塊向服務(wù)器發(fā)送請(qǐng)求的方法有()A、putB、deleteC、getD、post正確答案:ABCD3.以下哪幾項(xiàng)是Android平臺(tái)的特性()A、允許重用和替換組件的應(yīng)用程序框架B、專(zhuān)門(mén)為移動(dòng)設(shè)備優(yōu)化的Dalvik虛擬機(jī)C、支持?jǐn)?shù)據(jù)結(jié)構(gòu)化存儲(chǔ)的SQLiteD、支持?jǐn)z像頭、GPS、指南針和加速計(jì)等外圍設(shè)備正確答案:ABCD4.基于監(jiān)聽(tīng)接口的事件處理模型包含哪些步驟:()A、調(diào)用事件源的setXXXListener方法注冊(cè)事件監(jiān)聽(tīng)器B、獲取普通界面組件C、實(shí)現(xiàn)事件監(jiān)聽(tīng)類(lèi),該監(jiān)聽(tīng)類(lèi)是一個(gè)特殊的java類(lèi),必須實(shí)現(xiàn)一個(gè)XXXListener接口D、通過(guò)重寫(xiě)View中的回調(diào)方法來(lái)實(shí)現(xiàn)需要的響應(yīng)事件正確答案:ABC5.以下屬于CRM主要應(yīng)用方面的是()。A、客戶(hù)檔案有序管理B、合同管理C、銷(xiāo)售報(bào)表D、預(yù)測(cè)銷(xiāo)售業(yè)績(jī)正確答案:ABCD6.關(guān)于Python注釋?zhuān)韵逻x項(xiàng)中描述正確的是()A、注釋可用于標(biāo)明作者和版權(quán)信息B、注釋用于解釋代碼原理或者用途C、注釋可以輔助程序調(diào)試D、Python注釋語(yǔ)句不被解釋器過(guò)濾掉,也不被執(zhí)行正確答案:ABC7.正則表達(dá)式中常用于表示字符的元字符是A、"."B、"s"C、""D、"w"正確答案:AD8.以下對(duì)INSERT語(yǔ)句,說(shuō)法正確的是()。A、INSERT語(yǔ)句是數(shù)據(jù)操縱語(yǔ)言中的一條語(yǔ)句B、在使用INSERT語(yǔ)句執(zhí)行數(shù)據(jù)插入時(shí),表中的列順序一定要與提供的值順序相同C、在使用INSERT語(yǔ)句執(zhí)行數(shù)據(jù)插入時(shí),必須為表中所有列定義數(shù)據(jù)值D、在插入數(shù)據(jù)時(shí),應(yīng)當(dāng)滿(mǎn)足表中定義的檢查約束正確答案:ABD9.TCP/IP在應(yīng)用層的協(xié)議主要包括()A、ICMPB、FTPC、HTTPD、Telnet正確答案:ACD10.下列哪些是DML語(yǔ)句是()A、INSERTB、ALTERC、UPDATED、DELETE正確答案:ACD11.以下對(duì)網(wǎng)站排名有較大影響的因素是()A、Title標(biāo)簽B、Keywords標(biāo)簽C、網(wǎng)站內(nèi)容D、服務(wù)器穩(wěn)定性正確答案:ACD12.常見(jiàn)的URL分隔符包括()A、*(星)B、$(美元符號(hào))C、_(下劃線(xiàn))D、/(反斜杠)正確答案:CD13.Python中,關(guān)于輸出函數(shù)描述正確的是()A、print()函數(shù)的所有參數(shù)均可省略B、在輸出多個(gè)數(shù)據(jù)時(shí),默認(rèn)使用空格作為輸出分隔符C、可用file參數(shù)設(shè)置,將數(shù)據(jù)輸出到文件D、print()函數(shù)默認(rèn)以回車(chē)換行符號(hào)作為輸出結(jié)尾符正確答案:ABCD14.正則表達(dá)式的特點(diǎn)?A、功能性B、靈活性C、邏輯性D、復(fù)雜性正確答案:ABC15.以下屬于Python保留字的是()A、defB、yieldC、passD、finally正確答案:ABCD16.CRM主要應(yīng)用于哪些方面()A、客戶(hù)檔案有序管理B、合同管理C、銷(xiāo)售報(bào)表D、外勤簽到E、預(yù)測(cè)銷(xiāo)售業(yè)績(jī)正確答案:ABCDE17.以下關(guān)于資源命名的規(guī)則正確的有:()A、在同一個(gè)資源類(lèi)型的目錄中不能存在文件名相同,擴(kuò)展名不同的資源文件B、資源命名要符合Java變量命名規(guī)范C、資源文件名不可使用大寫(xiě)D、同類(lèi)資源的文件名或變量名不能重復(fù)正確答案:ABCD18.以下選項(xiàng)中是操作系統(tǒng)的是()A、DOSB、Windows95C、MSWordD、Redhat正確答案:ABD19.對(duì)于日志類(lèi)型的數(shù)據(jù)采集,常用的采集工具有A、filebeatB、scrapyC、logstashD、beautifulSoup正確答案:AC20.業(yè)務(wù)系統(tǒng)中產(chǎn)生的日志數(shù)據(jù)有哪些作用()A、優(yōu)化系統(tǒng)性能B、為企業(yè)應(yīng)用系統(tǒng)糾錯(cuò)C、安全管理D、跟蹤系統(tǒng)的運(yùn)行正確答案:ABCD21.關(guān)于Python的特點(diǎn),包括()A、功能強(qiáng)大B、支持面向?qū)ο驝、具有良好的跨平臺(tái)特性D、是免費(fèi)和開(kāi)源的正確答案:ABCD三、判斷題(共37題,每題1分,共37分)1.在網(wǎng)頁(yè)數(shù)據(jù)采集過(guò)程中,一般需要經(jīng)過(guò)采集、清洗兩個(gè)步驟。A、正確B、錯(cuò)誤正確答案:B2.關(guān)鍵詞密度根本不用考慮,只要不堆積就行A、正確B、錯(cuò)誤正確答案:B3.假設(shè)列表對(duì)象aList的值為[3,4,5,6,7,9,11,13,15,17],那么切片aList[3:7]得到的值是[6,7,9,11]A、正確B、錯(cuò)誤正確答案:A4.管槽安裝的基本要求包括走最短的路由。A、正確B、錯(cuò)誤正確答案:B5.優(yōu)先級(jí)是進(jìn)程調(diào)度的重要依據(jù),一旦確定不能改變。A、正確B、錯(cuò)誤正確答案:B6.ARP協(xié)議可以通過(guò)IP地址獲取對(duì)應(yīng)主機(jī)的物理地址,是網(wǎng)絡(luò)層協(xié)議。A、正確B、錯(cuò)誤正確答案:A7.某些情況下,單向通信也能有反方向的交互A、正確B、錯(cuò)誤正確答案:B8.在Tomcat中的應(yīng)用程序一定是一個(gè)WAR(WebArchive)文件A、正確B、錯(cuò)誤正確答案:B9.Tomcat是Apache軟件基金會(huì)推出的一個(gè)收費(fèi)的Servlet容器A、正確B、錯(cuò)誤正確答案:B10.del命令只可以刪除列表中的一個(gè)元素,不能刪除整個(gè)列表。A、正確B、錯(cuò)誤正確答案:B11.list(map(str,[1,2,3]))的執(zhí)行結(jié)果為[1],[2],[3]A、正確B、錯(cuò)誤正確答案:B12.Requests庫(kù)請(qǐng)求方法使用時(shí),有一些頁(yè)面只能通過(guò)從另一個(gè)頁(yè)面單擊某個(gè)鏈接或者某個(gè)按鈕以后跳過(guò)來(lái),不能直接通過(guò)在瀏覽器輸入網(wǎng)址訪(fǎng)問(wèn),這種網(wǎng)頁(yè)就要使用GET方式。A、正確B、錯(cuò)誤正確答案:B13.網(wǎng)絡(luò)備份和負(fù)載均衡在冗余設(shè)計(jì)的物理結(jié)構(gòu)上完全一致,但是完成的功能完全不同。A、正確B、錯(cuò)誤正確答案:A14.Tomcat作為獨(dú)立服務(wù)器:請(qǐng)求來(lái)自于web瀏覽器A、正確B、錯(cuò)誤正確答案:A15.tomcat也叫servlet容器。A、正確B、錯(cuò)誤正確答案:A16.靜態(tài)路由是手工添加,適用于小型網(wǎng)絡(luò),動(dòng)態(tài)路由是自動(dòng)生成路徑,適用于大型網(wǎng)絡(luò)。A、正確B、錯(cuò)誤正確答案:A17.Python中,可以利用del命令刪除元組中的部分元素。A、正確B、錯(cuò)誤正確答案:B18.logstash工具是服務(wù)器A、正確B、錯(cuò)誤正確答案:B19.在傳輸層有兩個(gè)性質(zhì)不同的協(xié)議:TCP和UDP。A、正確B、錯(cuò)誤正確答案:A20.Linux系統(tǒng)中有一個(gè)文件的文件名為aaa.txt,那么這個(gè)文件的擴(kuò)展名為txt。A、正確B、錯(cuò)誤正確答案:B21.在Select語(yǔ)句中查詢(xún)條件必須有。在Select語(yǔ)句中查詢(xún)條件必須有A、正確B、錯(cuò)誤正確答案:B22.在數(shù)據(jù)庫(kù)的概念設(shè)計(jì)中,最常用的數(shù)據(jù)模型是實(shí)體聯(lián)系模型A、正確B、錯(cuò)誤正確答案:A23.python開(kāi)發(fā)中,list(map(str,[1,2,3]))的執(zhí)行結(jié)果為[1],[2],[3]A、正確B、錯(cuò)誤正確答案:B24.x=[1,2,1,1]foriinx[:]:ifi==1:x.remove(i)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論