




已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
制作游戲輔助教材推薦:抓取網(wǎng)頁指定內(nèi)容(資料),獲取網(wǎng)頁里的圖片來源:按鍵學(xué)院 【按鍵精靈】 最近有遇到同學(xué)反饋,網(wǎng)頁里的那些沒有特征值的文本元素不知道怎么獲取。以及,不知道怎么獲取保存網(wǎng)頁里出現(xiàn)的圖片。獲取網(wǎng)頁指定文字:目前按鍵支持的元素特征值有這些: frame(框架) 、id(唯一標(biāo)識) 、tag(標(biāo)簽) 、type(類型)、txt(文本) 、value(特征) 、index(索引) 、name(名字) 擁有這些特征值的元素才能直接使用HtmlGet命令來獲取元素文本信息。命令名稱:HtmlGet 獲取網(wǎng)頁元素的信息命令功能: 獲取網(wǎng)頁元素指定屬性的信息命令參數(shù): 參數(shù)1:字符串型,網(wǎng)頁元素屬性類型:text、html、 outerHtml、value、src、href、 offset 參數(shù)2:字符串型,網(wǎng)頁元素特征字符串 例如下面的例子,按鍵精靈論壇搜索框,它有type、name、id這三個特征值。 我們?nèi)∷黫d特征值帶入到HtmlGet 命令來查看下結(jié)果:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的網(wǎng)站Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt成功獲取到了搜索框的value值。我們現(xiàn)在想要取下面紅色區(qū)域塊的帖子標(biāo)題,想要把一個頁面中的這些帖子名稱都取出來。該怎么辦? 這些文字,都沒有特征值的。我們不能使用特征值的方式去找他們。 我們可以這樣獲取到整個網(wǎng)頁的文本之后,去找我們要取的標(biāo)題,前后不變的字符。 大家會發(fā)現(xiàn),這個頁面中,帖子標(biāo)題前后不便的字符是:“ 和 “果果。“ 那我們就將”“字符前面的文本都過濾掉,“果果。“后面的文本也過率掉,這樣就能得到我們所需要的文本。首先,我們需要復(fù)習(xí)下幾個函數(shù):InStr函數(shù)描述start可選的。規(guī)定每次搜索的起始位置。默認(rèn)是搜索起始位置是第一個字符。如果已規(guī)定 compare 參數(shù),則必須有此參數(shù)。string1必需的。需要被搜索的字符串。string2必需的。需搜索的字符串。compare必需的。規(guī)定要使用的字符串比較類型。默認(rèn)是 0 ??刹捎孟铝兄担?0= vbBinaryCompare - 執(zhí)行二進(jìn)制比較。 1 = vbTextCompare - 執(zhí)行文本比較。 Mid函數(shù)描述string必需的。從其中返回字符的字符串表達(dá)式。如果字符串包含 Null,則返回 Null。start必需的。規(guī)定起始位置。如果設(shè)置為大于字符串中的字符數(shù)目,則返回空字符串()。length可選的。要返回的字符數(shù)目。如果省略或 length 超過文本的字符數(shù),將返回字符串中從 start 到字符串結(jié)束的所有字符。Len函數(shù)描述string任意有效的字符串表達(dá)式。如果 string 參數(shù)包含Null,則返回 Null。varname任意有效的變量名。如果 varname 參數(shù)包含 Null,則返回 Null。腳本過程:1. 先打開一個要提取信息的網(wǎng)站。2. 用HtmlGet 命令 獲取整個網(wǎng)頁的文本信息,存到Txt變量里面3. 過濾符號前面的文本4. 從文本里的符號后面的位置開始取字符串,這里取了一百個字符放到命名為cc的變量里。如下圖,也可以設(shè)置取80個字符,60個字符,但是長度一定要把“果果?!?給截進(jìn)來,因為后面我們要通過“果果?!弊鳛榛鶞?zhǔn),去過濾掉不要的文字。2014-9-12 19:22 上傳下載附件 (65.96 KB) 5. 在cc變量里,找果果。出現(xiàn)的位置,找到之后,截取“果果。”之前的文本,也就是我們需要接取的地方。6. 最后,設(shè)置疊加的變量x,把每次找到的 這個符號的位置放到變量x里進(jìn)行累加,累加之后第二次循環(huán),就會跳過之前找過的內(nèi)容,進(jìn)行新的內(nèi)容的尋找。源碼:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的網(wǎng)站Delay 1000 / 如果網(wǎng)頁打開速度慢,可適當(dāng)添加延遲Txt =Plugin.Web.HtmlGet(text,)/獲取網(wǎng)頁的文本 x=1Do aa = /過濾符號前面的文本 bb = InStr(x, Txt, aa) / 返回aa變量里的這個字符 在整個網(wǎng)頁文本txt里的位置 cc = Mid(Txt, bb + Len(aa), 100)/從文本里的符號后面的位置開始取字符串,這里取了一百個字符 dd = InStr(1, cc, 果果。)/找cc字符串里,果果。出現(xiàn)的位置,果果。的位置就是我們要接取的字符串的長度 ee = Mid(cc, 1, dd)/從文本里cc里第一個字符開始,取到果果。文字出現(xiàn)的位置 If Len(ee) 0 Then /判斷有沒有取到匹配的字符 pp = Left(ee, Len(ee)-1)/如果有取到,我們還要做下處理,因為前面ee字符串是取到了果果。出現(xiàn)的位置,所以果字也被取了,我們這里長度-1,去掉果字 TracePrint pp x = InStr(x, Txt, pp) /這里做個記號,把每次找到的 這個符號的位置進(jìn)行累加,累加之后第二次循環(huán),就會跳過之前找過的內(nèi)容,進(jìn)行新的內(nèi)容的尋找。 Else Exit Do /如果沒有找到匹配的 就退出 End IfLoop 最終效果:2014-9-12 19:23 上傳下載附件 (170.42 KB) 標(biāo)題后面的?234這樣的字符是帖子總回帖的頁數(shù)獲取網(wǎng)頁圖片 我們截圖按鍵精靈官網(wǎng)的圖標(biāo): 2014-9-12 19:25 上傳下載附件 (9.33 KB) 2014-9-12 19:26 上傳下載附件 (173.2 KB) 我們可以查看圖片的具體地址代碼如下:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.Go() /打開按鍵官網(wǎng)地址Call Plugin.Web.Save(/images/logo.gif, d:123.gif)Delay 3000RunApp mspaint.exe& d:123.gif /打開畫圖工具,看看保存的圖片的效果命令名稱:Save 保存網(wǎng)頁或圖片命令功能:保存指定URL的文件到本地磁盤 命令參數(shù):參數(shù)1:字符串型,需要保存的目標(biāo)Url 參數(shù)2:字符串型,本地文件名最終效果:2014-9-12 19:30 上傳下載附件 (150.99 KB) 大家有沒有注意到,這里的按鍵精靈官網(wǎng)圖標(biāo),是gif格式的,可以保存。如果是一個鏈接呢?例如,騰訊QQ注冊頁面里的這種驗證圖片:2014-9-12 19:30 上傳下載附件 (154.34 KB) 大家看,它的圖片是保存在一個鏈接里的,這樣就無法獲取。2014-9-12 19:30 上傳下載附件 (58.92 KB) 地址是沒有變化的,但是點擊進(jìn)去之后,生成的就是另一張驗證圖片了。2014-9-12 19:30 上傳下載附件 (23.81 KB) 所以,遇到這種鏈接方式的圖片,大家還是使用查找圖片的區(qū)域坐標(biāo),然后用屏幕范圍截圖命令來截圖保存:/下面這句在屏幕區(qū)域范圍內(nèi)截圖保存到(內(nèi)存)里,以備后面調(diào)用。Call Plugin.ColorEx.PrintScreen(0, 0, 1024, 768)/下面這句在屏幕區(qū)域范圍內(nèi)按方式0,查找顏色,返回左上角第一點顏色位置坐標(biāo) XY = Plugin.ColorEx.FindColor(0, 0, 1024
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 液晶行業(yè)測試題及答案
- 林肯揚(yáng)塵測試題及答案
- 中考會考試題及答案
- 初級文秘考試題及答案
- 色盲超人測試題及答案
- 英泰移動java數(shù)據(jù)庫面試題及答案
- java代碼安全面試題及答案
- 癌癥骨轉(zhuǎn)移性疼痛的護(hù)理
- 原發(fā)性關(guān)節(jié)炎護(hù)理查房
- 法院司法禮儀培訓(xùn)
- 頸椎腫瘤的護(hù)理
- 2025至2030中國不銹鋼精密帶材行業(yè)前景預(yù)測及發(fā)展趨勢預(yù)判報告
- 無人機(jī)駕駛員雇傭合同協(xié)議
- 湖南省長沙市華益中學(xué)2023-2024學(xué)年八年級下學(xué)期期末考試英語試卷(含答案)
- (高清版)DB13∕T 2937-2019 非煤礦山雙重預(yù)防機(jī)制建設(shè)規(guī)范
- 電動船舶生產(chǎn)線項目可行性研究報告(范文參考)
- 浙江寧波歷年中考作文題與審題指導(dǎo)(2007-2021)
- 大學(xué)生醫(yī)學(xué)健康科普演講
- 冶金天車作業(yè)安全培訓(xùn)
- 《馬克思主義基本原理概論》課后思考題及答案
- 煤炭行業(yè)的企業(yè)戰(zhàn)略布局與資源整合考核試卷
評論
0/150
提交評論