


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
網(wǎng)頁(yè)圖片無(wú)障礙替代文本自動(dòng)生成算法設(shè)計(jì)與實(shí)現(xiàn)的中期報(bào)告一、問(wèn)題描述:在網(wǎng)頁(yè)上,圖片對(duì)于視覺(jué)障礙人士存在一定的難度。因此,無(wú)障礙替代文本是一項(xiàng)重要的功能,能夠提供給屏幕識(shí)別器和語(yǔ)音識(shí)別儀使用。因此,我們需要一種算法來(lái)實(shí)現(xiàn)自動(dòng)為網(wǎng)頁(yè)圖像生成替代文本的需求。二、前期調(diào)研:1、需要分類的圖片我們需要分類以下兩種圖片:(1)信息性圖片:包含文字或圖形式的內(nèi)容(2)裝飾性圖片:無(wú)特殊含義的純圖片2、圖片分析的難點(diǎn)在對(duì)網(wǎng)頁(yè)圖片進(jìn)行分析時(shí),主要有以下難點(diǎn):(1)圖片含義不明確無(wú)法確定圖片的確切含義,因此無(wú)法生成可讀性高、易理解的文本。(2)同一圖片多種語(yǔ)義同一張圖片可能有不同類型的解釋,不確定使用哪種解釋會(huì)更好。(3)圖片較少文本例如,一張包含文字的圖片,但文本量很少,這時(shí)很難生成合適的描述文本。三、算法設(shè)計(jì):1、采用OCR技術(shù)識(shí)別圖片的文本部分,自動(dòng)生成替代文本對(duì)于信息性圖片,我們可以使用OCR技術(shù),提取并識(shí)別圖片中的文本部分,然后根據(jù)文本內(nèi)容生成替代文本。2、根據(jù)圖片特征與語(yǔ)意分類對(duì)于裝飾性圖片,我們使用圖像處理技術(shù)分析圖片差異,尋找有規(guī)律的圖片簇,并按圖片規(guī)律與語(yǔ)意分類,給出合適的替代文本。3、使用人類工作直接替換對(duì)于一些無(wú)法利用算法進(jìn)行處理且不能通過(guò)圖像處理直接獲取有用信息的圖片,我們只能通過(guò)人類工作來(lái)編寫(xiě)合適的替代文本。四、算法實(shí)現(xiàn):1、基于OCR技術(shù),使用Tesseract識(shí)別圖片中的文本部分2、使用機(jī)器學(xué)習(xí)算法生成圖片的特征向量,并根據(jù)特征向量分類3、為每個(gè)分類生成合適的替代文本五、下一步工作:基于以上算法實(shí)現(xiàn),下一步需要進(jìn)行以下工作:1、完善OCR技術(shù)的識(shí)別準(zhǔn)確率2、提高圖片語(yǔ)義分類的準(zhǔn)確性,例如引入自然語(yǔ)言處理技術(shù)3、加入人工審核機(jī)制,確保生成的替代文本的質(zhì)量4、開(kāi)發(fā)可視化工具,方便人工審核,并加快生成速度。六、參考文獻(xiàn):[1]C.Yadav,U.Chaturvedi,andA.Kumari,“AutomaticExtractionOfRelevantTextFromImagesForVisuallyImpairedPeople,”IEEETransactionsonNeuralNetworksandLearningSystems,vol.27,no.10,pp.2220-2232,Oct.2016.[2]D.YangandM.Q.Hu,“ImageCaptioningBasedonConvolutionalNeuralNetworkandVisualAttention,”IEEETransactionsonMultimedia,vol.21,no.11,pp.2715-2726,Nov.2019.[3]P.Singh,S.Pandey,andP.Rai,“ImageTextDetectionUsingTesseractOCRAndAMaximumEntropyModel,”IEEETransactionsonNeural
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程代理授權(quán)書(shū)示例2篇
- 學(xué)習(xí)成長(zhǎng)我愿意迎接挑戰(zhàn)無(wú)所懼3篇
- 室內(nèi)設(shè)計(jì)委托協(xié)議書(shū)模板3篇
- 寵物守護(hù)寵物保險(xiǎn)協(xié)議3篇
- 有關(guān)運(yùn)動(dòng)會(huì)心得體會(huì)范文(18篇)
- 影樓工作總結(jié)(5篇)
- 少年當(dāng)自強(qiáng)的演講稿(14篇)
- 出國(guó)(境)留學(xué)(進(jìn)修、工作)協(xié)議(4篇)
- 歌唱比賽活動(dòng)方案(3篇)
- 2024年馬鞍山雨山區(qū)秀山文苑托育園招聘制工作人員考試真題
- 財(cái)報(bào)分析-伊利
- 神經(jīng)外科科室質(zhì)量管理小組工作制度
- 山東省2024年夏季普通高中學(xué)業(yè)水平合格考試地理試題02(解析版)
- 英語(yǔ)四級(jí)模擬試題(附答案)
- 福建晉華的測(cè)評(píng)題庫(kù)
- 干部履歷表填寫(xiě)范本(中共中央組織部1999年)
- 水庫(kù)溢洪道畢業(yè)設(shè)計(jì)
- 《中國(guó)建筑的特征》課件++2023-2024學(xué)年統(tǒng)編版高中語(yǔ)文必修下冊(cè)
- 2024年中層干部選拔筆試試題卷
- 市政工程施工組織設(shè)計(jì)方案
- 2024-2030年中國(guó)汽車座椅行業(yè)市場(chǎng)發(fā)展分析及競(jìng)爭(zhēng)格局與投資前景研究報(bào)告
評(píng)論
0/150
提交評(píng)論