第四章計(jì)算機(jī)信息檢索_第1頁(yè)
第四章計(jì)算機(jī)信息檢索_第2頁(yè)
第四章計(jì)算機(jī)信息檢索_第3頁(yè)
第四章計(jì)算機(jī)信息檢索_第4頁(yè)
第四章計(jì)算機(jī)信息檢索_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章第四章 計(jì)算機(jī)信息檢索計(jì)算機(jī)信息檢索 n計(jì)算機(jī)信息檢索系統(tǒng)計(jì)算機(jī)信息檢索系統(tǒng)n數(shù)據(jù)庫(kù)的類(lèi)型及結(jié)構(gòu)數(shù)據(jù)庫(kù)的類(lèi)型及結(jié)構(gòu)n計(jì)算機(jī)信息檢索的原理計(jì)算機(jī)信息檢索的原理計(jì)算機(jī)信息計(jì)算機(jī)信息檢索系統(tǒng)的構(gòu)成檢索系統(tǒng)的構(gòu)成計(jì)算機(jī)信息檢索系統(tǒng)的類(lèi)型計(jì)算機(jī)信息檢索系統(tǒng)的類(lèi)型(一)計(jì)算機(jī)信息(一)計(jì)算機(jī)信息檢索系統(tǒng)檢索系統(tǒng)的構(gòu)成的構(gòu)成1、概念、概念計(jì)算機(jī)信息檢索計(jì)算機(jī)信息檢索(簡(jiǎn)稱(chēng)機(jī)檢),指檢索人員在(簡(jiǎn)稱(chēng)機(jī)檢),指檢索人員在電子計(jì)算機(jī)或計(jì)算機(jī)網(wǎng)絡(luò)的終端上,對(duì)用戶(hù)的電子計(jì)算機(jī)或計(jì)算機(jī)網(wǎng)絡(luò)的終端上,對(duì)用戶(hù)的檢索提問(wèn)使用檢索提問(wèn)使用特定的檢索指令和組配關(guān)系特定的檢索指令和組配關(guān)系,由,由計(jì)算機(jī)從數(shù)據(jù)庫(kù)中檢索出所需的

2、文獻(xiàn)、事實(shí)、計(jì)算機(jī)從數(shù)據(jù)庫(kù)中檢索出所需的文獻(xiàn)、事實(shí)、數(shù)據(jù)或其他記錄,用電子化的手段傳輸,顯示數(shù)據(jù)或其他記錄,用電子化的手段傳輸,顯示或打印檢索結(jié)果,提供給用戶(hù)使用的過(guò)程或打印檢索結(jié)果,提供給用戶(hù)使用的過(guò)程.計(jì)算機(jī)信息檢索系統(tǒng)計(jì)算機(jī)信息檢索系統(tǒng)利用計(jì)算機(jī)的有利用計(jì)算機(jī)的有效存貯和快速查找能力來(lái)進(jìn)行信息的分析、效存貯和快速查找能力來(lái)進(jìn)行信息的分析、組織、存貯和查找的系統(tǒng)。組織、存貯和查找的系統(tǒng)。2 2、構(gòu)成、構(gòu)成按物理構(gòu)成分:按物理構(gòu)成分:硬件硬件、軟件軟件、數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)(1)硬件系統(tǒng))硬件系統(tǒng): 主機(jī)主機(jī):計(jì)算機(jī)的核心部件。:計(jì)算機(jī)的核心部件。 外圍設(shè)備外圍設(shè)備: 外部存貯器:磁帶、磁盤(pán)、光盤(pán)等

3、外部存貯器:磁帶、磁盤(pán)、光盤(pán)等 輸輸入輸出設(shè)備:數(shù)據(jù)錄入設(shè)備、鍵盤(pán)、鼠標(biāo)器、光學(xué)入輸出設(shè)備:數(shù)據(jù)錄入設(shè)備、鍵盤(pán)、鼠標(biāo)器、光學(xué)字符識(shí)別裝置、光筆、縮微掃描器、掃描儀、顯示字符識(shí)別裝置、光筆、縮微掃描器、掃描儀、顯示終端等。終端等。其他其他:運(yùn)算器、控制器。:運(yùn)算器、控制器。(2)軟件系統(tǒng))軟件系統(tǒng)軟件是軟件是用來(lái)管理、控制與規(guī)定計(jì)算機(jī)運(yùn)行步驟用來(lái)管理、控制與規(guī)定計(jì)算機(jī)運(yùn)行步驟的的各種程序的總稱(chēng)各種程序的總稱(chēng)。包括包括系統(tǒng)軟件和應(yīng)用軟件系統(tǒng)軟件和應(yīng)用軟件。系統(tǒng)軟件:系統(tǒng)軟件: 主要用于簡(jiǎn)化設(shè)計(jì)及使用方法,管理主要用于簡(jiǎn)化設(shè)計(jì)及使用方法,管理計(jì)算機(jī)資源,提高其使用效率,發(fā)揮和擴(kuò)大其功計(jì)算機(jī)資源,提高

4、其使用效率,發(fā)揮和擴(kuò)大其功能及用途。包括各種系統(tǒng)服務(wù)程序、語(yǔ)言處理程能及用途。包括各種系統(tǒng)服務(wù)程序、語(yǔ)言處理程序、操作及數(shù)據(jù)庫(kù)管理系統(tǒng)。序、操作及數(shù)據(jù)庫(kù)管理系統(tǒng)。如如WINDOWS。應(yīng)用軟件應(yīng)用軟件(檢索軟件檢索軟件),),是用戶(hù)利用計(jì)算機(jī)來(lái)是用戶(hù)利用計(jì)算機(jī)來(lái)解決某一問(wèn)題而編制的程序,解決某一問(wèn)題而編制的程序,包括數(shù)據(jù)庫(kù)管理系包括數(shù)據(jù)庫(kù)管理系統(tǒng)、自動(dòng)標(biāo)引、輸入輸出控制軟件及檢索匹配程統(tǒng)、自動(dòng)標(biāo)引、輸入輸出控制軟件及檢索匹配程序等序等.如文件管理程序、檢索程序、記帳統(tǒng)計(jì)程序如文件管理程序、檢索程序、記帳統(tǒng)計(jì)程序等。等。(3)數(shù)據(jù)庫(kù))數(shù)據(jù)庫(kù)其含義有多種表達(dá):其含義有多種表達(dá):國(guó)際標(biāo)準(zhǔn)組織標(biāo)準(zhǔn)國(guó)際標(biāo)

5、準(zhǔn)組織標(biāo)準(zhǔn)ISO/DIS5127規(guī)定,數(shù)據(jù)庫(kù)是指規(guī)定,數(shù)據(jù)庫(kù)是指至少由一種文檔至少由一種文檔(file)組成,能滿(mǎn)足特定目的或特定組成,能滿(mǎn)足特定目的或特定功能數(shù)據(jù)處理系統(tǒng)需要的功能數(shù)據(jù)處理系統(tǒng)需要的數(shù)據(jù)集合數(shù)據(jù)集合.數(shù)據(jù)庫(kù)是數(shù)據(jù)庫(kù)是“按照數(shù)據(jù)結(jié)構(gòu)來(lái)組織、存儲(chǔ)和管理按照數(shù)據(jù)結(jié)構(gòu)來(lái)組織、存儲(chǔ)和管理數(shù)據(jù)的數(shù)據(jù)的倉(cāng)庫(kù)倉(cāng)庫(kù)”。數(shù)據(jù)庫(kù)(數(shù)據(jù)庫(kù)(DataBase,DB)是一個(gè)長(zhǎng)期存儲(chǔ)在計(jì)算機(jī))是一個(gè)長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi)的、有組織的、有共享的、統(tǒng)一管理的內(nèi)的、有組織的、有共享的、統(tǒng)一管理的數(shù)據(jù)集合數(shù)據(jù)集合。它是一個(gè)按數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)和管理數(shù)據(jù)的它是一個(gè)按數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)和管理數(shù)據(jù)的計(jì)算機(jī)軟計(jì)算機(jī)軟件件系統(tǒng)系統(tǒng) 。

6、數(shù)據(jù)庫(kù)是依照某種數(shù)據(jù)庫(kù)是依照某種數(shù)據(jù)模型數(shù)據(jù)模型組織起來(lái)并存放二級(jí)組織起來(lái)并存放二級(jí)存儲(chǔ)存儲(chǔ)器器中的中的數(shù)據(jù)集合數(shù)據(jù)集合 (二)計(jì)算機(jī)檢索系統(tǒng)的功能(二)計(jì)算機(jī)檢索系統(tǒng)的功能1.信息處理、存貯與檢索的功能信息處理、存貯與檢索的功能: 包括對(duì)包括對(duì)信息的自動(dòng)搜集、排序、生成關(guān)聯(lián)數(shù)據(jù)庫(kù),信息的自動(dòng)搜集、排序、生成關(guān)聯(lián)數(shù)據(jù)庫(kù),并按一定方式進(jìn)行檢索。并按一定方式進(jìn)行檢索。2.輸出功能輸出功能:將檢出文獻(xiàn)按一定的格式(目:將檢出文獻(xiàn)按一定的格式(目錄、題錄、文摘或全文等)輸出。錄、題錄、文摘或全文等)輸出。3.自我完善與更新的功能自我完善與更新的功能:即可維護(hù)功能:即可維護(hù)功能4.網(wǎng)上檢索功能:網(wǎng)上檢索

7、功能:三、計(jì)算機(jī)信息檢索系統(tǒng)的類(lèi)型三、計(jì)算機(jī)信息檢索系統(tǒng)的類(lèi)型檢索系統(tǒng)存儲(chǔ)的內(nèi)容檢索系統(tǒng)存儲(chǔ)的內(nèi)容文獻(xiàn)信息檢索系統(tǒng)文獻(xiàn)信息檢索系統(tǒng)事實(shí)信息檢索系統(tǒng)事實(shí)信息檢索系統(tǒng)數(shù)值信息檢索系統(tǒng)數(shù)值信息檢索系統(tǒng)圖像信息檢索系統(tǒng)圖像信息檢索系統(tǒng)多媒體信息檢索系統(tǒng)多媒體信息檢索系統(tǒng)檢索訪(fǎng)問(wèn)模式檢索訪(fǎng)問(wèn)模式脫機(jī)信息檢索系統(tǒng)(脫機(jī)信息檢索系統(tǒng)(20世紀(jì)世紀(jì)5060年代)年代)聯(lián)機(jī)信息檢索系統(tǒng)(聯(lián)機(jī)信息檢索系統(tǒng)(20世紀(jì)世紀(jì)70年代年代光盤(pán)信息檢索系統(tǒng)(光盤(pán)信息檢索系統(tǒng)(20世紀(jì)世紀(jì)80年代年代網(wǎng)絡(luò)信息檢索系統(tǒng)(網(wǎng)絡(luò)信息檢索系統(tǒng)(20世紀(jì)世紀(jì)90年代年代如:按檢索系統(tǒng)的訪(fǎng)問(wèn)模式分如:按檢索系統(tǒng)的訪(fǎng)問(wèn)模式分 1脫機(jī)檢索脫

8、機(jī)檢索 是采用單機(jī)進(jìn)行存儲(chǔ)和處理信息,回答檢索提問(wèn)是采用單機(jī)進(jìn)行存儲(chǔ)和處理信息,回答檢索提問(wèn)時(shí),采用批處理方式。這種機(jī)檢方式,時(shí),采用批處理方式。這種機(jī)檢方式,人機(jī)不能人機(jī)不能進(jìn)行應(yīng)答,必須由專(zhuān)職人員建立用戶(hù)提問(wèn)檔,系進(jìn)行應(yīng)答,必須由專(zhuān)職人員建立用戶(hù)提問(wèn)檔,系統(tǒng)定期進(jìn)行檢索統(tǒng)定期進(jìn)行檢索。時(shí)間:時(shí)間:20世紀(jì)世紀(jì)50年代年代60年代年代 檢索人員檢索人員檢索策略檢索策略成批檢索成批檢索用戶(hù)用戶(hù) 不足:地理上的障礙;時(shí)間上的遲滯;封閉式的不足:地理上的障礙;時(shí)間上的遲滯;封閉式的檢索檢索2.2.聯(lián)機(jī)檢索聯(lián)機(jī)檢索( (Online search)Online search)聯(lián)機(jī)檢索是指利用檢索終端

9、,通過(guò)聯(lián)機(jī)檢索是指利用檢索終端,通過(guò)通信網(wǎng)絡(luò)通信網(wǎng)絡(luò)和檢和檢索系統(tǒng)聯(lián)機(jī),從檢索系統(tǒng)的數(shù)據(jù)庫(kù)中進(jìn)行檢索索系統(tǒng)聯(lián)機(jī),從檢索系統(tǒng)的數(shù)據(jù)庫(kù)中進(jìn)行檢索 時(shí)間:時(shí)間:20世紀(jì)世紀(jì)70年代年代 用戶(hù)用戶(hù) 檢索策略檢索策略“人機(jī)對(duì)話(huà)人機(jī)對(duì)話(huà)” 獲取所需信獲取所需信息息 著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)有美國(guó)的著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)有美國(guó)的DIALOG系統(tǒng)、系統(tǒng)、ORBIT系統(tǒng)、系統(tǒng)、BRS系統(tǒng)以及系統(tǒng)以及IBM公司的公司的“文獻(xiàn)文獻(xiàn)處理系統(tǒng)處理系統(tǒng)”等等.3.光盤(pán)檢索光盤(pán)檢索( (CD-ROM search)CD-ROM search)時(shí)間:時(shí)間:20世紀(jì)世紀(jì)80年代以后年代以后光盤(pán)檢索階段:光盤(pán)檢索階段:?jiǎn)螜C(jī)光盤(pán)檢索

10、單機(jī)光盤(pán)檢索 聯(lián)機(jī)光盤(pán)檢索聯(lián)機(jī)光盤(pán)檢索(光盤(pán)庫(kù)光盤(pán)庫(kù),2-6個(gè)個(gè)光驅(qū),多達(dá)光驅(qū),多達(dá)500張光盤(pán)張光盤(pán)光盤(pán)塔光盤(pán)塔,8-64個(gè)光個(gè)光驅(qū))驅(qū))。WAN)連接連接地理地理范圍較大,常常是一個(gè)國(guó)家范圍較大,常常是一個(gè)國(guó)家或是一個(gè)洲或是一個(gè)洲通信系統(tǒng)是通信系統(tǒng)是廣域網(wǎng)廣域網(wǎng)的關(guān)鍵的關(guān)鍵LAN)MAN)(Internetwork):是一系列是一系列局域網(wǎng)局域網(wǎng)和和廣域網(wǎng)廣域網(wǎng)的組合,的組合,Internet便是一個(gè)當(dāng)前最大也最為典型的便是一個(gè)當(dāng)前最大也最為典型的網(wǎng)間網(wǎng)。網(wǎng)間網(wǎng)。 第二節(jié)、第二節(jié)、 數(shù)據(jù)庫(kù)的類(lèi)型及結(jié)構(gòu)數(shù)據(jù)庫(kù)的類(lèi)型及結(jié)構(gòu)數(shù)據(jù)庫(kù)的類(lèi)型數(shù)據(jù)庫(kù)的類(lèi)型 數(shù)據(jù)庫(kù)的結(jié)構(gòu)數(shù)據(jù)庫(kù)的結(jié)構(gòu)(一)數(shù)據(jù)庫(kù)的類(lèi)型(一

11、)數(shù)據(jù)庫(kù)的類(lèi)型按存儲(chǔ)文獻(xiàn)類(lèi)型分為按存儲(chǔ)文獻(xiàn)類(lèi)型分為:1.全文數(shù)據(jù)庫(kù)全文數(shù)據(jù)庫(kù): 存貯一次文獻(xiàn)全文或其中主存貯一次文獻(xiàn)全文或其中主要部分等。要部分等。2.書(shū)目數(shù)據(jù)庫(kù)書(shū)目數(shù)據(jù)庫(kù): 存貯文摘、索引、目錄、題存貯文摘、索引、目錄、題錄等二次文獻(xiàn),提供文獻(xiàn)線(xiàn)索,一般都有相錄等二次文獻(xiàn),提供文獻(xiàn)線(xiàn)索,一般都有相應(yīng)的印刷型檢索工具。應(yīng)的印刷型檢索工具。書(shū)目型全文型(一)數(shù)據(jù)庫(kù)的類(lèi)型(續(xù))3.事實(shí)數(shù)據(jù)庫(kù)事實(shí)數(shù)據(jù)庫(kù) 指包含大量數(shù)據(jù)、事實(shí)的數(shù)據(jù)庫(kù),指包含大量數(shù)據(jù)、事實(shí)的數(shù)據(jù)庫(kù),如指南數(shù)據(jù)庫(kù)、術(shù)語(yǔ)數(shù)據(jù)庫(kù)等,相當(dāng)于印刷如指南數(shù)據(jù)庫(kù)、術(shù)語(yǔ)數(shù)據(jù)庫(kù)等,相當(dāng)于印刷型文獻(xiàn)中的字典、辭典、百科全書(shū)、組織機(jī)型文獻(xiàn)中的字典、辭典、百

12、科全書(shū)、組織機(jī)構(gòu)指南、人名錄、圖冊(cè)(集)等。構(gòu)指南、人名錄、圖冊(cè)(集)等。4.數(shù)值數(shù)據(jù)庫(kù)數(shù)值數(shù)據(jù)庫(kù) 提供數(shù)值信息,如統(tǒng)計(jì)數(shù)據(jù)庫(kù)提供數(shù)值信息,如統(tǒng)計(jì)數(shù)據(jù)庫(kù)5.圖像數(shù)據(jù)庫(kù)圖像數(shù)據(jù)庫(kù) 提供圖像信息。提供圖像信息。6.多媒體數(shù)據(jù)庫(kù)多媒體數(shù)據(jù)庫(kù) 提供文字、圖像和聲音等多種提供文字、圖像和聲音等多種信息。信息。數(shù)值型(二)數(shù)據(jù)庫(kù)的結(jié)構(gòu)(二)數(shù)據(jù)庫(kù)的結(jié)構(gòu) 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)database文檔文檔file,archive 順排文檔順排文檔 記錄記錄Record字段字段Field倒排文檔(索引倒排文檔(索引index)1、記錄( (record)record)記錄記錄:構(gòu)成數(shù)據(jù)庫(kù)的基本單元構(gòu)成數(shù)據(jù)庫(kù)的基本單元,也也

13、是是文文檔的構(gòu)成單位,檔的構(gòu)成單位,是對(duì)某一實(shí)體的屬性進(jìn)是對(duì)某一實(shí)體的屬性進(jìn)行描述的結(jié)果。在書(shū)目數(shù)據(jù)庫(kù)中,被行描述的結(jié)果。在書(shū)目數(shù)據(jù)庫(kù)中,被描述的實(shí)體是某一特定文獻(xiàn),其屬性描述的實(shí)體是某一特定文獻(xiàn),其屬性就是該文獻(xiàn)的外表特征和內(nèi)容特征。就是該文獻(xiàn)的外表特征和內(nèi)容特征。即一條文獻(xiàn)信息(款目)即一條文獻(xiàn)信息(款目)。如:一條文摘信息(記錄) 一條一條書(shū)目信息書(shū)目信息( (記錄記錄) ): : ACCESSION: 31739598ACCESSION: 31739598 AUTHOR: Dichter, Carl. AUTHOR: Dichter, Carl. TITLE: Software eng

14、ineering with Perl TITLE: Software engineering with Perl PLACE: Englewood Cliffs, N.J. PLACE: Englewood Cliffs, N.J. PUBLISHER: Prentice Hall PTR,PUBLISHER: Prentice Hall PTR, YEAR: 1995 YEAR: 1995 PUB TYPE: Book PUB TYPE: Book FORMAT: 282 p. : ill.; 24 cm. + 1 computer disk (3 1/2 in.) FORMAT: 282

15、p. : ill.; 24 cm. + 1 computer disk (3 1/2 in.) NOTES: Includes bibliographical references NOTES: Includes bibliographical references (p. 267-268) and index System requirements (p. 267-268) and index System requirements for accompanying computer disk: High Density for accompanying computer disk: Hig

16、h Density MSDOS; Macintosh with PC Exchange. MSDOS; Macintosh with PC Exchange. ISBN: 013016965X ISBN: 013016965X SUBJECT: Software engineering. SUBJECT: Software engineering. Perl (Computer program language) Perl (Computer program language) Software - Engineering Software - Engineering OTHER: Pease

17、, Mark. OTHER: Pease, Mark.2 2、字段(、字段(field)field)是組成記錄的下級(jí)單位是組成記錄的下級(jí)單位( (條目中的一個(gè)條目中的一個(gè)信息項(xiàng)信息項(xiàng)) ) ,用來(lái)描述實(shí)體的某一具體屬,用來(lái)描述實(shí)體的某一具體屬性。如表述文獻(xiàn)內(nèi)容特征的有文摘、敘性。如表述文獻(xiàn)內(nèi)容特征的有文摘、敘詞、自由詞字段,表述文獻(xiàn)外表特征的詞、自由詞字段,表述文獻(xiàn)外表特征的有著者、篇名、出版年、專(zhuān)利號(hào)等等字有著者、篇名、出版年、專(zhuān)利號(hào)等等字段,段,( (subfield)subfield),是字段的構(gòu)成單位。是字段的構(gòu)成單位。 順排文檔順排文檔是將記錄中的信是將記錄中的信息按某一字段息按某一

18、字段(一般為存取(一般為存取號(hào))的順序存號(hào))的順序存放起來(lái)形成的放起來(lái)形成的文檔文檔,通常按記通常按記錄存入的先后順?shù)洿嫒氲南群箜樞蚓€(xiàn)性排列,所序線(xiàn)性排列,所以也稱(chēng)為以也稱(chēng)為線(xiàn)性文線(xiàn)性文檔檔,或,或主文檔主文檔.122 Student Teaching in the Context of a School-University123 Cooperative Learning in Response to an 124 In Search of Responsive Teaching for 125 Teaching Topography: Introducing Students to Con

19、tour Map Construction. Fife, Barbara S. Science Teacher, v62 n5 p38-43 May 1995 ISSN: 0036-8555 Available From: UMI倒排文檔倒排文檔 n數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)的“索引索引”即是即是它的倒排文檔,它的倒排文檔,它是將它是將記錄中一切可檢索的標(biāo)記錄中一切可檢索的標(biāo)識(shí)抽出,按某種順序識(shí)抽出,按某種順序(如字順,分類(lèi))重新(如字順,分類(lèi))重新排列而形成的文檔排列而形成的文檔。如。如主題、著者、文種等倒主題、著者、文種等倒排文檔。排文檔。倒排文檔著者倒排檔主題倒排檔文種倒排檔著者存取號(hào)主題詞存取號(hào)文

20、種存取號(hào)Han js010003基因010003China010002Han qd010001心血管010001Eng010003Ma dl010002腫瘤010002Eng010001第三節(jié)、計(jì)算機(jī)信息檢索的原理第三節(jié)、計(jì)算機(jī)信息檢索的原理 信息信息存貯存貯信息信息檢索檢索一、信息存貯一、信息存貯信息的存貯實(shí)際上是生成數(shù)據(jù)庫(kù):信息的存貯實(shí)際上是生成數(shù)據(jù)庫(kù):文獻(xiàn)數(shù)據(jù)文獻(xiàn)數(shù)據(jù)庫(kù)的形成,先產(chǎn)生線(xiàn)性主文檔,然后依一庫(kù)的形成,先產(chǎn)生線(xiàn)性主文檔,然后依一定的規(guī)則,由線(xiàn)性文檔構(gòu)造倒排文檔。這定的規(guī)則,由線(xiàn)性文檔構(gòu)造倒排文檔。這個(gè)過(guò)程要對(duì)禁用詞和詞標(biāo)引作一些處理。個(gè)過(guò)程要對(duì)禁用詞和詞標(biāo)引作一些處理。禁用詞:

21、禁用詞: 是指那些頻率較高而對(duì)標(biāo)引和檢索是指那些頻率較高而對(duì)標(biāo)引和檢索沒(méi)有價(jià)值的詞,如一些介詞,連詞,冠詞沒(méi)有價(jià)值的詞,如一些介詞,連詞,冠詞及一些泛指意義的詞等及一些泛指意義的詞等。布爾邏輯檢索布爾邏輯檢索截詞檢索截詞檢索字段限定檢索字段限定檢索全文檢索全文檢索 ?1、布爾邏輯檢索、布爾邏輯檢索它是不同的它是不同的單一主題概念單一主題概念,通過(guò),通過(guò)“布爾布爾”邏輯算符組配形成邏輯算符組配形成多主題概念多主題概念的檢索式。的檢索式。常用的布爾邏輯算符有常用的布爾邏輯算符有4 4種:邏輯與種:邏輯與(ANDAND、* *)、)、邏輯或(邏輯或(OROR、+ +)、)、邏邏輯非(輯非(NOTNO

22、T、- -)、異或(、異或(XOR,XOR,不常不常用)用)。如如solar和和energy,它們的三種邏輯組它們的三種邏輯組配關(guān)系分別為:配關(guān)系分別為: 邏輯與邏輯與( (andand、* *、空格等、空格等) )solar and energysolar and energysolar solar * * energy energy 邏輯或(邏輯或(oror、+ +、 ) solar or energysolar or energysolar + energysolar + energy 邏輯非邏輯非(notnot、- -、) solar not energy solar not ener

23、gy solar - energysolar - energy例如:例如:n1、“城市綠化城市綠化”n檢索式:檢索式:城市綠化城市綠化+(城市城市+北京天津上海北京天津上海+ )*(園林綠化(園林綠化+綠化建設(shè)綠化建設(shè))n(禾谷類(lèi)作物禾谷類(lèi)作物+小麥小麥+水稻水稻+玉米玉米+)* 病害病害 -(白粉白粉?。┎。﹏3、土壤環(huán)境條件對(duì)豆科植物固氮作用的影響、土壤環(huán)境條件對(duì)豆科植物固氮作用的影響n(yōu)關(guān)鍵詞:土壤環(huán)境條件(溫度、濕度,關(guān)鍵詞:土壤環(huán)境條件(溫度、濕度,ph值)值) 豆科豆科植物(大豆、花生等)植物(大豆、花生等) 固氮作用(固氮菌、根瘤菌)固氮作用(固氮菌、根瘤菌)n檢索式:檢索式:(土

24、壤環(huán)境條件土壤環(huán)境條件+溫度溫度+濕度濕度+ph值值)*(豆科豆科植物植物+大豆大豆+花生花生+)*(固氮作用固氮作用+固氮菌固氮菌+根瘤菌根瘤菌)2 2、截詞、截詞(truncation)檢索檢索截詞截詞指檢索者將檢索詞在他認(rèn)為合適的地方截?cái)唷V笝z索者將檢索詞在他認(rèn)為合適的地方截?cái)?。截詞檢索截詞檢索( (也稱(chēng)模糊檢索或詞干檢索也稱(chēng)模糊檢索或詞干檢索) ),是用截?cái)嗟脑~的一,是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡是滿(mǎn)足這個(gè)詞局部中的所個(gè)局部進(jìn)行的檢索,并認(rèn)為凡是滿(mǎn)足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中文獻(xiàn)。有字符(串)的文獻(xiàn),都為命中文獻(xiàn)。截詞符號(hào)截詞符號(hào)一般為一般為“ ?”,也常

25、用,也常用“$ $”, ,“* *”。加在檢索詞的加在檢索詞的詞干或不完整的詞形后或中間詞干或不完整的詞形后或中間,可以減少詞的輸入量??梢詼p少詞的輸入量。其基本含義是布爾邏輯其基本含義是布爾邏輯OR的組配的組配截詞方式截詞方式: :根據(jù)截詞的位置不同分為:根據(jù)截詞的位置不同分為:前截?cái)?、后截?cái)?、中截?cái)嗲敖財(cái)唷⒑蠼財(cái)?、中截?cái)?;根?jù)截?cái)嗟臄?shù)量不同分為:有限截?cái)嗪蜔o(wú)限截?cái)?。根?jù)截?cái)嗟臄?shù)量不同分為:有限截?cái)嗪蜔o(wú)限截?cái)?。后方截詞后方截詞:在一個(gè)詞干后加一個(gè)在一個(gè)詞干后加一個(gè)“*”,表示可,表示可檢出在該詞后加任意個(gè)字符或不加字符的記錄,檢出在該詞后加任意個(gè)字符或不加字符的記錄,如如computer*,

26、可檢出可檢出computer,computers,computerisation等詞。等詞。前方截詞前方截詞:如:如*computer,可檢出可檢出computer,minicomputer,microcomputer等等前后截詞前后截詞 又稱(chēng)無(wú)限中截詞,它是又稱(chēng)無(wú)限中截詞,它是滿(mǎn)足中間一致滿(mǎn)足中間一致的檢索。的檢索。用截詞符用截詞符“*、?、?”加在詞干的前后,表示檢索詞與被加在詞干的前后,表示檢索詞與被檢索詞之間只需中間匹配即可,如檢索詞之間只需中間匹配即可,如“*relation*”,可,可檢索出檢索出“relation”,“relations”,“interrelation”等等。等等

27、。 A.無(wú)限截詞無(wú)限截詞*(或叫或叫非限定性截詞非限定性截詞? ?)有限后截詞有限后截詞: :smoksmok?,其后最多有三個(gè)字符變化,其后最多有三個(gè)字符變化可檢出:可檢出:smoksmoke e, smok, smoky y, smok, smokerer, , smoksmokersers,smok,smokeses, smok, smokinging等等SmokSmok?, ,最多有兩個(gè)字符變化最多有兩個(gè)字符變化, ,可檢出可檢出: : smoker, smokes等等.smoksmok? ? ?,最多有一個(gè)字符變化最多有一個(gè)字符變化可檢出:可檢出:smoksmoke e, smok,

28、 smoky y等等B B、有限截詞有限截詞(controlled Length controlled Length truncationtruncation)()(又叫又叫限定性截詞限定性截詞 )有限中截詞有限中截詞(中間屏詞中間屏詞)如: wom?n可檢出: women woman如: fib?board 可檢出: fiberboard fibreboard3、字段限定檢索、字段限定檢索n將將檢索詞限定檢索詞限定在某一字段中,檢索時(shí),計(jì)算機(jī)只對(duì)限在某一字段中,檢索時(shí),計(jì)算機(jī)只對(duì)限定字段進(jìn)行運(yùn)算。定字段進(jìn)行運(yùn)算。nA.A.主主題題字段字段: :是是內(nèi)內(nèi)容特征的字段(有容特征的字段(有Titl

29、e,KeywordsTitle,Keywords,Subject,SummarySubject,Summary等等) )nB B、非主題字段非主題字段:是外部特征字段,如作者、文獻(xiàn)類(lèi)型、語(yǔ)是外部特征字段,如作者、文獻(xiàn)類(lèi)型、語(yǔ)種、出版年份等字段種、出版年份等字段. .常用的檢索符號(hào)有:常用的檢索符號(hào)有: in、=、 例1:English in la 例2: py1992 例例3:查:查“玉米方面的英文玉米方面的英文”文獻(xiàn)文獻(xiàn) 檢索式檢索式=(maize or zea-mays or corn)in de and(English in la)4、全文檢索、全文檢索又叫位置檢索又叫位置檢索posit

30、ion operators)、或、或鄰接檢索(proximity)限定兩個(gè)關(guān)鍵詞在限定兩個(gè)關(guān)鍵詞在文本中的距離,文本中的距離, (1)記錄級(jí)檢索)記錄級(jí)檢索C(cition)兩詞必須同時(shí)出現(xiàn)在兩詞必須同時(shí)出現(xiàn)在同一同一文獻(xiàn)記錄中文獻(xiàn)記錄中,不限定詞序和字段不限定詞序和字段.如如 Solar (C) energy(2)字段級(jí)檢索)字段級(jí)檢索nF(field)兩詞必須同時(shí)出現(xiàn)在文兩詞必須同時(shí)出現(xiàn)在文獻(xiàn)記錄的獻(xiàn)記錄的同一個(gè)字段中,詞序和詞間插同一個(gè)字段中,詞序和詞間插入詞數(shù)不限入詞數(shù)不限,但需指明要查找的字段,但需指明要查找的字段,如如pollution (F) control/ABn文摘中含有如:

31、文摘中含有如:control and management of industrial pollution ,等等均為命中文獻(xiàn),等等均為命中文獻(xiàn) 。(3)子字段級(jí)檢索子字段級(jí)檢索S(Subfield)表示兩詞必須同時(shí)出現(xiàn)在表示兩詞必須同時(shí)出現(xiàn)在同同一個(gè)一個(gè)子子字段字段中,即同一句子或短語(yǔ)中中,即同一句子或短語(yǔ)中,詞序和,詞序和中間插入詞數(shù)不限中間插入詞數(shù)不限 。Same(Sent)兩個(gè)詞在同一個(gè)段落中。兩個(gè)詞在同一個(gè)段落中。 (4)詞位置檢索詞位置檢索W(with)或或 Pre檢索算符兩側(cè)的詞必須相檢索算符兩側(cè)的詞必須相鄰且鄰且詞序不能顛倒詞序不能顛倒。如如:(w)(w)及及( (nW)nW)

32、與(與(withwith) flue( flue(w w)cure tobacco)cure tobacco 可檢出:可檢出: flueflue- -cure tobaccocure tobacco flue flue cure tobaccocure tobaccobuildingbuilding( (1W1W) )constructionconstruction可檢出可檢出: : building building andand construction construction building building underunder construction construction等

33、等N(near)檢索算符兩側(cè)的詞必須相鄰但檢索算符兩側(cè)的詞必須相鄰但詞序可以變。詞序可以變。如:如:( (N)N)及及( (nN)nN)鄰近(鄰近(nearnear)如:如:information(1N)retrievalinformation(1N)retrieval可檢出可檢出: :information retrievalinformation retrieval,retrieval retrieval of informationof information等等L(link)檢索算符兩側(cè)的詞必須在數(shù)據(jù)庫(kù)界檢索算符兩側(cè)的詞必須在數(shù)據(jù)庫(kù)界定的統(tǒng)一規(guī)范字段內(nèi)。且有一定的從屬關(guān)系定的統(tǒng)一規(guī)范字段內(nèi)。且有一定的從屬關(guān)系,可以用來(lái)鏈接主標(biāo)題詞和副標(biāo)題詞可以用來(lái)鏈接主標(biāo)題詞和副標(biāo)題詞X X兩邊的檢索兩邊的檢索詞完全一致,并以指定的順序相鄰詞完全一致,并以指定的順序相鄰.注意:注意:不是每一個(gè)檢索系統(tǒng)都使用上述位置算符,不同不是每一個(gè)檢索系統(tǒng)都使用上述位置算符,不同的系統(tǒng)使用的位置算

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論