




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選文檔計(jì)算機(jī)檢索的步驟和方法一、明確檢索要求和檢索目標(biāo)計(jì)算機(jī)檢索的第一步預(yù)備工作是明確檢索要求和檢索目標(biāo)。明確檢索要求就是要搞清楚本課題屬于什么學(xué)科,所需文獻(xiàn)的類型及語(yǔ)種,查找文獻(xiàn)的年月,所需文獻(xiàn)的最佳篇數(shù),允許支配的檢索費(fèi)用。這些要求對(duì)選擇數(shù)據(jù)庫(kù)、構(gòu)造檢索策略都是格外重要的。 確定檢索目標(biāo)也是進(jìn)行計(jì)算機(jī)信息檢索前應(yīng)搞清楚的預(yù)備工作。例如:假如屬于開題調(diào)研,則應(yīng)盡可能地檢索出與之相關(guān)的全部文獻(xiàn),即要求較高的查全率;以便充分地做好開題的預(yù)備工作;假如屬于探究性、開創(chuàng)性的課題,則只需要查出一些啟發(fā)性的文獻(xiàn),對(duì)查準(zhǔn)率和查全率要求都不肯定有很高的要求。 二、課題分析1. 課題概念的分析方法 分析課題
2、就是分析出課題所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析概念之間的上、下、左、右關(guān)系。對(duì)于新學(xué)科、交叉學(xué)科和邊緣學(xué)科的課題,則要搞清楚這些概念之間的關(guān)系。概念分析的結(jié)果應(yīng)以概念組為單元的詞或詞組的形式列出,以便下一步制訂檢索策略時(shí)使用。 2. 隱含概念的分析方法有些課題的實(shí)質(zhì)性內(nèi)容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關(guān)的內(nèi)容需要從課題所屬的專業(yè)角度作深化分析,才能提煉出能夠精確反映課題內(nèi)容的檢索概念。例如:"社會(huì)保障"包含"養(yǎng)老保險(xiǎn)"、"失業(yè)保險(xiǎn)"、"醫(yī)療保險(xiǎn)"和"社
3、會(huì)救濟(jì)"等概念,假如要檢索社會(huì)保障方面的文獻(xiàn),應(yīng)當(dāng)析出上述概念,才能保證文獻(xiàn)的查全率。 3. 核心概念的選取有些檢索詞中已經(jīng)含有的某些概念,在概念分析中應(yīng)予以排解。例如:課題"公司勞動(dòng)嘉獎(jiǎng)、職工培訓(xùn)和養(yǎng)老保險(xiǎn)制度管理的理論和實(shí)踐",假如把"勞動(dòng)嘉獎(jiǎng)","職工培訓(xùn)","養(yǎng)老保險(xiǎn)","公司","制度","管理"六個(gè)概念全部組配起來,則會(huì)造成大量文獻(xiàn)漏檢。實(shí)際上,勞動(dòng)力資源管理已經(jīng)包含了勞動(dòng)嘉獎(jiǎng)、職工培訓(xùn)和養(yǎng)老保險(xiǎn)三個(gè)方面,而且,勞動(dòng)力管理必定是針對(duì)該
4、三個(gè)方面而言的。因此,本課題只須接受"勞動(dòng)力資源"和"管理"這兩個(gè)本質(zhì)概念即可。 為了提高文獻(xiàn)的查準(zhǔn)率,應(yīng)當(dāng)從相應(yīng)的規(guī)范詞表中選擇所需的檢索詞。并且在確定檢索詞時(shí),除了要考慮反映主題概念的同義詞、近義詞等相關(guān)的檢索詞外,還要留意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避開漏檢有關(guān)的文獻(xiàn)。 三、檢索詞的擴(kuò)展、選擇和處理目前的計(jì)算機(jī)信息檢索系統(tǒng),還不具備智能思考的力量,還不會(huì)對(duì)所輸入的檢索詞以及涉及的全部詞進(jìn)行自動(dòng)、全面的檢索,因此,必需在概念分析的基礎(chǔ)上列出與概念有關(guān)的詞,從中做出選擇,并利用截詞等方法對(duì)檢索詞予以歸并。 1相同概念的檢索詞的擴(kuò)展擴(kuò)展相同
5、概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法 (1) 同義詞方法。在同一概念的范疇內(nèi),從語(yǔ)言角度,選擇不同的名稱、不同的拼寫方法和單復(fù)數(shù)形式。不同的名稱包括學(xué)名和俗名、簡(jiǎn)稱和全稱,商品名和物質(zhì)或產(chǎn)品名,事物的代碼和事物的學(xué)名。不同的拼寫方法,以英語(yǔ)為例,包括英式英語(yǔ)和美式英語(yǔ)的區(qū)分。 (2)截詞方法。當(dāng)某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(shí)(多數(shù)英語(yǔ)單詞的單復(fù)數(shù)變化和英美不同拼寫形式),可以接受截詞方法擴(kuò)展檢索詞。這種方法要求在詞干后使用截詞符。截詞符一般包括"?"和"*"兩種。具體接受什么形式,各個(gè)系統(tǒng)都有明確的規(guī)定。例如:
6、在DIALOG系統(tǒng)中,截詞符號(hào)有無限截詞算符 ("?") 和有限截詞 ("?"和"? ?")等多種,"?"有時(shí)還用做字符屏蔽符。(3)主題詞表方法。很多數(shù)據(jù)庫(kù)都編有自己的主題詞表。在數(shù)據(jù)庫(kù)編有主題詞表的狀況下,應(yīng)當(dāng)盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規(guī)范,提高檢索結(jié)果的精確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關(guān)詞,使獲得的檢索結(jié)果更為抱負(fù)。 2檢索詞的選擇和處理運(yùn)用上述方法得到的詞,首先應(yīng)加以選擇,并且留意選用本專業(yè)通用的術(shù)語(yǔ)(應(yīng)避開使用冷僻詞和依據(jù)中文術(shù)語(yǔ)自譯生造的詞),然后以
7、概念為單位,構(gòu)成組面(facets)。例如:課題"東西方社會(huì)保障制度比較爭(zhēng)辯"的概念組面和檢索詞為: 概念組面1:"社會(huì)保障" social security 概念組面2:"制度爭(zhēng)辯"system? Research四、數(shù)據(jù)庫(kù)的選擇不同數(shù)據(jù)庫(kù)的學(xué)科范圍不同,檢索指令不同,收費(fèi)的標(biāo)準(zhǔn)也不同。所以,在檢索之前應(yīng)當(dāng)閱讀有關(guān)數(shù)據(jù)庫(kù)的使用介紹,以便選擇數(shù)據(jù)庫(kù)時(shí)做到心中有數(shù)。 選擇數(shù)據(jù)庫(kù),我們一般應(yīng)當(dāng)遵循以下幾條原則:1依據(jù)課題的檢索要求和目的,選擇收錄文獻(xiàn)種類多、專業(yè)掩蓋面寬、年月跨度對(duì)口的數(shù)據(jù)庫(kù); 2當(dāng)需要查找最新文獻(xiàn)信息時(shí),選擇數(shù)據(jù)更新周期
8、短的數(shù)據(jù)庫(kù);3當(dāng)還需要獵取原文時(shí),選取原文獵取較簡(jiǎn)潔的數(shù)據(jù)庫(kù); 4在同時(shí)有多個(gè)數(shù)據(jù)庫(kù)可供選擇的狀況下,應(yīng)首先選擇比較生疏的數(shù)據(jù)庫(kù)。 5當(dāng)幾個(gè)數(shù)據(jù)庫(kù)的內(nèi)容交*重復(fù)率比較高時(shí),應(yīng)選擇檢索費(fèi)用比較低的數(shù)據(jù)庫(kù)。 五、檢索策略構(gòu)成和調(diào)整方法在實(shí)際檢索過程中,僅需一個(gè)檢索詞就能滿足檢索要求的狀況并不很多。通常我們需要使用多個(gè)檢索詞構(gòu)成檢索策略,以滿足由多概念組配而成的較為簡(jiǎn)單課題的要求。 檢索策略,又稱提問規(guī)律,就是對(duì)多個(gè)檢索詞之間的相互關(guān)系和檢索挨次作出的某種支配。構(gòu)造檢索策略就是運(yùn)用計(jì)算機(jī)情報(bào)檢索系統(tǒng)可以接受的方法,包括布爾規(guī)律算符、位置規(guī)律算符等方法,表達(dá)課題檢索要求的過程。 1布爾規(guī)律算符規(guī)定檢索
9、詞之間的規(guī)律關(guān)系的算符,稱為布爾規(guī)律算符。布爾規(guī)律算符包括規(guī)律"或(OR)"、"與(AND)"和"非(NOT)"。 (1) 或(OR)運(yùn)算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,猶如義詞、相關(guān)詞等。其含義是,檢出的記錄中,至少含有兩個(gè)檢索詞中的一個(gè)。OR算符的基本作用是擴(kuò)大檢索范圍,增加命中文獻(xiàn)量,提高檢索結(jié)果的查全率,OR運(yùn)算符還有一個(gè)去重的功能。在實(shí)際檢索中,同一組面中含義相同的詞,相互之間都使用OR運(yùn)算符。另外,在使用截詞方法檢索具有相同詞干的檢索詞時(shí),這些詞之間也自動(dòng)地隱含了規(guī)律"
10、或"的關(guān)系。 (2) 與(AND)運(yùn)算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必需同時(shí)含有全部的檢索詞。AND算符的基本作用是縮小檢索范圍,削減命中文獻(xiàn)量,提高檢索結(jié)果的查準(zhǔn)率。在實(shí)際檢索中,不同概念組面之間以及同一組面內(nèi)的不同含義的詞之間通常使用AND算符。 (3) 非(NOT)運(yùn)算符。也可用"-"代替,但在檢索時(shí)建議使用NOT,以避開與詞間的分隔符"-"混淆,NOT算符是排解含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時(shí)含有其后的詞。NOT算符的基本作用是縮小檢索范圍,提
11、高檢索結(jié)果的查準(zhǔn)率. 對(duì)于一個(gè)簡(jiǎn)單的規(guī)律檢索式,檢索系統(tǒng)的處理是從左向右進(jìn)行的。在有括號(hào)的狀況下,先執(zhí)行括號(hào)內(nèi)的運(yùn)算;有多層括號(hào)時(shí),先執(zhí)行最內(nèi)層括號(hào)中的運(yùn)算,逐層向外進(jìn)行。在沒有括號(hào)的狀況下,And、Or、Not的運(yùn)算次序,在不同的系統(tǒng)中有不同的規(guī)定。 2. 位置算符位置算符又稱鄰接算符(adjacent operators),適用于兩個(gè)檢索詞以指定間隔距離或者指定的挨次消滅的場(chǎng)合,比如,以詞組形式表達(dá)的概念;彼此相鄰的兩個(gè)或兩個(gè)以上的詞;被禁用詞或特殊符號(hào)分隔的詞等。位置算符是調(diào)整檢索策略的一種重要手段。依據(jù)兩個(gè)檢索詞消滅的挨次和距離,可以有多種位置算符,而且對(duì)同一種位置算符,檢索系統(tǒng)不同,
12、規(guī)定的位置算符也不同。例如,Compendex光盤數(shù)據(jù)庫(kù)使用的位置算符"(N)"(表示其兩側(cè)的檢索詞必需緊密相連,除開空格和標(biāo)點(diǎn)符號(hào)外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側(cè)的檢索詞必需在同一字段(例猶如在題目字段或文摘字段)中消滅,兩詞的詞序可以顛倒)、"(S)"(表示其兩側(cè)的檢索詞必需在同一句子中消滅,兩詞的詞序可以顛倒)和"(W)"(表示其兩側(cè)的檢索詞必需緊密相連,除開空格和標(biāo)點(diǎn)符號(hào)外,不得插入其它詞或字母,兩詞的詞序不行以顛倒)四種(如下所列)。 (1)(nW)算符:表示兩個(gè)檢索
13、詞(關(guān)鍵詞、主題詞)中間可以插入“n”個(gè)詞,但他們之間的挨次不能顛倒,但允許有一空格或標(biāo)點(diǎn)符號(hào)。 (2)(nN)算符:表示兩個(gè)檢索詞(關(guān)鍵詞、主題詞)中間可以插入“n”個(gè)詞,且詞序可以顛倒。 (3)(F)算符:表示兩個(gè)檢索詞(關(guān)鍵詞、主題詞)必需消滅在同一個(gè)字段內(nèi),但兩詞的詞序和中間插入的詞數(shù)不限。 (4)(S)算符:表示兩個(gè)檢索詞(關(guān)鍵詞、主題詞)必需消滅在同一個(gè)子字段內(nèi),但兩詞的詞序和中間插入的詞數(shù)不限。 留意:在不同的數(shù)據(jù)庫(kù)中,位置算符檢索功能及算符不同,應(yīng)參看數(shù)據(jù)庫(kù)的使用說明。 3字段限制字段限制也是調(diào)整檢索策略的一種重要的手段。它是限定檢索詞必需在數(shù)據(jù)庫(kù)記錄中規(guī)定的字段范圍內(nèi)消滅的文
14、獻(xiàn),方為命中文獻(xiàn)的一種檢索方法。假如想指定在題名等字段中查找所期望的檢索詞,就需要使用字段限制。字段限制適用于在已有肯定數(shù)量輸出記錄的基礎(chǔ)上,通過指定字段的方法,削減輸出篇數(shù),提高檢索結(jié)果的查準(zhǔn)率的場(chǎng)合。由于字段限制接受前綴和后綴的形式,因此又稱為前綴限制和后綴限制。例如Compendex光盤數(shù)據(jù)庫(kù)基本字段限制的用法是在需要指定字段的檢索詞后加上后綴運(yùn)算符"/"和段碼。這個(gè)數(shù)據(jù)庫(kù)幫助字段限制的用法是在需要指定字段的檢索詞(有時(shí)檢索詞須放在雙引號(hào)內(nèi))之前加上段碼和前綴運(yùn)算符"="。 常用的字段代碼有標(biāo)題(TI)、文摘(AB)、敘詞(DE)、識(shí)別詞或自由詞(
15、ID)、作者(AU)、語(yǔ)種(LA)、刊名(JN)、文獻(xiàn)類型(DT)、年月(PY)等。這些限制符在不同的數(shù)據(jù)庫(kù)系統(tǒng)有不同的表達(dá)形式和使用規(guī)章。4. 截詞符檢索(Truncation、Wildcard Symbols)利用檢索詞(關(guān)鍵詞、主題詞)的詞干或不完整詞形進(jìn)行查找的過程為截詞檢索。它可以起到擴(kuò)大檢索范圍,提高查全率,削減檢索詞(關(guān)鍵詞、主題詞)(關(guān)鍵詞、主題詞)的輸入量,節(jié)省檢索時(shí)間。尤其在英文檢索系統(tǒng)中檢索時(shí),若遇到名詞的單復(fù)數(shù)形式,詞的不同拼寫法,詞的后綴變化時(shí),均可接受此方法。截詞的方式有多種,可以分為有限截詞、無限截詞和中間截詞。 (1)有限截詞:有限后截詞主要用于詞的單、復(fù)數(shù),動(dòng)
16、詞的詞尾變化等。將“n”個(gè)截詞符放在檢索詞(關(guān)鍵詞、主題詞)的詞干或詞尾可能變化的位置上。 (2)中間截詞:一般來說,中間截詞僅允許有限截詞,主要用于英、美拼寫不同的詞和單復(fù)數(shù)拼寫不同的詞。例如:wom?n woman women (3)無限截詞:截去某個(gè)詞的尾部,是詞的前方全都比較,也稱前方全都檢索。在檢索詞(關(guān)鍵詞、主題詞)干后加1個(gè)截詞符 “?”或“*”。表示該詞尾允許變化的字符數(shù)不受任何限制。例如:comput* 可檢索出 computer、computing、computers、computering、computeriation 等詞的記錄。 任何一種截詞檢索,都隱含著布爾規(guī)律檢索
17、的“或”運(yùn)算。接受截詞檢索時(shí),既要機(jī)敏、又要謹(jǐn)慎,截詞的部位要適當(dāng),假如截得太短(輸入的字符不得少于3個(gè)),將影響查準(zhǔn)率。另外,不同的檢索系統(tǒng)使用的截詞符不同、各數(shù)據(jù)庫(kù)所支持的截?cái)囝愋鸵膊煌?不肯定能滿足課題檢索的要求,例如:或者檢出的篇數(shù)過多,而且不相關(guān)文獻(xiàn)所占比例很大,或者檢出的文獻(xiàn)數(shù)量太少,有時(shí)甚至為零,這時(shí)就需要調(diào)整檢索策略。 調(diào)整檢索策略之前,首先要分析造成檢索結(jié)果不抱負(fù)的緣由。對(duì)于輸出篇數(shù)過多的狀況,應(yīng)分析是否是由下述緣由造成的:選用了多義性的檢索詞;截詞截得過短;輸入的檢索詞太少;應(yīng)當(dāng)使用"與(AND)"的使用了"或(OR)";優(yōu)先運(yùn)算符
18、"()"使用錯(cuò)誤。對(duì)于輸出篇數(shù)過少的狀況,應(yīng)分析是否是由下述緣由造成的:檢索詞拼寫錯(cuò)誤;遺漏重要的同義詞或隱含概念;檢索詞過于冷僻具體;沒有使用截詞算符;位置算符和字段算符使用的過多;使用過多的"與(AND)"算符。 針對(duì)上述緣由,假如是屬于需要擴(kuò)大檢索范圍,提高文獻(xiàn)查全率,調(diào)整檢索策略的方法有:削減"與(AND)"算符,增加同義詞或同族相關(guān)詞使用規(guī)律或(OR)將它們連接起來;在詞干相同的單詞后使用截詞符(?);去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。 假如是屬于縮小檢索范圍,提高文獻(xiàn)查準(zhǔn)率的,調(diào)整檢索策略
19、的方法有:削減同義詞或同族相關(guān)詞;增加限制概念,用規(guī)律與(AND)將它們連接起來;使用字段限制,或者限定檢索詞在指定的基本字段,或者指定的幫助字段消滅,限制檢索結(jié)果的文獻(xiàn)類型、語(yǔ)種、出版國(guó)家;使用適當(dāng)?shù)奈恢盟惴?;使?quot;非(NOT)"算符,排解無關(guān)概念。 六、輸出格式和方式的選擇所謂輸出格式的選擇是對(duì)記錄字段的選擇。所謂輸出方式的選擇是指對(duì)屏幕顯示、打印和存盤的選擇。 一般狀況下,假如輸出的是中間結(jié)果,屬于基本字段的題目(TI)、文摘(AB)、敘詞(DE)和識(shí)別詞(ID)字段是必需的,這些字段有利于觀看結(jié)果,對(duì)檢索策略做進(jìn)一步調(diào)整。假如是最終結(jié)果,可以依據(jù)時(shí)間、經(jīng)費(fèi)條件選擇其中適用的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)中AR交互技術(shù)在設(shè)備調(diào)試與故障診斷中的應(yīng)用報(bào)告001
- 安全考試試題及答案復(fù)制
- 特色主題餐廳餐飲業(yè)食品安全監(jiān)管政策解讀研究報(bào)告2025
- 2025年航空貨運(yùn)市場(chǎng)競(jìng)爭(zhēng)格局變化及發(fā)展策略研究報(bào)告
- 中國(guó)發(fā)型發(fā)展史
- 中國(guó)歷史趣味課件
- 《編制說明-公安交通應(yīng)急管理裝備配備要求》
- 周志華人工智能課件
- 員工職業(yè)規(guī)劃培訓(xùn)課件
- 南昌市南大附中2025屆英語(yǔ)七下期中學(xué)業(yè)質(zhì)量監(jiān)測(cè)模擬試題含答案
- GB/T 23932-2009建筑用金屬面絕熱夾芯板
- 防靜電手環(huán)測(cè)試指導(dǎo)書
- 機(jī)電控制工程
- 碼頭承包經(jīng)營(yíng)合同
- 建筑工程防水(防滲漏)處理PPT
- WTO世界貿(mào)易組織概論期末復(fù)習(xí)題
- 溫病學(xué)講義劉景源
- 幼兒園教育活動(dòng)設(shè)計(jì)與指導(dǎo)幼兒園教育活動(dòng)設(shè)計(jì)的基本模式
- 校企共建校內(nèi)實(shí)訓(xùn)基地協(xié)議模版
- 嵌頓疝病人應(yīng)急預(yù)案
- 影響全國(guó)房?jī)r(jià)因素的多元回歸分析-中南財(cái)經(jīng)政法大學(xué)《統(tǒng)計(jì)分析軟件》論文報(bào)告
評(píng)論
0/150
提交評(píng)論