情报检索与计算机信息检索

68
情情情情情情情情情情情情 情情情 2008 情 9 情 1 情 Tel:13970792982Email:jxlgkzm@1 63.com

Upload: justina-pearson

Post on 30-Dec-2015

36 views

Category:

Documents


11 download

DESCRIPTION

情报检索与计算机信息检索. 康忠民 200 8 年 9 月1日 Tel:13970792982Email:[email protected]. 课程目标. 面对日益增长的 Internet 的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息。──这就是本课程所希望解决的问题. 课程主要内容. 1.理论基础 2. 手工检索 3. 计算机检索. 情报检索基础(第一章 绪论 ). 四个主要概念: 1、信息 2、 文献 3、 情报 4、 情报检索. 1 . 信息. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 情报检索与计算机信息检索

情报检索与计算机信息检索

康忠民

2008 年 9 月 1 日Tel:13970792982Email:jxlgkzm

@163.com

Page 2: 情报检索与计算机信息检索

2

课程目标 面对日益增长的Internet的信息和文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息。──这就是本课程所希望解决的问题

Page 3: 情报检索与计算机信息检索

课程主要内容

1. 理论基础2.手工检索3.计算机检索

Page 4: 情报检索与计算机信息检索

4

情报检索基础(第一章 绪论 )

四个主要概念:1 、信息2 、文献3 、情报4 、情报检索

Page 5: 情报检索与计算机信息检索

5

1. 信息

•在日常生活中信息常被理解为人们口头、书面或者以其它方式传递的消息。信息不是物质本身,是物质的一种基本属性。是关于事物运动的知识。

•每个人每天都在不断地通过感觉器官从外界接受信息。从书刊报纸、电视、收音机、交谈中不断获得信息。

Page 6: 情报检索与计算机信息检索

6

信息的特点(1) 时效性:重要特点。如果信息传递很慢,那么有用的信息也会失去应有的价值。如新闻、预告。(2) 可扩散性:在时间或空间上从一点转移到另一点。“一传十,十传百”。(3) 可扩充性:人们对世界认识是无无限的,因此信息资源的扩充与累积也是无限的。(4) 共享性:信息可以多次传播,不失其内容,与实物交易不同。

Page 7: 情报检索与计算机信息检索

7

2. 文献 •记录有知识的一切载体。即用文

字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。

•文献的范围很广。古代:甲骨文、碑刻、竹简、帛书

是文献。现代:图书、报纸、期刊现今:机读资料、缩微制品、电子

出版物。

Page 8: 情报检索与计算机信息检索

8

•文献的级次 ( 按信息的加工程度划分 )

• 零次文献信息资源——指尚未被记录下来,只是通过口头携带和传播的信息资源。零次信息资源的出现和传递带有极大的偶然性。其特点是鲜活、生命力旺盛。

• 一次文献信息资源—— 指经加工或粗略加工的原始信息资源,如正在研究或创造过程中产生的信息,包括会议记录、论文报告、统计报表、专利等。其特点是比较零散,系统性不强,半包括所有的主要内容。

8

Page 9: 情报检索与计算机信息检索

9

•文献的级次 ( 按信息的加工程度划分 )

•二次文献信息资源——指在一次信息资源基础上加工整理而成的信息资源,如文摘、索引、目录等,它们是引导和使用一次信息资源必不可少的工具。

•三次文献信息资源——通过二次信息资源提供的线索,对某范围内的一次文献进行分析、研究加工而成的信息资源,亦称三次文献,包括综述、述评、专题情报研究报告、百科全书、年鉴、指南、手册、词典等。

9

Page 10: 情报检索与计算机信息检索

10

•文献的特征 :

外部特征 : 与文献精确对应的书名( 或篇名 ) 和作者

内部特征 : 与文献模糊对应的主题词和分类号

Page 11: 情报检索与计算机信息检索

11

3. 情报 •是一种人工信息,信息与知识都

是它的来源。是激活了的,活化了的知识。

•情报与信息在英文中同为Information ,但信息的外延比情报广,信息是包含情报的。情报就是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的接收对象。

Page 12: 情报检索与计算机信息检索

12

4. 情报检索•情报检索就是从任何信息集合中

识别和获得所需信息的过程•类型: 文献检索    数据检索    事实检索     

Page 13: 情报检索与计算机信息检索

13

(1) 文献检索 •是以文献为检索对象的信息检索。文献检索根据检索内容不同分为:•①文献的线索检索:利用书目、文摘和书目型数据库检索工具,检索的结果提供了文献的线索;•②文献的全文检索:这种检索以查找到文献全文为目的。

Page 14: 情报检索与计算机信息检索

14

(2) 数据检索

•以数值、图表、公式或化学分子式等形式表示的数据为检索对象的信息检索,其检索结果为数据信息。如:“长江有多长,洪水期最高水位有多高?”等。

Page 15: 情报检索与计算机信息检索

15

(3) 事实检索

•以事实为检索目的和对象的信息检索。其检索对象既包括一些事实、概念、思想、知识等非数值信息也包括一些数据信息。从广义上讲事实也是一种全文,知识内容特殊、比较简短的全文。

Page 16: 情报检索与计算机信息检索

16

情报检索基础(第二章 情报源与工具书) 2.1 2.2 情报源• 情报源分为:文献情报源与非文献情报源(电

视、广播、交往、实物展览等信息)• 文献情报源又分为:印刷型文献情报源和非印刷型文献情报源(缩微型、机读型、视听型)

• 印刷型文献情报源的类型又称文献类型有 10种,也可分为 3种(图书、期刊和特种文献 :会议文献、科技报告、专利文献、技术标准、政府出版物、学位论文、产品样本、技术档案P11 )除此之外还有报纸、新闻稿等。

16

Page 17: 情报检索与计算机信息检索

17

情报检索基础(情报源的整序( 2.3 )与整序后形成工具书 ( 2.4 )示意图 )

17

情报源

无序流

整序方法(即编排方法

)外部特征

文献篇名

作者姓名 ( 含团体作者)

等等

内部特征

分类— ( 表 ) P15 P26

主题—(词表) P15

时序、地序法

规范化处理

工具书工具类数据库

有序流情报服务机构

检索工具

参考工具

用户

全文全文数据库

定义 P16

定义 P17 查找文献线索的工具

定义 P21 查找数据和事实情报的工具

目录题录文摘索引

百科全书词典年鉴手册名录

Page 18: 情报检索与计算机信息检索

18

附加内容:文献著录

•著录 (Description)就是编制文献目录等二次文献时,对文献内容和形式特征进行分析、选择和记录的过程。它将有关某一文献的基本信息摘录下来,供人们间接地了解、识别该文献。

•下面,我们分别对不同文献情报源的著录特征及其识别方法进行讲述。

Page 19: 情报检索与计算机信息检索

19

•图书的著录项目包括书名、著者,

出版项 ( 出版地、出版社、出版年 ) 、

总页码等。

图书 :

Page 20: 情报检索与计算机信息检索

20

目录

Page 21: 情报检索与计算机信息检索

21

•图书的识别主要依据出版项 ( 出版地、出版社、出版年 ) 、 ISBN(10 位 ) 、总页码 (PP

or P) 等著录项。

Page 22: 情报检索与计算机信息检索

22

•ISBN 是国际标准书号, International Standard Book Number 的缩写,是世界各国广泛使用的书号编码系统。一个 ISBN 是由 10位阿拉伯数字组成,并用连字符分隔为四部分:第一部分表示组号,也叫地域编号,是指国家、地理、语言等地域信息;第二部分是出版社编号;前两部分合称“出版者前缀”;第三部分为书名编号,即该出版社出版的图书种数的流水号;第四部分为校验码。前三部分的数位都是可变的,但其位数之和始终为 9 位。

Page 23: 情报检索与计算机信息检索

23

•例: ISBN 7➀-5383➁-0276➂-0 /➃ TP·99➄

•➀是地域号 ( 国家、地区、语言区 ) 。其中 7 代表中国, 0 和 1 表示英语区、 2 是法语区、 3 是德语区、 4 是日语区、 5 是俄语区、 88 是意大利语区、 9971 是新加坡语区•➁ 是出版社号;➂是该出版社出版的图书种数的流水号•➃ 是计算机检验位;➄是我国出版的图书在ISBN后加的一个中图法的大类类号。

Page 24: 情报检索与计算机信息检索

24

•作用:具有可识别可检验的功能。用加权因数 10-2分别与 ISBN 的 1-9位数对应相乘,将乘积与校验数值相加,再以模数“ 11”相除,如被整除就是正确的编号,否则为错误编号。如: ISBN 7 5 3 8 3 0 2 7 6 0 加权 10 9 8 7 6 5 4 3 2 乘积 70+ 45+24+56+18+0+8+21+12+0 总和 264/11=24( 被整除)

Page 25: 情报检索与计算机信息检索

25

期刊

•期刊的著录:刊名 ( 一般用缩写 ) 、出版年月、卷、期、起止页码等。

Page 26: 情报检索与计算机信息检索

26

文摘

Page 27: 情报检索与计算机信息检索

27

• Aesthetics in mast and tower design ( 1 ) ,The very rapidly in the need for…… ( 2 )

• Fuchs,M.B. ( 3 ) (Tel Aviv Univ, Ramat Aviv, Isr) ( 4 ) , Comput. Struct. ( 5 ) v73n4,2001,p1-5 ( 6 )

• 说明 : ( 1 )文献篇名;( 2 )文摘内容;( 3 )著者姓名;( 4 )著者工作单位或通讯地址;( 5 )刊名缩写;( 6 )出版卷、期、年份、页码。

• 本条摘自 EI

文摘

Page 28: 情报检索与计算机信息检索

28

•期刊的识别:

•(1)卷号或期号 (vol. no or

v. n);

•(2) 刊名缩写 ( 如 PE&RS);

•(3)ISSN 号 (8 位 )

Page 29: 情报检索与计算机信息检索

29

科技报告•著录:篇名;著者和著者工作单位;报告号;出版年月 •识别:根据报告号• a 、一般有 report; b 、有时候有PR(progress report)进展报告、 AR(annual report)年度报告、 FR(final

report)年终报告、 CR(contract report)合同报告、 TR(technical report) 技术报告

Page 30: 情报检索与计算机信息检索

30

•000,050 ③ PC A04 / MF A01④ PB 90-10490 /GAR ( 1 )•International Potato Center, Lima(Peru) ( 2 ) Traditional Potato Storage in peru: Farmers’Knowledge and Practices. Potatoes in food systems research series ( 3 ) R. Rhoades, M. Benavides, J. Rechate, E. ( 4 ) 1988 ,629 ( 5 ) .REPT–4, AID–PN–ABC–429 ( 6 ) Sponsored by Agency for International Development, Washington DC, Office of Agriculture. ( 7 ) In the last decade, the importance of reducing food…… ( 8 )•说明:( 1 ) NTIS登记号;( 2 )团体或报告完成机构名称;( 3 )报告篇名;( 4 )个人著者;( 5 )完成日期、报告页数;( 6 )原报告号;团体著者或资助招标机构所编代号;( 7 )资助机构名;( 8 )文摘。•本条摘自美国《政府报告通告与索引》( Govern ment Reports Announce ments and Inder 简称GRA&I)

Page 31: 情报检索与计算机信息检索

31

•著录:论文名称、著者和著者工作单位;会议录名称、会议地点、会议时间;会议录出版情况,论文页码。

•识别:会议录名称、会议地点、会议时间、会议届次。 会议录名称常含有: congress( 会议 ) 、 convention( 大会 ) 、 symposium(专题讨论会 ) 、 workshop(专题学术讨论会 ) 、 seminar(学术研讨会 ) 、 conference(学术讨论会) colloquium(学术讨论会 ) 、 proceedings( 会议录 )

会议文献

Page 32: 情报检索与计算机信息检索

32

文摘

Page 33: 情报检索与计算机信息检索

33

• Performance analysis of third-order nonlinear wiener adaptive

• Systems ( 1 ) . Shue-Lee Chang• ( 2 ) (Dept. of Electr.Eng.,Santa Univ.,CA.USA)

( 3 )• 2002 IEEE International Symposium on Circuits

and Systems ( 4 ) .• Proceedings,Phoenix-Scottsdale,AZ,USA,26-29

May 2002 ( 5 ) ,P.II-197-200 ( 6 ) vol.2 ( 7 )• This paper presents a detailed performance

analysis of third-order…… ( 8 ) (16 refs) ( 9 )• 说明:( 1 )论文题目;( 2 )著者姓名;( 3 )著者工作单位或通讯地址;( 4 )会议录名称;( 5 )会议召开的地点和时间;( 6 )论文在会议录中的页码;( 7 )卷号;( 8 )文摘内容;( 9 )参考文献条数。

• 本条摘自SA

文摘

Page 34: 情报检索与计算机信息检索

34

专利文献

•著录:专利题目;著者;受让人或单位以及专利发表时间;专利国别及专利号

•识别:有 patent;专利国别及专利号。专利国别代码是由国际标准化组织( ISO )规定的,专利文献由各国专利局出版发行,因此,无出版地、出版社等项目。

Page 35: 情报检索与计算机信息检索

35

文摘

Page 36: 情报检索与计算机信息检索

36

• Wastewater treatment process.( 1 ) Reyna,C. ( 2 ) (New Working Waters, Llc,USA) ( 3 ) U.S Us6319412( 4 ) (Cl.210-666; ( 5 ) Co2Fq/00 ( 6 )),20 Nov 2001, ( 7 ) US Appl. 955182,( 8 ) 21 Oct 1997 ( 9 ) ;6pp ( 10 ) ,(Eng) ( 11 ) ,This invention relates to wastewater treatment…… ( 12 )

• 说明:( 1 )专利标题;( 2 )发明人姓名;( 3 )专利权所有者;( 4 )专利国别代号和专利号;( 5 )美国专利分类号;( 6 )国际专利分类号;( 7 )专利公布日期;( 8 )专利申请号;( 9 )专利申请日期;( 10 )专利总页数;( 11 )文种;( 12 )文摘内容。

• 本条摘自 CA

文摘

Page 37: 情报检索与计算机信息检索

37

标准文献

•著录:标准制定单位 ;标准题目 ; 表示标准的词,如 standard,recommendation

等 ;标准号。标准号由标准颁布机构代码、顺序号和颁布年份三部分组成。如 ANSI TI-

601-1988

•识别:标准号

Page 38: 情报检索与计算机信息检索

38

文摘

Page 39: 情报检索与计算机信息检索

39

学位论文

•著录:论文名称;著者;学位;授予学位的大学名称;时间、论文页码;导师或答辩委员会顾问的姓名。

•识别方法:学位名称、大学名称。如“ dissertation” 、” thesis” 。例子中的“ Ph.D.”博士学位的简称。

Page 40: 情报检索与计算机信息检索

40

文摘

Page 41: 情报检索与计算机信息检索

41

•INVERTIBLE FUNCTIONS ( 1 ) order No DA8528622 ( 2 )• ALLENDER,ERIC WARREN ,Ph,D ( 3 )• Georgia Institute of Technology,1985( 4 )• 107PP ( 5 ) chair man: K. N. King( 6 ) •This Thesis explores the question of how hard a ( 7 )•说明:( 1 )论文题目 ;( 2 )订购论文的订购号;( 3 )论文作者和学位类别;( 4 )授予学位单位和时间;( 5 )论文页数;( 6 )学位论文指导教师;( 7 )文摘。•本条摘自《国际学位论文文摘》( Dissertation Abstracts International( 简称DAI)

文摘

Page 42: 情报检索与计算机信息检索

42

• 一、检索语言概述• 语言是一种人们用以交流沟通的重要工具。人

与计算机对话,需要有计算机语言,人与检索系统对话来实施检索,则需要有检索语言( retrieval language )。

• 检索语言是用于描述检索系统中信息的内部及外部特征和表达用户信息提问的一种专门语言,检索的匹配正是通过语言的比较匹配来实现的。检索语言也称索引语言,后者是从检索系统的标引角度出发的,而前者是从用户的信息检索角度出发的。

情报检索基础(第三章 检索语言)

Page 43: 情报检索与计算机信息检索

43

也可以说,所谓的检索语言就是组织文献与检索文献时所使用的语言,也就是说,文献存储时,文献的内容特征(如分类、主题等)和外表特征(如书名、刊名、著者等)按照一定的语言来加以描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献的存储和检索过程中,共同使用、共同理解的语言就是检索语言。

检索语言是由符号、代码或科技词语组成的。其中符号、代码是按照学科门类严格编制的,科技词语是经过优选的和规范化的。

Page 44: 情报检索与计算机信息检索

44

二、检索语言与编排方法关联图

44

情报源

无序流

整序方法(即编排方法

)外部特征精确

文献篇名

作者姓名 ( 含团体作者)

等等

内部特征模糊

分类— ( 表 P26)

主题—(词表)

时序、地序法

即分类语言族性

即主题语言特性

规范化处理

有序流情报服务机构

检索工具

参考工具

用户

定义 P16

定义 P17

定义 P21

目录题录文摘索引

百科全书词典年鉴手册名录

工具书工具类数据库

全文全文数据库

Page 45: 情报检索与计算机信息检索

45

检索语言

描述文献内容特征的语言

分类语言

主题语言

描述文献外表特征的语言

题名(书名、刊名、篇名)著者出版事项

代码 /序号

体系分类语言组配分类语言混合分类语言关键词语言

叙词语言标题词语言

单元词语言

三、检索语言种类

Page 46: 情报检索与计算机信息检索

46

信息源

信息的选择与收集

信息特征

检索工具

匹配

检索式提问

检索结果

数据库

用户

信息需求

检索提问 检索

提问式

四、检索语言的桥梁作用

Page 47: 情报检索与计算机信息检索

47

情报检索基础(第四章检索程序与检索效率)一、检索程序

课题 分析研究课题 制定检索策略 选择检索工具 确定检索途径

选定检索方法检索

调整检索策略

结果评价获取原始文献

Page 48: 情报检索与计算机信息检索

48

1.分析研究课题

•在查找文献信息之前,必须对检索课题进行分析研究。目的是了解课题的学科和专业范围,弄清检索的真正意图及实质。这是制定检索策略的根本出发点,也是检索效率高低和成败的关键。具体需要明确的问题有:专业范围、时间范围、地理范围、语种范围、文献类型。

Page 49: 情报检索与计算机信息检索

49

制定检索策略 •检索策略是指为实现检索目标而制定

的检索方案或对策,也就是将课题的提问及其检索词与检索工具的收录内容、编排特点相匹配而确定的检索方案或程序。制定检索策略的主要内容是,在分析课题的基础上,确定要利用那些检索工具,确定查找年限和专业范围的选择,确定检索用词并判明各检索词之间的逻辑关系与查找步骤。

Page 50: 情报检索与计算机信息检索

50

2.选择检索工具 ( 或数据库 )

•根据检索课题的主题及专业范围选择质量较高、检索手段比较完善的检索工具。这就必须了解和掌握各种检索工具的适用范围、收录特点。

Page 51: 情报检索与计算机信息检索

51

•在选择检索工具是,要考虑的主要问题是:•( 1 )在内容和时间方面,要考虑检索工具、数据库内容对课题内容的覆盖面和一致性,如应综合考虑检索工具、数据库收录文献的齐全、编制的质量、使用的方便等因素。•( 2 )在手段和技术上,有机检条件的一般就不选手检工具。但必须了解数据库收录文献的年代范围。•( 3 )考虑价格和可获得性,应选择就近容易获得的检索工具。

Page 52: 情报检索与计算机信息检索

52

3.确定检索途径

•检索途径是进入检索的入口。分

为两类:反映文献内容特征的途径

(分类、主题)和反映文献外部特征

的途径(著者、题名、代码等)。

Page 53: 情报检索与计算机信息检索

53

分类途径•是按照学科分类体系查找文献的途径,

采用的是“分类目录”和“分类索引”。按分类进行查找,用分类途径能够把同一学科的文献信息集中在一起检索出来。其缺点是分类表是事先编制好的,一些新学术论文增补不及时,依此途径检索,所得文献容易落后于学科发展;又由于每篇文献是按学科规类的,查出的结果涉及面宽,针对性不强,因而还需要进一步筛选。

Page 54: 情报检索与计算机信息检索

54

主题途径•根据文献的主题特征,利用各类主题目录和

索引进行检索的途径,即利用从文献中抽象出来的或经过人工规范化的,能够代表文献内容的词来检索。主题目录和主题索引就是将文献按表征其内容特征的主题词组织起来的索引系统。利用主题途径检索时,只要根据所选用主题词的字顺(字母顺序、音序、笔画顺序等)找到所查主题词,就可查得相关文献。主题途径具有直观、专指、方便等特点,打破了按学科分类的方法,时分散在各个学科领域里的有关课题的文献集中于同一主题。

Page 55: 情报检索与计算机信息检索

55

著者途径•利用著者(个人或单位著者)目录和著者索

引进行检索的途径。国外对著者途径非常重视,许多检索工具都把著者索引作为最基本的辅助索引。著者途径的特点是:科研人员一般是各有所长,尤其是有些领域的知名学者、专家,他们的文章一般都代表了一定的水平和动向,通过著者线索,可以系统地发现和掌握他们研究的进展和他们的最新论著。一定程度上可以引导查找到同类或相关文献。这种途径的检索既快速又方便,但查得的文献缺乏系统性和完整性。

Page 56: 情报检索与计算机信息检索

56

题名途径

•根据文献的名称,如书名、刊名、会

议名称进行检索的途径。它以文献的题名

按照字顺编排诚一个体系,既简单易行,

也便于查检,比较符合一般用户对文献的

使用习惯。

Page 57: 情报检索与计算机信息检索

57

代码途径•根据文献的序号特征,利用其序号索

引进行检索的途径。许多文献具有唯一的序号,如 ISBN 、 ISSN 、专利号等。根据这些序号可真诚不同的序号索引。在已知序号的前提下,利用序号途径能方便地

查找所需文献。

Page 58: 情报检索与计算机信息检索

58

其它途径

•有些检索工具还有一些特殊的索引,可用特殊途径找到所需文献的线索。计算机检索系统中的检索途径还很多,几乎文献的每一个特征(如出版社、出版年代等)都可作为检索途径。

Page 59: 情报检索与计算机信息检索

59

4.选择检索方法常用法–顺查法:•从远及近查,用于了解某一事物发

展的全过程,–倒查法:•由近及远查,重点为近期

–抽查法:•查找某一段时间的文献

Page 60: 情报检索与计算机信息检索

60

调整检索策略 •检索中,会不可避免地产生一些和检

索目标相差甚远的情况。•检索词过于宽泛会造成扩检,这时可

以对原检索词增加限定条件,如时间、语种或增加新检索词等。另外也可以换用下位类检索词进行专指性更强的检索。

•检索词过于偏窄会造成漏检,这时可以减少限定条件、用上位类检索词或是用相关主题词进行检索。

Page 61: 情报检索与计算机信息检索

61

5. 获取原始文献 •这是检索过程的终结,也是文献检索的最终目的。获取原文一般有三个步骤:•( 1 )整理文献出处。将文献出处中有缩写语、有音译刊名的还原成全称或原刊名;•( 2 )判断文献的出版类型; •( 3 )在上面 2 个步骤的基础上查找全文数据库、或通过查找图书馆馆藏目录、联合目录确定馆藏位置,从而获得原文,如果是特种文献,可分别在国图、中信所、中科院、专利局索取原文、或通图书馆文献传递服务获得原文。

Page 62: 情报检索与计算机信息检索

62

二、检索效果(率)的分析及评估•所谓检索效果( retrieval

effectiveness )是指检索结果的有效程度。反映了检索系统的检索能力。检索效果包括检索的技术效果和经济效果两个方面。技术效果是由检索系统完成其功能的能力确定,主要指性能和质量。经济效果由完成这些功能的价值确定,主要指检索系统服务的成本和时间。

Page 63: 情报检索与计算机信息检索

63

•检索效果评价是根据一定评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一步完善检索工作的过程。

•常用的评价指标有:收录范围、查全率、查准率、响应时间、用户负担和输出形式。其中最主要的指标是查全率和查准率。

Page 64: 情报检索与计算机信息检索

64

检索效果评估相关数据表

•a+b+c+d

•b+d•a+c• 总 计

•c+d•d•c

•a+b•b•a•检出文献

• 总 计•无关文献•相关文献•系统相关性

未检出文献

用户相关性

Page 65: 情报检索与计算机信息检索

65

查全率( recall ratio )•查全率是指检出的相关文献数与检索

工具中的相关文献总数之比,用字母R 表示。

Page 66: 情报检索与计算机信息检索

66

查准率( precision ratio ) •查准率是指检出的相关文献数与检出

的文献总数之比,用字母P 表示。

Page 67: 情报检索与计算机信息检索

67

•查全率是衡量系统检出与课题相关文献的能力;查准率是衡量系统拒绝无关文献的能力。两者结合起来,即表示检索系统的检索效率。检索者的理想是要求查全率和查准率都是 100%,但这是不可能的。

•实验表明:查全率和查准率之间存在相反的相互依赖关系,即提高查全率会降低查准率,反之亦然。

Page 68: 情报检索与计算机信息检索

68

常用检索途径的检索效率• 分类途径:利用分类名和分类号进行检索。其结果是该类目所有的文献 ,检索结果较全。• 题名(篇名)途径:利用篇名中的字词或篇名的一部分进行检索。其结果是所有在篇名中

出现该字、该词或该部分的文章,检索结果较准。• 主题词 /关键词途径:利用文章篇首标明的与该篇文献主题相关的词进行检索。其结果是包含该主题词或关键词的所有文献,结果较准。

• 著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。但不系统• 出处途径:利用原文献刊载处进行检索。可查到某刊载处刊登的所有文献• 全文关键词途径:用于全文数据库检索。利用从文献题名和正文中抽出的、表达文献主题

内容的、有实际意义的词进行检索。结果全,但有误检;• 全文自由词(任意词):用于全文数据库检索。利用文献中的任意字或词进行检索,结果全,但误检率高。

• 年份途径:利用年份进行检索。可查到某年份出版的所有文献。一般与其他途径合并使用。