Download - 第五章 网络信息检索
第五章 网络信息检索
第一节 搜索引擎的使用第二节 OA 资源
网络能带给我们什么?学习、生活中所需的资料 1 、旅游信息 2 、考研信息 3 、出国留学信息 4 、火车时刻表、航班等信息 ……科研工作中所需的资料 1 、查找相关领域的最新研究进展 2 、查找科研成果的转化对象 3 、查找原始文献的出处 ……
Internet 基本知识 网络信息源:存在于互联网( Internet )上能通过计算
机网络利用到的信息资源总和。 Internet 发源于美国国防 60 年代的研究计划。 Internet 遵循的是 TCP/IP( 也即传输控制协议 / 网间协
议 ) ,它是一种网络通信协议,它规范了网络上的所有通信设备,尤其是一个主机与另一个主机之间的数据往来格式以及传送方式。
IP 地址 : 人们为了通信的方便给每一台计算机都事先分配一个类似我们日常生活中的电话号码一样的标识地址,称作网络协议地址。 IP 地址的长度为 32 位,分为 4 段,每段 8 位。用十位制数字表示,每段数字范围为 1 ~254 ,段与段之间用句点隔开。
Internet 基本知识 虽然可以通过 IP 地址来访问每一台主机,但是要记住那么多
枯燥的数字串显然是非常困难的,为此, Internet 提供了域名 (Domain Name )。
域名也由若干部分组成,各部分之间用小数点分开,例如我校主机的域名是 :“ www.bvtc.edu.cn” 。
域名前加上传输协议信息及主机类型信息就构成了网址(URL ),例如我校 www 主机的 URL 就是:“ http:// www. bvtc.edu.cn” 。
通常,进行网络访问时,域名的 www 可以省略。如http://www.edu.cn/ ,可以直接输入 http://edu.cn。不能省略的与域名服务器的配置有关。
域名一般不会变动。
Internet 基本知识 由于 Internet 最初是在美国发源的,因此最早的域名并无
国家标识,人们按用途把它们分为几个大类,它们分别以不同的后缀结尾:
随着 Internet 向全世界的发展,域名资源有限,各个国家、地区在域名最后加上了国家标识段,由此形成了各个国家、地区自己的国内域名,如: .com.cn 中国的商业 .org.hk 香港的组织 .net.jp 日本的网络
.com 商业公司
.org 组织、协会等
.net 网络服务
.edu 教育机构
.gov. 政府部门
.mil 军事领域
查看网络信息的方法
查看网络
信息
的一般方
法
浏览方式 查询方式
分类体系浏览
随意浏览
第一节 搜索引擎的使用
搜索引擎是查询网络信息最重要的工具。
1994 年 4月。斯坦福大学的两名博士生,美籍华人杨致远和美国人 David Filo共同创办了超级目录索引雅虎 (Yahoo) ,并成功地使搜索引擎的概念深入人心。
1998 年, Google创始人谢尔盖 ·布林和拉里 ·佩奇,两位斯坦福大学计算机系的学生在宿舍里创建了互联网搜索引擎 Google 。
1999 年底,怀抱“科技改变人们的生活”的梦想,李彦宏回国创办百度。
1 、搜索引擎概述
①什么是搜索引擎?
搜索引擎( search engine ),是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,并将组织和处理后的结果信息显示给用户,为用户提供检索服务的系统。 搜索引擎一般由搜索器、索引器、用户检索界面组成。
②搜索引擎的工作原理
如:查找字“囧” 利用拼音 jiǒng ,在音节表中找到 jiong 在字典的 375页; 利用部首□,在检字表找到囧在字典 376页。 前提都是先找到该字所属页码。
②搜索引擎的工作原理
第一步,抓取网页。第二步,处理网页,建立索引数据库。第三步,提供检索。
③搜索引擎的分类
按检索机制不同
搜索引擎的类型
全文搜索引擎
Google 、百度
目录搜索引擎
Yahoo
元搜索引擎
搜魅
③搜索引擎的分类
按检索内容不同:综合搜索引擎:搜索的内容是综合型的,能满足用户不同层次、不同层面的需求。垂直搜索引擎:搜索的内容是某一专门领域和特定主题的,用户是某些特定的人群,特点是专、精、深。
2 、搜索引擎的使用技巧
①在类别中搜索
②利用双引号进行词组检索
运算符:“”含义:输入的检索词在检索结果中以完整词组的形式出现。
③按文件类型查找
运算符: filetype
使用方法:关键词 filetype: 文档类型含义:查询特定类型的文档
④使用字段检索—— intitle
运算符: intitle
使用方法: intitle: 关键词含义:查询结果的网页标题中必须含有关键词如:查找市场消费需求方面的调查报告
④使用字段检索—— site
运算符: site
使用方法:关键词 site: 域名含义:把检索范围限定在某个网站如:查找广东白云学院网上关于课堂教学质量的文章
④使用减号限定查找——减号
运算符: -
使用方法:关键词 1 – 关键词 2
含义:去掉含有不需要的关键词的网页如:神雕侠侣 - 电视剧
3 、元搜索引擎
元搜索引擎就是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的 (甚至是同时利用若干个 ) 搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
元搜索引擎工作原理
第二节 OA 资源
开放获取( open access )是指某文献在 Internet公共领域里可以免费获取,允许任何用户阅读、下载、复制、传递、打印、检索、超级链接该文献,并位置建立索引,用作软件的输入数据或其他任何合法用途。
中国预印本服务系统
中国科技论文在线
OA 图书馆
Socolar
OA 资源
DOAJ
OA图书馆
OA图书馆介绍:OA图书馆主要分为两个部分,第一是 OA
资源和 OA 新闻,第二是 OA内容搜索:OA 资源部分主要是介绍一些 OA 资源,包
括预印本资源、 OA期刊库、 OA 电子课件、 OA 机构存储库, OA期刊等。 OA 新闻主要是介绍 Open Access 的一些基本知识和国内外最新的 Open Access 新闻。
OA内容搜索,整合了所有的 OA 资源,使用者可以很方便检索所需要的材料。
Page 39
OA期刊—— DOAJ DOAJ ( Directory of Open Access Journals )是个很好的专门 OA期刊文献检索系统,但不包括预印本资源。该系统收录期刊的文章都是经过同行评议或严格评审的,质量高,与期刊发行同步,且都能免费下载全文,是做研究的好帮手。
DOAJ 由瑞典 Lund 大学图书馆创建和维护。 DOAJ 的优势在于收录的期刊的有着严格的质量控制,包括很多 SCI收录的期刊。 DOAJ收录的 OA期刊数量非常多,属于目前最好的的 OA期刊目录网站。
Page 40
DOAJ——检索界面
Page 41
DOAJ——浏览界面
Page 42
检索结果界面