vsp 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf ·...

15
VSP 站内检索解决方案 版本 1.1 VSP 解决方案 2008-8-4 http://www.myvsp.cn

Upload: others

Post on 13-Oct-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

VSP 站内检索解决方案

版本 1.1 VSP 解决方案 2008-8-4

http://www.myvsp.cn

Page 2: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

目 录

引言............................................................................................................................................1 现有站内检索方案的不足 ........................................................................................................2

关系型数据库“like”检索的不足 ......................................................................................2 开源软件搭建站内检索的不足.......................................................................................2 搜索引擎巨头 Site Search 服务的不足...........................................................................3

维思比站内检索的独特应用亮点 ............................................................................................4 概念检索,查找同一概念(Concept Search)..............................................................4 根据多维属性,启发式检索(Refine Search) ............................................................4 运营分析,了解访问者的意图.......................................................................................5 符合网民习惯,快速定位信息.......................................................................................5

维思比站内检索采用的先进技术 ............................................................................................6 分类导航和启发式搜索...................................................................................................6 概念搜索,提高查全率、查准率 ...................................................................................6 改进个性化搜索结果的用户属性 ...................................................................................7 支持跨语言检索...............................................................................................................7 简化安装、易于管理的架构...........................................................................................7

维思比站内检索方案的结构 ....................................................................................................9 维思比站内检索的应用场景 ..................................................................................................10

一、Getty 基金会研究内网 ...........................................................................................10 二、B2C 电子商务网站应用 ........................................................................................11

结论..........................................................................................................................................12 附录..........................................................................................................................................13

控制语言(受控词汇)是什么? .................................................................................13 为什么控制语言(受控词汇)有用? .........................................................................13

Page 3: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

引言

站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

如果没有站内全文搜索将会出现怎样的局面。如果缺乏站内检索这个重要通道,毫无疑问将

出现以下情景:

1. 虽然有网站地图或产品目录等导航方式,但网站使用者,特别是初次访问者,往往

对如何从海量信息中找到深层级的准确信息感到困惑; 2. 网站使用者有时会因为难以表述正确的检索条件或者不熟悉查询的事务,而导致无

法找到其希望获取的信息或者产品; 3. 由于网站信息的框架、布局难以轻易改动,初级简单的关键词检索模式常常查无结

果,让网站的访问者失去信心与兴趣; 4. 网站编辑苦于如何将功能复杂多元的产品更有效地归类,或者如何编排文章才能既

让小众用户轻松获取信息又迎合大众用户主流浏览习惯; 5. ……

站内检索系统虽然表面上看起来只是网站的一个简单功能,但其使用频率很高,尤其是

第一次访问网站的用户,由于他们不熟悉网站的架构,往往直接采用检索功能查找信息。IDC的调查显示:当用户访问一个新的网站时,如果在一开始不能快速找到他想要的信息,那么

50%的用户会很快离开网站,其中 60%将不再光顾,这意味着网站将因为站内检索的缺陷而

彻底流失 30%的潜在客户。

今天通用型的搜索引擎(Baidu、Google、Yahoo 等)已经成为互联网世界的重要入口,

越来越多的网民习惯使用并依赖搜索,而对于一个信息量极其丰富的网站而言,挖掘网站信

息和整合网站资源的“高级站内搜索”必然会演变为网站自身的重要入口,成为向用户传递

信息的高速公路。

目前,维思比科技(北京)有限公司(VSP Science and Technology Co.,Ltd,以下简称

“维思比”或“VSP”)围绕信息生命周期开发了多个产品,并进行合理整合,综合应用功

能丰富、灵活易用的网络爬虫系统(VSP Spider),效率突出、配置灵活的自然语言处理工

具(VSP NLP)和性能优越、运行稳定的全文检索数据库(VSP Server)作为支撑平台,推

出新一代的高级站内检索方案(VSP Advanced Site Search Solution)。

便捷的检索方式、精确的查询结果,必将协助您建设或运营的网站获得成功。

1

Page 4: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

现有站内检索方案的不足

站内检索看似简单,但检索系统的性能优劣在很大程度上会影响使用者对网站及其建设

者的评价。无论是政府高度重视的信息公开、在线便民政务服务,还是娱乐大众的电影音乐

下载网站,或者为普通消费者网络购物提供便利的企业电子商务门户,为中小企业提供交易

信息的交易平台,为用户提供有效便捷的信息通路是网站建设者“以人为本”思想的体现。

优秀的站内检索不仅能提升用户体验,提高网站访问者的忠诚度, 大限度地整合站内的信

息资源,还能提高网站访问者的转化率,将其搜索、浏览的过程变成一个发现、探寻未知信

息的过程,促进 终的交易达成。

调研机构 Jupiter 分析师 Patti Freeman Evans 所表示:“在未来,电子商务网站 重要的

特征就是要具备优秀的搜索功能。如果消费者无法搜索到他们想要的商品,那么他们就会转

移到其他网站。因此,拥有高质量的站内搜索工具对于刺激在线零售商的销售收入是至关重

要的。”

那么现有的站内检索方案都有什么弊端是难以克服的呢?

关系型数据库“like”检索的不足

基于关系型数据库“like”检索的传统站内检索方案的不足已经为技术工程人员所广泛

熟知,目前仅仅在特定的环境下使用。关系型数据库检索 初是针对交易数据设计而开发的,

并不是为了检索而专门设计的,它存在以下 2 个主要问题:

(1)检索响应速度缓慢。数据库的检索效率与检索操作能否有效利用同索引有关。一

个“like”的检索语句,通常都是对数据表进行全表扫描,没有利用数据库索引。如果数据

量特别大,那么每一次检索的效率都会很低,常常超过心理学统计研究认定的心理极限(用

户可以忍受的等待时间上限为 2-3 秒),用户体验非常糟糕。

(2)难以支持复杂检索条件。在实际应用中,检索系统通常需要支持一些复杂的检索

条件,比如“or”、“and”、“not”等逻辑表达式。传统的站内检索方式往往对这些复杂检索

采用拼接 SQL 的方法来实现,在查询请求时动态构造相应的查询语句。当用户再输入新的

检索条件时,系统就不得不再次动态构造一个查询语句。这对关系型数据库的性能有很大影

响,也很容易暴露现有系统信息带来网络恶意攻击行为,大段“if”、“else”之类的动态查

询语句的出现还将令程序变得非常复杂脆弱。开发、测试、维护关系型数据库的检索代码极

其消耗人力成本。

开源软件搭建站内检索的不足

考虑到关系型数据库的上述问题,目前不少网站利用开源的 Lucene 等索引系统搭配其

他软件开发站内检索功能。Lucene 是 Apache 软件基金会 Jakarta 项目组的一个子项目,是

2

Page 5: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文

检索引擎的架构,提供了完整的查询引擎和索引引擎以及部分文本分析引擎(英文与德文两

种西方语言)。对于检索效率要求不高、网站自身数据量小、对成本敏感的中小网站而言,

利用 Lucene 不失为一种合适的解决方案。但是开源软件搭建的站内检索系统也存在多方面

不足:

(1)从性能上看,通过走访采用开源软件构建站内检索系统的门户网站的技术部门得

知,通常情况下,只要数据量超过了 40 万站内检索性能就受到影响,Lucene 很难支持过百

万级别的数据量。

(2)从风险上看,Lucene 的开发应用的隐性成本难以测算,而且存在系统风险。一方

面,用户使用开源软件虽然看起来不用向任何人支付任何费用,但事实上,开源软件虽可以

支持简单的直接应用,但如果用户想添加复杂个性化的功能,就不得不对它进行改造。从效

果上看,改造的成本(人力成本、时间成本等)可能会比直接应用成熟的商用软件的 TCO更高。另一方面,开源软件设计者没有义务对软件应用可能存在的问题承担责任,用户得自

行承担采用或者改造开源软件的风险,若没能及时发现并解决问题,原来部署的应用可能忽

然瘫痪。

搜索引擎巨头 Site Search 服务的不足

今天,前文提到的众多互联网网站使用的站内搜索模式正在逐渐被 Google 等代表的网

络搜索巨头推出的 Site Search 服务所替代。但通用性的服务永远难以满足信息量丰富、检索

效率要求高的门户网站的个性化需求,无法通过和具体的业务需求结合来实现网站的增值。

通过内嵌搜索引擎提供的站内搜索服务,有以下几个方面的问题:

(1)搜索引擎的站内搜索服务会缺失信息。这是由于通用搜索引擎不会深度采集每一

个网站并将网站所有的内容都索引进去,比如 Google 一般主要索引 新更新的静态网页,

同时会定期逐渐抛弃缺少入口的动态网站内容;

(2)搜索引擎针对站点的更新频率也是有一定周期的,很多内容需要一定时间后才能

进入 Google 等通用搜索引擎的索引。假设您运营和维护的网站内容经常更新,但被搜索引

擎更新的周期是 7 天左右,无疑你将错失很多宝贵的商业机会;

(3)通用的站内搜索服务无法控制输出结果,个性化的输出需求难以满足,比如难以

实现用户所希望的按时间、价格、点击量、类目等多种方式过滤排序;

(4)由于互联网上的海量信息格式并不规范,而非规范化的信息需要经过结构化的梳

理后才能更好地展现。站内搜索引擎提供的主要内容不应该局限于普通的网页索引,还应该

包括商业信息的加工,对非结构化、半结构化的信息进行结构化的处理等。

维思比基于多年的技术沉淀和积累,推出新一代的高级站内检索方案(VSP Advanced Site Search Solution),其目的就是提高指定范围(网站、站群)内的信息查全率和查准率,

让信息的接触变得更简易,为网站的建设者和运营者提供轻松配置的方案。

3

Page 6: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

维思比站内检索的独特应用亮点

VSP 站内检索系统是为网站提供全方位的信息检索功能而设计,利用它可以方便地实

施一个或多个网站的站内搜索引擎功能,可以周期性地监控网站上的信息变化情况,对发生

变化的信息自动建立索引,并用丰富的表现形式展示检索结果。维护人员可以轻松地把站内

检索方案根据自身需求特点,一次性或者分阶段的将全部控件部署到网站内。维思比站内检

索具有以下 4 个特点(具体请见场景描述):

● 概念检索,查找同一概念 ● 根据多维属性,启发式检索(Refine Search) ● 运营分析,了解访问者意图 ● 符合网民习惯,快速定位信息

概念检索,查找同一概念(Concept Search)

网站信息量在持续不断增长,而访问者的耐心却逐渐下降。目前的传统检索模式要求用

户准确输入想检索信息的相关关键词,然后返回含有长长的检索结果清单或者告诉用户查无

结果,用户如果对检索结果不满意,就得重新输入检索条件,等待返回新的检索结果。用户

对一个词可能有自己的理解——有时用户想起的是一个正式用语,有时用户只想起了它的同

义词。比如,“盘尼西林”和“青霉素”含义相同,但搜索其中一个词并不会自动返回以另

一个词为关键字的信息。VSP 可帮助网站结合搜索日志统计建立自定义辞典,或者导入知

识体系,实现概念搜索。比如网站可以将“移动电话”映射到“手机”和“无线电话”,当

用户检索“移动电话”时,检索结果将包含以“手机”或“无线电话”为关键词的信息,反

之亦然。

根据多维属性,启发式检索(Refine Search)

传统的电子商务网站,虽然也从多个维度描述产品信息,但是出于各种考虑,用户浏览

时只能在产品目录内进行层层选择。实际上,有些商品难以精确归类,比如微型手电,后台

信息录入人员很难判断是该归入玩具类,还是归入小家电商品类。所以,尽管电子商务网站

有专业的团队,大量的人员负责每天调整、完善产品目录,但是,受限于产品目录的体系相

对死板,仍然难以灵活多元地呈现产品。如果您想突破传统的分类方式,如果您想取得在线

检索呈现商品的 佳效果,您可以选择 VSP 站内检索方案。不论产品分类情况如何,VSP站内检索系统都会自动根据访问者输入的关键词,返回按照产品不同描述属性的多元分类导

航,用户可以按照自己的首选倾向选择分类导航,其他属性的统计结果将会相应自动发生变

化,通过鼠标轻点,步步推进对检索结果精炼化,把访问者 想要的结果返回给用户,可让

更多的用户了解并找到自己想要的产品,无形中将大大增加在线成交机会,提高网站效益。

4

Page 7: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

运营分析,了解访问者的意图

诚如管理大师彼得.德鲁克所言,“一定要知道你的客户想要什么”。对于互联网也是一

样,我们总在分析客户在哪里和他们需要什么。所有访问我们网站的人都可能是我们的潜在

客户、竞争者和评价者,了解他们的访问意图将有助于我们做出正确决策。VSP 站内检索

系统提供日志分析功能,可以详细记录每个访问者的检索词和检索结果。通过对用户检索情

况的跟踪,可以在 短时间内快速了解用户对网站的使用习惯,分析用户的关注焦点,网站

可以据此做出相应改进,或进行有针对性的推广活动。

符合网民习惯,快速定位信息

根据调查表明,68.3%的上网者已经习惯通过搜索来找到他们想要的东西,而不是按照

网站的框架,沿着某个栏目一级级往下浏览。尤其是对第一次登陆网站的用户来说,由于不

熟悉网站的架构,通常更是直接采用检索功能查找信息。然而,虽然网站自身可能的确存在

相关信息,但用户却常常迷失在网页丛林中。简单的搜索入口可以让用户快速定位信息,将

停留在网站的大部分时间用来汲取信息。此外,按照主题将所有相关文档有组织、有逻辑、

成体系地提供给访问者,可以让访问者更全面地了解他所想要的东西,方便了访问者的使用,

将很好地提升用户体验效果。伴随通用搜索模式的普及,用户搜索的习惯已经自然而然地得

到了强化,站内检索这种信息查询方式也正被越来越多的用户所熟悉,访问者大多能够直接

使用站内检索,不需要经历复杂的学习过程。

5

Page 8: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

维思比站内检索采用的先进技术

由于信息量的激增,即使高相关性的关键字搜索模式也开始遭遇了收益递减高原。因而

网站建设者需要向用户提供更先进的搜索技术,比如搜索概念的能力,对搜索结果进行自动

聚类并动态迭代导航的能力,启发搜索的能力。维思比站内检索通过实用的技术,将信息搜

索和浏览过程结合,用户的检索使用体验将是一个充满乐趣的发现与探索信息的过程。

分类导航和启发式搜索

VSP 站内检索方案强化的搜索功能,比如按语境对结果分组,使用名字、日期和内容

位置等元数据对结果进行排序或过滤,可让您借助相关主题或分类类别修正结果,锁定您正

在寻找的目标,而非仅仅给您提供含有搜索结果的众多页面让您滚动浏览。另外,搜索引擎

使用者在使用检索功能时,经常难以精确表达或者概括自己想要搜索的事务,VSP 站内检

索可以根据用户输入的相关关键词进行检索,通过对返回检索结果提供智能导航和精炼搜

索,能帮用户发现已经错过的信息或者没有设想到的检索条件,也能令用户一目了然地找到

被深埋在点击排名清单内的信息。

概念搜索,提高查全率、查准率

目前本体概念是 web3.0 语义网的一个前沿热点。控制语言(又称受控语言,其中的一

个分支是专业用户比较熟悉的主题词表)和本体既有联系,又有差别。为实现将海量无序的

信息自动加工成有序的信息,维思比全文检索引擎有专门的模块对知识库资源的有效利用提

供支持。另外,我们的系统支持导入控制语言。我们可以提供多种手段帮助用户导入国内外

已有的控制语言,用户也可以利用我们提供的工具直接建立与业务相关的控制语言。通过调

用控制语言知识资源,系统提供概念检索,将极大地提升专业信息的查全率和查准率。(详

细范例,可参见 VSP 公司主页体验平台)

6

Page 9: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

(客户样例-美国 Getty 艺术基金会)

改进个性化搜索结果的用户属性

无论是电子商务网站,还是行业门户,或是专业网站,每个用户是有身份特征的,用户

的个人信息与其 ID 或者登录名直接关联。通过记录用户的检索习惯,网站可以结合用户的

历史记录、使用偏好等,不断调整并提供用户更个性化的检索结果。更进一步,VSP 站内搜

索还可以通过统计分析不同使用者 常用的搜索词、用户反馈不佳的查询结果、被用户采用

的 终目标网页、各个类别关键词的查询量、检索结果的点击率等,匹配用户的身份信息进

行个性化推荐。此外,VSP 站内检索还支持用户在线交互,用户可以对满意的搜索结果进

行 佳搜索推荐,跟其他用户分享搜索体验,共同改善站内检索效果。只要您检索,我们就

能让您找到想要的。——优化检索结果、简单化检索过程,这就是维思比站内检索的重要特

点。

支持跨语言检索

经济全球化、经济虚拟化促使人们越来越希望能更快更全地获取更多更新的信息,因此

打破语言瓶颈的要求也越来越迫切。在搜索信息时,人们希望能够实现跨语言搜索,即用一

种语言搜索,便能获得包含其他语言描述的搜索结果。VSP 站内检索系统可以支持多语言实

体描述,网站可以自定义知识库,通过概念实体对不同语种的表述方式进行关联,系统自动

调用知识库的概念对网站信息进行自动标引,用户检索时只要输入概念实体的某语种表述方

式,即可完整获取不同语种的搜索结果。

简化安装、易于管理的架构

让一个站内搜索基础设施在您的环境中快速部署运行,无论您网站规模大小,简化的安

装将让您的站内搜索实现规模化。即使在不同服务器硬件和数据库的配置下都可以使用相同

的站内检索平台,可以满足不断发展变化的使用需求。

7

Page 10: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

同时,它也能够伸缩以满足规模需求。应用维思比站内检索基础设施,可以降低您的投

资风险,它将与您的网站一起发展,从一个快速、方便、低成本搜索服务器到发展为复杂先

进的网站基础设施。

VSP 采用统一的管理控制台,观察分析常见管理任务,监控系统和爬取信息的状态,

并在一个单一、可配置的视窗内设定您的搜索设置。网站可以自定义采集、索引的更新周期,

系统将自动运行任务。

8

Page 11: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

维思比站内检索方案的结构

维思比站内搜索引擎由 6 部分构成:网络爬虫(VSP Spider)系统、全文数据库(VSP Server)、自然语言处理工具(VSP NLP)、检索结果展示系统(VSP Result Publisher)、分析

管理系统(VSP Management Console)和可选的知识库模块(VSP Knowledge Base)。

网络爬虫系统担任采集网络或者网站群内结构化、半结构化、非结构化信息的工作。

全文数据库提供海量信息的分布存储和即时索引,并提供全文检索和高级检索功能。

自然语言处理工具是为了梳理加工采集后的结构化、半结构化和非结构化信息,比如从

非结构化文本中抽取结构化数据。

检索结果展示系统为用户提供丰富的检索结果展示模版,以适应不同网站的展示需求,

其检索结果包括信息动态聚类、迭代导航、自动摘要、网页快照,以及多种检索结果排序方

式等。

分析管理系统对用户的行为进行统计分析,了解用户意图,更好的满足搜索要求。

知识库系统将自动采集处理信息,利用知识库的内容自动标引信息,实现概念检索。

9

Page 12: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

维思比站内检索的应用场景

一、Getty 基金会研究内网

美国石油巨子保罗‧盖蒂(J. Paul Getty)于 1976 年去世时遗留了巨额资产用于投资艺

术品,这是迄今历史上 大的艺术品投资。位于洛杉矶西侧马里布、作为全球著名的博物馆

之一的 Getty Center,其收藏的油画、雕塑和其他艺术品中有很多价值连城的极品。而私人

经营的基金会 Getty Trust 成立于 1982 年,致力于完成观赏艺术及有关人文科学的 7 项经营

计划和 1 项资助计划。在过去数年间,Getty 的工作人员编制了世界著名艺术品、艺术家主

题词表,极大地方便了研究人员从事艺术研究。举例说明其重要的意义,16、17 世纪很多

西方艺术家都习惯使用多个笔名,为了更好地进行研究,艺术工作者需要了解研究对象不同

时期的不用笔名及其对应的不同作品。然而,信息过于庞杂、繁琐,一般研究员难以通晓整

个艺术史并清晰地记忆字母复杂的多个名字及其关系。

维思比将艺术主题词表引入搜索引擎。艺术工作者只要知道研究对象的一个名字,我们

就能搜索到关于他或者她的其他笔名以及相关信息。并且,为 Getty Center 建立的艺术品检

索服务,具有迭代导航功能,信息的检索和浏览有机结合相辅相成。当用户选取了需要查询

的艺术品目录,检索服务器会按照目录内的艺术品基本信息,比如作者首字母范围、年代范

围、艺术品主题、艺术品类别等,进行统计和检索结果导航,用户通过点击不同类别下不同

范围的导航结果,可以边检索边浏览全局信息,直至发现满意的结果。

10

Page 13: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

二、B2C 电子商务网站应用

某商城是国内知名 B2C 市场电子产品网购专业平台,是中国电子商务领域 受消费者

欢迎和 具影响力的电子商务网站之一。相较于同类电子商务网站,该网上商城拥有丰富的

商品种类,并凭借极具竞争力的价格和逐渐完善的物流配送体系等各项优势,取得多年稳居

市场占有率行业首位的骄人成绩。但是随着产品种类的丰富,产品目录分类越来越复杂多变,

难以调整,用户寻找产品的过程越来越麻烦,用户体验受到影响。

比如当用户在旧的检索条内输入“鼠标”,结果会出现 1400 多条在售商品的信息,这样

长长的搜索结果清单往往让消费者失去逐一比较、翻页阅读的耐心。虽然可以通过确定价格

区间或者选择品牌来缩小搜索范围,但是当选择某些知名品牌鼠标时,每次还有 100 多条信

息,无法再进一步缩小精确范围供参考。

应用维思比站内检索,1400 多条鼠标的在售信息会依照品牌、价格、包装、产品、质

保期限、评级、商品重量、购买缺陷、特价、颜色、类型(机械、光电或激光等)等产品属

性内容进行迭代导航。对价格敏感的用户,可以先选择偏好的价格范围,然后根据动态调整

的结果和用户其次关注的指标,比如保修周期、送货条款等, 后确定下来自己满意的产品。

而其他用户,可能先选择品牌,再选择类型、颜色等属性, 后才关注产品是否符合其心理

价位。

无论用户的偏好多么个性化,在具有丰富产品属性描述的检索结果清单内,不同用户都

可以从任何属性入手,边检索边根据导航提示的各种未知信息来确定 后希望得到的结果。

另外,根据运营分析模块对用户属性的跟踪,未来检索结果可以被个性化调整,以不断提高

用户对于网站信息服务的满意度,同时,对于同一类产品的自动统计分析,可以显示出该类

产品的不同属性影响购买者决策的权重,更好为商城有针对性地订货提供参考,商城也可以

据此将关注度高的产品属性放在相关检索结果的前端,以增加销售机会。

11

Page 14: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

结论

维思比站内检索方案将帮助网站生成透明、多维的检索结果,即使有些信息可能是用户

本无了解或未能清楚记忆并表达的,检索结果的动态呈现、多维呈现将会为用户提供发现信

息的 佳途径。配合主题词表和对检索日志的统计分析,即使用户输入错误,维思比站内检

索也能自动推荐正确的表达供用户选择。

总之,维思比站内检索将帮助网站的终端用户、企业内部用户、管理人员或者其他类型

的使用者准确获取信息,成为易于部署、管理方便、使用便捷的信息桥梁。

12

Page 15: VSP 站内检索解决方案 - tech.byreach.comtech.byreach.com/sites/default/files/vsp_znjs.pdf · 站内检索的意义就是引导用户发现目标,很难想象一个拥有极大信息量的行业门户网站

“信息无处不在,搜索创造价值”

附录

控制语言(受控词汇)是什么?

控制语言(受控词汇)是由精心挑选的标准化术语、词语和短语构成的清单,其用来标

记信息单元,使它们可以更容易被检索到。它的特点是采用一致的格式和语法,并可能包括

同义词和交叉引用。每个术语往往由受过训练的在主题领域拥有专门知识的专业人员(包括

图书馆员和信息科学家)选择和组织的。控制语言可以通过概念准确地描述指定信息的真实

含义,即使术语本身在该信息的文本内并未出现。

控制语言往往是发达国家为改善文本搜索的准确性而开发的。自然语言自身固有的含混

性往往造成不相干的术语纠缠在一起。以足球的英文单词“football”为例,全球 流行的

团队运动是足球,但在几个主要足球国家足球它也被叫作“soccer”。与此同时,“football”一词也被用于指橄榄球、美式足球、澳大利亚足球、爱尔兰式足球和加拿大足球。如果采用

传统的关键词检索方式,搜索“足球”将得到与上述几个完全不同的运动相关的结果。控制

语言以标记文件的方式解决了含糊不清的问题。与关键词搜索方式相比,使用控制语言进行

概念检索可以显著提高搜索查全率和查准率。

为什么控制语言(受控词汇)有用?

由控制语言(受控词汇)来描述网页可显著改善 Web 搜索。在语义网络中,会有越来

越多的网站采用计算机能够读取的元数据描述网页,控制语言的用武之地将持续扩展。在大

型机构,控制语言可以被引进以改善技术沟通。使用控制语言将确保不同人都使用同一意思

描述同一件事。在技术写作和知识管理中,概念的同一非常重要。

13