当前位置: 首页>>优优 >>寻找企业搜索中的人为因素

寻找企业搜索中的人为因素

添加时间:    


乔治·奥威尔(George Orwell)并没有在他的幻想书 1984()中特别提到企业搜索,但他发表了一个声明,今天仍然有共鸣。当涉及到相关的搜索查询结果时,“这与统计数据无关”。理智来源于人的因素。

直到最近,这个概念大部分被企业搜索解决方案忽略。相反,搜索是基于文本匹配算法和模型,通过链接结构或分类方案进行系统筛选。经过分析和汇编,搜索结果(所有量化的正确的)激增被释放。虽然统计学家可能会对结果留下深刻的印象,但发起搜索的用户只是淹没在同质数据的海洋中。

问题变成了“是否有可能产生一组有意义的搜索结果来帮助人们,而不是淹没他们呢?

作为回应,企业搜索技术引入了允许“专家”针对其特定内容调整搜索算法的工具,并引入了元标记最佳实践来构建内容并产生更有意义的结果。最近,为了解决搜索相关性的问题,引入了明确的用户操作,如点击,评级和反馈。今天,包括“社交搜索”在内的先进技术已经发展到考虑人类如何在物理世界中搜索,查找和使用信息和产品。

企业搜索一直是企业知识库和网站的事实标准。由于这种方法通常基于文本匹配算法,因此在查找与特定查询词相匹配的所有文档方面做得非常透彻。一些高度发展的搜索引擎使用依赖统计推断的专门分类系统或模式识别技术。因此,企业搜索引擎在性能,综合性和自动化方面经历了巨大的增长。然而,他们仍然缺乏产生相关搜索结果的唯一最重要的因素:主观性。在一些输入到文本字段中的模糊词语的引导下,搜索引擎仍然没有可靠的方法来准确地解释个人用户的实际意图。

为了应对主观性和对用户意图的理解不够,已经开发了各种方法,包括基于专家的调整和用户显式调整,以试图为最终用户提供更有用的结果。

不同的专家调整方法可以包括基于算法的调整,调整实际内容和基于查询的调整。这些专家驱动的方法的主要问题是,他们可能严重的劳动密集型,偏见和对用户的真实意图缺乏洞察力。最终,他们证明,随着时间的推移,他们变得过于僵硬和费力,因此设想了一个更具扩展性的模型。一个会考虑到用户的反馈。

这个被称为用户显式调整的第二种方法因其关注“人为因素”而受到关注:结合了网站访问者的行为。

以用户为中心的搜索应用程序可以观察和分析显式访客行为,例如点击率,投票和访客评论。最近,一些引擎已经开始合并社会标签。社会化标签是过去几年中由del.icio.us和其他Web 2.0网站推广的一种分散的方式来标记网站内容。从根本上说,内容仍然是通过明确的人为判断手动组织的,但在这种情况下,最终用户标记内容而不是内部专家。

通过监测这种反馈和行为,以用户为中心的模型可以深入挖掘人类经验,反映了与所选材料的有用性有关的各种主观意见和判断。而且,由于反馈是动态的,所以搜索结果比静态规则或元数据更新。

然而,就像它的前身一样,基于用户的模型也有一些缺点。首先,因为这些搜索系统中的大多数仅监视有限的显式用户动作,所以存在很大的错误可能性。由于点击次数被错误地视为成功的用户查询,因此搜索系统会对该不良结果进行评分,这会导致搜索结果中出现较高的结果 时间,并将其作为一个更普遍的文件。

这种虚假的流行还会带来标签的次要危害。实际上,内容越受欢迎,用户标记的主题组越多样,并且在任何给定搜索结果中出现的可能性越大。在这两种情况下,“最受欢迎”并不一定等同于“最相关”。

此外,涉及显式用户反馈的搜索结果可能会出现偏差,因为它们可能只考虑到整个网站访问者人口的一小部分样本的行为。视为“1:99问题”,需要明确反馈的系统倾向于吸引最偏激的用户百分之一,因此对用户群的代表性较低,而忽略代表绝大多数的99%的访问者。

也许最值得关注的是依赖于显式反馈的以用户为中心的系统对游戏有严重的影响。恶意用户可以使用自动链接机器人,形成机器人,模仿用户的标签引擎以及各种其他技术来操纵实况网站的行为。

在畅销书“人群的智慧”中,詹姆斯·索罗维茨基(James Surowiecki)探索了一个有着深刻含义的简单的想法:大群人比少数精英更聪明 - 不管少数人的聪明才智。根据索罗维茨基(Surowiecki)的观点,四个基本要素构成了“明智的人群”:意见的多样性,独立性,分权和聚合。

社会搜索考虑到各种形式的用户行为,同时尊重Surowiecki的前提。然而,大多数社交搜索技术依赖于明确的(并且经常是误导性的)用户操作和反馈。在进行搜索时,社交搜索技术也经常忽略确定访问者的真实意图的关键因素:访问者行为的总体背景。

在社交搜索的情况下,上下文不仅涉及访问者在网站上的个人行为的上下文,还涉及这些行为如何与其他访问者的行为进行比较和关联。

像NASA.gov这样的网站每个月的访问量超过1500万次,他们看到了社交搜索带来的巨大好处。 NASA.gov网站使用社会搜索来了解访问者的真实意图,并产生搜索结果以及NASA主要受众(包括学生,研究人员和空间爱好者)最适合的内容和视频推荐。通过捕捉隐含的网站行为并适当调整其反应,NASA根据他们和他们志同道合的同行会发现的信息(不管是文本内容,图像,视频还是动画),自动为每位访问者定制网站体验。

无声的观察是社交搜索成功的关键。这种方法与大多数现有的社会搜索监控技术形成了鲜明对比,其中通过明确的用户行为(例如标签,投票,反馈等)收集行为。然而,无声观察的目标是准确地解释和确定一个网站访问者不中断流量的经验。

可以从每个网站访问者收集并分析此数据以及许多其他类型的隐式页内和页面上的操作。随着这些数据的不断提炼,志趣相投的虚拟社区开始出现。与这些社区相关的行动,模式和趋势构成了集体观点的基础。

当今网站的内容和动态性质的指数增长需要对如何确定网站用户的意图以及将其与最合适的内容进行匹配进行根本的反思。企业搜索技术人员已经开始提出这些问题,但业界从以专家为中心向以用户为中心的转变还处于初期阶段。最终的解决方案将要求搜索系统具有高度的可扩展性,智能化且没有偏见。

社交搜索的定义是劳动力可伸缩性,内容可伸缩性和高度动态性。社交搜索也从网站访问者的集体智慧中受益,创造出比专家更可能的更自然和引人入胜的搜索体验。社交搜索, 如果设想得当,也会利用网站用户的沉默行为而没有偏见。这使内容与真实的意图相匹配,同时防止游戏策略或声音少数的表示。 Scott Brave博士是Baynote的创始人和首席技术官。在Baynote之前,他是斯坦福大学的博士后,曾担任人类与互动媒体实验室的实验室主任。


随机推荐

网站导航 福利地图