时间:2022-12-01 16:30:01 | 来源:信息时代
时间:2022-12-01 16:30:01 来源:信息时代
相关反馈 : 一种提高信息检索系统服务质量的技术手段。在信息检索过程中,用户通过对系统返回的结果进行相关程度的评价,以便能获得更为满意的查询结果。一般来说,检索系统会在“相关”和“不相关”之间,设定多个等级,让用户在众多的返回结果中,根据具体情况对某个检索结果设定反馈评价等级,有些检索系统提供的评价方式是简短的描述。系统会在下一次检索处理时,综合考虑用户的反馈信息,提高检索结果的准确度。支持相关反馈的检索系统,一次检索处理过程,用户可以和检索系统进行多次反馈交互以获得更为满意的检索结果。
相关反馈的处理方式主要有显式反馈(explicit feedback)和隐式反馈(implicit feedback)两种。显式反馈是指用户主动对检索结果给出明确的评价意见;隐式反馈是指根据用户对检索结果列表中某些结果的选择浏览动作,认定用户对这些检索结果表示认同。显然,显式反馈要比隐式反馈可信度高,但隐式反馈基本没有影响用户的检索过程,用户友好性要强。为了进一步减少对用户检索过程的影响,还有一种称为“伪反馈”(pseudo feedback)的相关反馈处理技术,这种技术根据检索结果是按照请求相关度降序排列的特性,选择排在前列的若干检索结果作为反馈结果,返回给检索系统去重新进行检索处理。伪反馈只是增加了单次检索的处理时间,但不影响用户的检索过程,实际应用中也有比较明显的改善效果。
信息检索本身不是精确检索,用户也常常难以准确地表达自己的检索请求,这些因素造成系统的一次检索过程难以返回非常满意的检索结果。相关反馈的处理目的就是要让检索系统更加准确地了解用户的检索请求,从而达到提高检索结果准确度的目的。从系统实现的角度看,相关反馈的信息常常被用来扩展或修正用户的检索请求。应用领域不同,相关反馈信息的处理方式也有所不同。
在文本检索领域,常常采用向量空间模型(vector space model,VSM)描述检索文档和用户的检索请求,此时,用户的反馈文档也是用向量表示的。相关反馈的检索请求更新算法中比较经典的是Rocchio算法,其处理公式如下: