用的词汇不同,如“非典型肺炎”、“sARs”、“非典”等,只用某一词查找就可能出现漏检,如果让用中国农业科学院硕士学位论文 第二章全文检索与语义检索档D可以表示为d(d。
,d2,d3…….。
dIL),其中二元随机变量Xi表示索引项Ti是否在该文档中出现,如果出现,则xill,否则Xi=o。
(2)在一个文档中,任意一个索引项的出现与否不会影响到其他索引项的出现,它们之间互相独立。
从本质上讲,信息检索是一种具有不确定性的决策判断过程。
经典概率模型清楚地认识到了这种不确定性(或相关性),剥用概率论原理,通过赋予索引词某种概率值来表示这些词在相关文档集合和非相关文档集合中的出现频率,然后计算某一给定文档于某一给定用户提问相关的概率并做出检索决策.
上一篇:
【精品】RealView编译工具(4.0版)要点指南
下一篇:
商业银行发展绿色信贷业务的对策探讨