【精品文档】基于SDD中文农业网页搜索系统

【精品文档】基于SDD中文农业网页搜索系统

源代码 2013-9-18　版权投诉上传资料复制论文网址上传用户：whh53333

Ｆ串和蠢峨若Ｆ羹蒜旦诱蕃鬻飞謦醛；一蟹爵墓“川≤Ⅳ：皋＝础ｊ鬻８磊孺砭§孽ｉｒ掸肖 ②在传统全文检索引擎的倒排索引的基础上，实现了分块索引，能够针对新的文件建立小文薹影星囊疆铋膳赔疆＝翼蕈主磊篙错坦嚣翌苍季眭些鏊零眷醣静，甜睇８位字节为基础的索引文件索引，提升索引速度。

    然后通过与原有索引的合并，达到优化的目的。

     ③优秀的面向对象的系统架构，使得对于Ｌｕｃｅｎｅ扩展的学习难度降低，方便扩充新功能。

     ④设计了独立于语言和文件格式的文本分析接口，索引器通过接受Ｔｏｋｅｎ流完成索引文件的创立，用户扩展新的语言和文件格式，只需要实现文本分析的接口。

     ⑤已经默认实现了一套强大的查询引擎，用户无需自己编写代码即使系统可获得强大的查询能力，Ｌｕｃｅｎｅ的查询实现中默认实现了布尔操作、模糊查询（ＦｕｚｚｙＳｅａｒｃｈ）、分组查询等等。

     面对已经存在的商业全文检索引擎，Ｌｕｃｅｎｅ也具有相当的优势。

    首先，它的开发源代码发行方式（遵守ＡｐａｃｈｅｓｏｆｔｗａｒｅＬｉｃｅｎｓｅ），在此基础上程序员不仅仅可以充分的利用Ｌｕｃｅｎｅ所提供的强大功能，而且可以深入细致的学习到全文检索引擎制作技术和面相对象编程的实践，进而在此基础上根据应用的实际情况编写出更好的更适合当前应用的全文检索引擎。

    在这一点上，商业软件的灵活性远远不及Ｌｕｃｅｎｅ。

    其次，Ｌｕｃｅｎｅ秉承了开放源代码一贯的架构优良的优势，设计了一个合理而极具扩充能力的面向对象架构，程序员可以在Ｌｕｃｅｎｅ的基础上扩充各种功能，比如扩充中文处理能力，从文本扩充到Ｈ１札、ＰＤＦ等等文本格式的处理，编写这些扩展的功能不仅仅不复杂，而且由于Ｌｕｃｅｎｅ恰当合理的对系统设备做了程序上的抽象，扩展的功能也能轻易的达到跨平台的能力。

    最后，转移到ａｐａｃｈｅ软件基金会后，借助于ａｐａｃｈｅ软件基金会的网络平台，程序员可以方便的和开发者、其它程序员交流，促成资源的共享，甚至直接获得已经编写完备的扩充功能。

    最后，虽然Ｌｕｃｅｎｅ使用Ｊａｖａ语言写成，但是开放源代码社区的程序员正在不懈的将之使用各种传统语言实现（例如．ｎｅｔｆｒａ口ｌｅ∞ｒｋ），在遵守Ｌｕｃｅｎｅ索引文件格式的基础上，使得Ｌｕｃｅｎｅ能够运行在各种各样的平台上，系统管理员可以根据当前的平台适合的语言来合理的选择（李宇，２００３）。

    ２．１．２Ｌｕｃｅｎｅ系统结构分析Ｌｕｃｅｎｅ作为一个优秀的全文检索引擎，其系统结构具有强烈的面向对象特征。

    首先是定义了一个与平台无关的索引文件格式，其次通过抽象将系统的核心组成部分设计为抽象类，具体的平２、检索需求转换为查询关键词４、返回数据匹配的结果圈１－１传统ｍ系统模壅Ｒｇ．１－１ＴｈｅＴｈｍ６０Ⅱ且ＩｍＳｙｓ蛔ｍＭ０ｄｅｌ问题的症结在于传统的检索模型性中（如图ｌ—ｌ所示）的三个基本假设中的两个环节出现了问题： ①用户以关键词提交查询请求。

     ②采用关键词匹配技术来生成结果文档集。

     这两个部分方法虽然简单，但是可能会导致信息检索工作出现问题。

    以关键词作为用户的查询请求，排除了用户个体的差异性。

    即只要用户使用了相同的关键词作为查询请求，便可认为用户具有相同的检索意图，把用户认为是静态的，而根据用户相关性的观点，用户的需求情境是一个典型的动态变化过程，用户的检索需求是跟用户内在的知识储备、经验、认知状态以及情绪等紧密相连的。

    以标引词为基础的检索通常会形成这样一种观念：文献的语义和用户信息需求的语义可以用标引词集合来表示。

    这就把问题过于简单化了，因为用标引词集合来代替文档的时候会丢失很多原来的语义。

     如何解决这个问题呢？本文提出要围绕用户信息需求，以用户为中心，通过“二次主题漂移”技术来逼近用户检索需求。

    当然。

    要完全满足用户的信息需求，建立一个大而全、精而准的检索系统是一个非常难的过程，本文仅选取中文农业网页检索作为研究的对象，并把“二次主题漂移”技术贯穿在系统中，企望研究结果能够对中文信息检索研

首页上一页 1 2 345 6 下一页尾页
版权说明

【设为主页】【加入收藏】【打印本文】【回到顶部】【关闭此页】
- 相关文章
  
  ·2013届福建工程学院信息学院毕业设计（
  ·优秀包装设计精选集
  ·Callegar优秀i橄榄油包装设计欣赏
  ·优秀食品包装设计欣赏
  ·创意咖啡杯设计欣赏
  ·Togo Burger创意汉堡外卖包装设
  ·戛纳创意节创想日(Cannes Lion
  ·薯片包装设计欣赏
  ·漂亮的葡萄酒包装设计欣赏
- 最新文件
  
  ·青少年学业情绪发展特点及其与自我调节学习
  ·在新经济形势下关于房地产信托投资的思考
  ·章碣:焚书坑-唐诗欣赏
  ·学会在餐厅点餐
  ·计量经济学
  ·北京所有大学_北京京北职业技术学院
  ·wm常见问题解决
  ·[初三作文]夜游
  ·丁承运琴学研究
特别推荐

免费论文,原创论文,参考论文,论文源代码-网学

【精品文档】基于SDD中文农业网页搜索系统