提示功能,这种功能的背后要有大量词库的支持.汉字输入法中的词量非常大,并且很成熟,所以,在分词时,可以把汉字输入法中的词库引入进来,并采用相似词、旬管理方法,对用户的句子进行分解.这样利用现有的技术成果,可以大大提高分词的技术水平和缩短研发周期.中文全文检索技术的关键是分词,这里在对传统的分词方法进行分析的基础上,对其不足之处提出了改进的
方案.本文中提供的中文分词技术是采用PHP+MYSQL实现的.因为中文的特殊构词、造句的语法,分词技术主要是针对于中文而言的.而且分词的基础就是要建立大量的词库,所以说,要想把中文的分词做好,关键还是对于中文的语法研究,并在此基础上进行词语规范划分,进而形成统一、规范的词库.在此基础上,各种分词的算法才能做到快速、准确.
参考文献:
E13杨宝昌.MYSQL实现中文全文检索的解决方FJ3.
程序员,2006(10):108-110.[23熊回香.全文检索中的汉语自动分词及其歧义处理[刀.中国图书馆学报。2005(05):299—301.[3]关伟豪.校内信息发布系统的
设计与开发[J].中山大学学报论丛,2002(2)。299?301.
Researchofchinese
wordautomaticsegmentationbasedonPHPand
MYSQL
XDDian-junl,CUI
Bao-hua2
.
(1.LibraryofBohaiUniversitytJinzhou121000.ChinaI2.StudentAffairsOffice.LiaoningNormalUniversity,Dalian116029,China)
Abstract:Therelevancerankingarranges
vantto
a
set
ofretrievedrecords
SO
thatthosemostlikely
are
to
berele—
yourrequest
are
shown
to
you
first.Therelevancerankingofsearchresults
on
directlydecid—
edbyaccuracyofChinesewordsegmentation.BasingbyPHP,thispaperpresents