中文分词算法研究Arithmetic Research on Chinese Segmentation
刘件;魏程;
摘要(Abstract):
当前搜索引擎技术被广泛的应用,这使得全文检索技术和中文分词技术的研究逐渐深入。本论文致力于研究中文分词算法,通过实验对分词原理做出比较,对分词算法、词典对分词质量的影响做出判断和评估,并设计了分词原型比较实验,比较测评了当前流行的中文分词方式:中科院分词模块和最大正向匹配法模块。
关键词(KeyWords): 全文检索;中文分词;查准率;查全率;F1参数
基金项目(Foundation):
作者(Authors): 刘件;魏程;
参考文献(References):
- 1马玉春,宋涛瀚.web中中文文本分词技术研究.计算机应用,2004,24(4):134~136
- 2易丽萍,叶水生,吴喜兰.一种改进的汉语分词算法.计算机与现代化,2007,2:13~15
- 3Chien Lee-Feng.PA T-tree-based adaptive keyphrase extraction for intelligent Chinese information retrieval.Information Pro-cessing and Management,1999,35:501~521
- 4顾铮,顾平.信息抽取技术在中医研究中的应用.医学信息学,2007,20:27~29
- 5何淑芳.基于BBS文本信息的中文自动分词系统的研究.青岛:中国海洋大学,2006.
- 6张自然,金燕.知识检索与信息检索的检索效率比较.情报科学,2005,4:590~592
- 7曹桂宏,何丕廉,吴光远,聂颂.中文分词对中文信息检索系统性能的影响.计算机工程与应用,2003,19:78~79