Java开发网 Java开发网
注册 | 登录 | 帮助 | 搜索 | 排行榜 | 发帖统计  

您没有登录

» Java开发网 » Java EE 综合讨论区  

按打印兼容模式打印这个话题 打印话题    把这个话题寄给朋友 寄给朋友    该主题的所有更新都将Email到你的邮箱 订阅主题
flat modethreaded modego to previous topicgo to next topicgo to back
作者 分享 Lucene中文分词组件 V1.2.2!!
atlantis





发贴: 8
积分: 0
于 2006-06-14 09:47 user profilesend a private message to usersearch all posts byselect and copy to clipboard. 
ie only, sorry for netscape users:-)add this post to my favorite list
1.2.2
完善了中英文噪声词典

1.2.1
修正中文数字成语无法识别的问题

1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整

1.1
增加扩展词典的静态读取方法

1.0.1
修正无法识别生僻字的问题

1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法

下载地址:http://www.jesoft.cn/posts/list/5.page




一个程序员的奋斗历程

话题树型展开
人气 标题 作者 字数 发贴时间
12066 分享 Lucene中文分词组件 V1.2.2!! atlantis 274 2006-06-14 09:47
9527 Re:分享 Lucene中文分词组件 V1.2.2!! bluepure 355 2006-06-14 12:42
10514 Re:分享 Lucene中文分词组件 V1.2.2!! zcjl 18 2006-06-14 14:03

flat modethreaded modego to previous topicgo to next topicgo to back
  已读帖子
  新的帖子
  被删除的帖子
Jump to the top of page

   Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent
Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1
客服电话 18559299278    客服信箱 714923@qq.com    客服QQ 714923