Topic: 关于全文检索的问题 |
Print this page |
1.关于全文检索的问题 | Copy to clipboard |
Posted by: sunfmin Posted on: 2005-01-11 10:58 关于全文检索的问题 正在做的项目使用Spring,Hibernate做的,其中要求有全文检索。 其中全文检索的功能要求如下: 基本功能:对文本和XML,HTML的中日韩语言能够全文检索 扩展功能:能够对Microsoft Word,Microsoft Excel,PDF,Microsoft PowerPoint的中日韩语言进行全文检索 Hibernate应该不会内置全文检索功能,另外它的HQL也不支持Oracle的contains等全文检索关键字,估计对Oracle以外的数据库如 MySQL,PostgreSQL等好像也不支持其中的全文检索关键字。所以只能放弃。 最近看了看Jakarta Lucene,好象对基本功能差不多能实现,但是扩展功能部分(Word,Excel等)的有一点难度。 希望大家不吝赐教,在你们项目中用什么做全文检索,上面的功能都能实现吗? |
2.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: bluepure Posted on: 2005-01-11 11:01 lucene +textmining+ pdfbox+POI |
3.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: sunfmin Posted on: 2005-01-11 11:04 能所有功能都实现吗?能详细说明一下吗?十分感谢。 |
4.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: sunfmin Posted on: 2005-01-11 11:16 TextMining是不是只用来处理Microsoft Word文档的? 那么POI不也可以吗?为什么要和起来用,能说一下优点吗? 多谢。 |
5.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: mmwy Posted on: 2005-01-11 14:10 用TextMining把word转成txt,存lucene里面进行检索,PDFBox是pdf=>txt,POI用来excel=>txt。 我原先是用TRS Server做全文的,手上一个项目这次因为money的原因换成lucene,感觉lucene比起TRS这类来是差了许多,如果有米的话,建议还是买TRS这类东东:) |
6.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: sunfmin Posted on: 2005-01-11 14:27 POI不能转Word吗? 那么又没有把Microsoft Powerpoint转成Text的? |
7.Re:关于全文检索的问题 [Re: sunfmin] | Copy to clipboard |
Posted by: sunfmin Posted on: 2005-01-14 11:06 原来 POI能转 Microsoft Word,Excel,Powerpoint。 TextMining 也是基于POI的。 |
Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1 客服电话 18559299278 客服信箱 714923@qq.com 客服QQ 714923 |