Topic: 关于全文检索的问题

  Print this page

1.关于全文检索的问题 Copy to clipboard
Posted by: sunfmin
Posted on: 2005-01-11 10:58

关于全文检索的问题

正在做的项目使用Spring,Hibernate做的,其中要求有全文检索。
其中全文检索的功能要求如下:

基本功能:对文本和XML,HTML的中日韩语言能够全文检索
扩展功能:能够对Microsoft Word,Microsoft Excel,PDF,Microsoft PowerPoint的中日韩语言进行全文检索

Hibernate应该不会内置全文检索功能,另外它的HQL也不支持Oracle的contains等全文检索关键字,估计对Oracle以外的数据库如 MySQL,PostgreSQL等好像也不支持其中的全文检索关键字。所以只能放弃。

最近看了看Jakarta Lucene,好象对基本功能差不多能实现,但是扩展功能部分(Word,Excel等)的有一点难度。

希望大家不吝赐教,在你们项目中用什么做全文检索,上面的功能都能实现吗?

2.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: bluepure
Posted on: 2005-01-11 11:01

lucene +textmining+ pdfbox+POI

3.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: sunfmin
Posted on: 2005-01-11 11:04

能所有功能都实现吗?能详细说明一下吗?十分感谢。

4.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: sunfmin
Posted on: 2005-01-11 11:16

TextMining是不是只用来处理Microsoft Word文档的?
那么POI不也可以吗?为什么要和起来用,能说一下优点吗?
多谢。

5.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: mmwy
Posted on: 2005-01-11 14:10

用TextMining把word转成txt,存lucene里面进行检索,PDFBox是pdf=>txt,POI用来excel=>txt。

我原先是用TRS Server做全文的,手上一个项目这次因为money的原因换成lucene,感觉lucene比起TRS这类来是差了许多,如果有米的话,建议还是买TRS这类东东:)

6.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: sunfmin
Posted on: 2005-01-11 14:27

POI不能转Word吗? 那么又没有把Microsoft Powerpoint转成Text的?

7.Re:关于全文检索的问题 [Re: sunfmin] Copy to clipboard
Posted by: sunfmin
Posted on: 2005-01-14 11:06

原来 POI能转 Microsoft Word,Excel,Powerpoint。
TextMining 也是基于POI的。


   Powered by Jute Powerful Forum® Version Jute 1.5.6 Ent
Copyright © 2002-2021 Cjsdn Team. All Righits Reserved. 闽ICP备05005120号-1
客服电话 18559299278    客服信箱 714923@qq.com    客服QQ 714923