如何实现对doc,ppt,txt,html,excel文件进行全文检索?(150分)

  • 主题发起人 主题发起人 desertpear
  • 开始时间 开始时间
D

desertpear

Unregistered / Unconfirmed
GUEST, unregistred user!
如何实现对doc,ppt,txt,html,excel文件进行全文检索?
我想实现对这些文件进行关键字查询,只要能找到有所要的关键字就可以,不知道怎么来实现,希望高手能讲的详细一些,谢谢
 
要分开检索,doc,ppt和execl的文字使用unicode存贮的,用unicode查询是可以查找的。
txt和html比较麻烦,使用的是单字节的,查询可能要转换成对应的十六进制查询。

或者你要简单一点,使用windows2000里面的索引功能,可以对这些文件进行索引,然后你可以做一个接口调用这些索引进行查询。windows有这个接口的。
你看看索引那个东西就知道了。
 
to:arnew
能否具体地说一下如何实现的吗?
 
怎么没有别人喂答呢?是不是我说的不清楚?我只是想实现在不打开文件的情况下,检查此文件中是否存在我要找的字符串。
 
不清楚你问的是什么意思,我觉得太简单了.
在"要搜索的文件或文件夹名为"中输入:
*.doc;*.ppt;*.txt;*.html;*.excel
在"包含文字"中输入你想要查找的问文字,不就可以了.
 
我是要在程序中实现,不是自己手动找文件
 
要检索这些,我只知道一种办法,
利用OLE打开文件,然后,利用宏来进行检索,
 
那应该怎么来做呢?我不怎么会用OLE,也不会使用宏:(
能否尽量说的详细一些吗?
 
是一样的,在程序中调出Windows查找对话框,或不出现Windows查找对话框,直接给定参数即可.
 
我希望不用手工来操作,而且也看不出来调用别的程序,在网上看了几天,主要有两种方式,一种是OLE,一种是数据流.前种用控件,好实现,速度慢,后种要知道文件的二进度结构,但速度快,不过我现在这两种方法都还不是很明白,希望大家就这个问题能展开来谈谈
 
后退
顶部