J Jeny Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #1 我需要把doc,xls,pdf,html htm xml jpt ppt 等类型文件中的内容取出 来转换成txt文本存储,真是一点头绪都没有,有没有人做过相似的问题? 快help me ,一定有重谢的。
我需要把doc,xls,pdf,html htm xml jpt ppt 等类型文件中的内容取出 来转换成txt文本存储,真是一点头绪都没有,有没有人做过相似的问题? 快help me ,一定有重谢的。
J Jeny Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #3 没人理我,是问题太容易了还是。。。 只讲解决方案亦可,或者只讲其中一种也行啊。
C Chenlili Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #4 xml,html本身就是文本文件,要取出其中的“内容”,做一个简单的词法分析就可以 DOC,XLS是M$的东西,有相关的编程接口,做起来也不难 至于jpg之类的东西全是二进制代码,不知道你要把它转成文本做什么。
xml,html本身就是文本文件,要取出其中的“内容”,做一个简单的词法分析就可以 DOC,XLS是M$的东西,有相关的编程接口,做起来也不难 至于jpg之类的东西全是二进制代码,不知道你要把它转成文本做什么。
J Jeny Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #5 我是为了采集信息以供检索用的。一些网页我需要将它们的源码存成txt,当检索 到需要的东西时,再恢复成原样显示。 word,excel,ppt,jpg等也一样,jpg图像虽是二进制的,但还是有一些如标题作者等 是文字的。 其实现在最急的是txt,doc,xls,pdf,html,xml的文本存储。存储是一定要先转换成txt 存储了,(因为存储接口已有只支持txt),至于原样显示,我想在存成txt的同时,将此 文件备一份,到指定的路径下,当想要原样显示时,我用server中的控件,调用word,excel 等。不知此法可行否,又怎么实现。
我是为了采集信息以供检索用的。一些网页我需要将它们的源码存成txt,当检索 到需要的东西时,再恢复成原样显示。 word,excel,ppt,jpg等也一样,jpg图像虽是二进制的,但还是有一些如标题作者等 是文字的。 其实现在最急的是txt,doc,xls,pdf,html,xml的文本存储。存储是一定要先转换成txt 存储了,(因为存储接口已有只支持txt),至于原样显示,我想在存成txt的同时,将此 文件备一份,到指定的路径下,当想要原样显示时,我用server中的控件,调用word,excel 等。不知此法可行否,又怎么实现。
Y YB_unique Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #6 doc,xls,html htm xml 的简单!通过接口转换! pdf 不会,但有软件(GSview4.0)可以实现! jpt,ppt 不清楚!
N newsweep Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #8 可用一RichEdit來loadfromfile 但如doc,xls等要用到接口
Z zh_2001 Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #9 doc,xls,html htm xml可以通过接口转换
J Jeny Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-05 #11 RichEdit的loadfromfile出来的东西是有限的吧。 通过接口,具体点好吗?
D dhyzf Unregistered / Unconfirmed GUEST, unregistred user! 2001-12-09 #14 有没有可以用ado把foxpro,excel的格式导入导出sqlserver数据库的呢