没办法,还是做了个离线阅读器——CJ (0分)

  • 主题发起人 主题发起人 CJ
  • 开始时间 开始时间
有了 DFWML,就可以每天更新离线数据库了。
先用 chkl.asp 检查 LID, 过滤掉您不喜欢的人的帖子,
然后用 getl.asp 下载指定 LID 的帖子。
参见:新版大富翁论坛揭密之一:数据提取
http://www.delphibbs.com/xml/new2/dispq.asp?lid=495235
我已经给出了用 MSXML 连接服务器和处理 DFWML 的源程序。
 
我也是,呵呵。
我自己用的版本,是用ADO的,自动建立FULL TEXT,用它检索
老板啊:你仔细看看那个控件的实现,你就知道我为什么不用它了。
 
CJ:
源码拿出来瞧瞧,呵呵
 
好象那个控件对中文无效。
左兄:Access2000/ADO 中有全文检索吗?
CJ兄:mySQL 的全文检索对中文如何?
 
yysun: 老板就是老板,一看就明白,呵呵...的确,有点自定义分词法的味道,呵呵,中文无效;
Access2k好象也没有全文检索。mySQL我拿它当DBase用,而且,只和php用,搞了个小
东西而已,也不是很熟。
左: 都是你啦,不是说有MSSQL版本的了吗?要是早拿出来,也不至于我再写一个。
你意思是要Full-Text-Search部分的代码?全部代码很乱的,只用了一个下午写
拿出来丢人哦。
 
yysun想把离线阅读器做成股票分析软件吗?每天接收数据?
这种做法有一个缺点,如果某一天(或几天)忘了收数据了,以后也忘了,
等哪一天发现离线资料对不上了就麻烦了,嘿嘿。
还是离线数据库好。
 
access2000中没有全文检索,只能用like
cj:
我要的就是Full-Text-Search那部分,不过全部拿出来也无妨么,呵呵
我想到的是用T-sql建立全文检索,不知道你是怎么做的
我会尽快把RE 2.1弄出来的:-)
 
我把它转化为INTERBASE了,放在我们局域网上的服务器上,又编了一个
离线阅读器,用起来很快很方便,只是数据库变为200多兆了。
 
我试验了 mySQL 3.23.36,它的全文检索也不支持中文,也许到 4.0 才会有所突破。
在 Access 环境中,
做 select * ... like ... 速度还可以
做 select * ... like ... order by 速度很慢
做 count(*) ... like ... 速度也很慢
于是就想起“大富翁离线数据库查询“内存溢出”之彻底解决...”里面的讨论
http://www.delphibbs.com/xml/new2/dispq.asp?lid=462524
我想也许 用 FindRecord 机制,FindFirst,FindNext,
先找出第一个符合条件的,然后启动一个线程在后台找其他的。至少外观感觉好些。
 
yysun
1、你的没有用的, 速度还是慢,实际上DAO/BDE都已经有类似的优化了。不必要那么麻烦。可是ADO好象有问题;
2、你的那个XML规范,是不是能够提供按贴号返回?基本上实现以下功能:
A、获得目前最大贴号;
B、返回指定ID之间的帖子;
谢谢
左:早晓得你有这招,要的都是我的绝招啊...
建立FULL-TEXT的代码
http://www.ue100.com/GRZY/cjsoftware/download/RichFullTextSrc.rar
使用SQL SERVER的程序(无源码)
http://www.ue100.com/GRZY/cjsoftware/download/SQL-EasyRichViewer.exe
修改后的使用Access数据库的程序(无源码)
http://www.ue100.com/GRZY/cjsoftware/download/ezrichviewer.rar
 
补充:
1、执行SQL SERVER程序的,需要ConnStr.txt,其中包括连接字串 我提供的是我服务器上的...
2、除非你的机器够好,否则,做Full-Text-Engine是很吃资源的,呵呵...
3、你更新索引以后,不会立即生效。只是启动了相关服务而已。就像NT的MIRROR。
4、在加入新数据后,需要重整索引
5、我建立Full-Text可能存在一些问题,希望指正。
 
YYSUN:正在测试您的XML,呵呵
http://www.delphibbs.com/xml/new2/chkl.asp?datefrom=4/9/2001&dateto=4/9/2001
返回头信息::
HTTP/1.1 200 OK
Server: Microsoft-IIS/4.0
Date: Tue, 17 Apr 2001 12:21:30 GMT
Content-Type: text/xml
Set-Cookie: ASPSESSIONIDGGQQQQFC=LJCHBMPAGPHLKNHDHICLOLEF;
path=/
Cache-control: private
报了个Cookie
可内容就有问题了:
<?xml version="1.0" encoding="gb2312"?><LIST>
<HEADER><DATEFROM>4/9/2001</DATEFROM><DATETO>4/9/2001</DATETO></HEADER><ERROR>错误:无效时间:4/9/2001 --- 4/9/2001</ERROR></LIST>
 
http://www.delphibbs.com/xml/new2/chkl.asp?datefrom=4/9/2001&amp;dateto=4/10/2001
就正确,老大,当天怎么取?
 
呵呵,偷CJ的招人生一大快事也
多谢多谢,我先看看:-)
 
CJ以及各位:
请测试一下RE 2.1:
qinghou.at.china.com/re21.zip
V2.1版使用标准的ADO控件代替了原来的Diamond Access控件,因此理论上可以
连接任何支持ADO的数据库,开发过程中在access和mssql下测试过,但最终版本
尚未经过mssql测试。不知道是否能支持Interbase或其它。
支持多关键字(以空格键分开)查询;
支持自定义SQL;
支持HTML文件的保存和打印。
暂时还没有支持Full-Text-Search和DFWML,计划在正式公开的版本中支持
Full-Text-Search,在V3.0中支持DFWML。
 
没人试?
踢一脚
最新的修改版已经在interbase下通过了
 
yysun,老板:我用了著名的XDOM构件,可是打开您的例子XML报错误的PARSAR:(
MS的那个,能不能IMPORT ACTIVEX ?怎么找不到?您的例子代码是可以的。
有没有参考文档?
 
左:呵呵,等我上公网时再DOWN,呵呵...
另:看看我那个FULL-TEXT有什么不妥的,呵呵,可能有些部分是不必须的。
不过,你的机器当心点,FULL-TEXT爆占资源,呵呵...
 
左兄:做得不错,考虑加个菜单吧。另外,显示部分有2各建议:
1、使用 MSXML 的 XSLT 功能,这就有了skin功能,并省去 ThtmlView 类。
2、不需要生成临时文件,而可以利用 IHTMLDocument 接口,
直接把文字串传给 TWebBrowser。
CJ, 早就提示过您,MSXML 目前是最好的 XML Parser,再给您总结 MSXML 的好处:
- 内置 http 连接,您只要 .load()一个调用,它自动完成服务器连接,并下载 XML。
-do
M 支持 XPATH,可以直接获得 XML 中的节点 selectNodes() 和 selectSingleNode()
- 支持 XSLT 1.0,即可以做 xsl:template 编程和使用 xsl:variable 等功能了。
- 更加重要的:中文处理没有问题。
其他还有,但是就这几点,您就仍掉著名的 XDOM,使用更加著名的 MSXML 吧。
MSXML 的文档在 msdn 上。今天惊讶地发现不久就要出 MSXML 4.0 了。
 
校长:收到
不过IHTMLDocument好象不能对webbrower进行写入,我分析了一下午也没有结果
最后是用IPersistStream搞定的
有什么比较“正宗”的办法没?
 
后退
顶部