动态网页下载,非高手莫进来,(20分)

  • 主题发起人 milesmaqi
  • 开始时间
M

milesmaqi

Unregistered / Unconfirmed
GUEST, unregistred user!
我不是高手,所以想问一问,
目标:
我在DANGDANG.COM网上书城,键入DELPHI关健字搜索,找到DELPHI的书共3000本,分为500页显示,
每页显示6本书的记录,现在我想把他们全部下载到本地,最好可以合并成为一页,
但是要常用的下载工具,只能下载静态网页,而不能下载动态网页,如FLASHGET ,FRONTPAGE,
WEBZIP等,
有没有这样的好办法呢?
 
我相信有办法,可我也是新手,帮你顶把
 
有办法,那是不可能的!
 
这不可能,要是有哪个软件可以的话那这软件就是木马了。可以下载别人机子上的动太页面,那就可看到源代码了? 也可做其他任何要想要做的事呀!
 
同意chengulv
 

除非这些书是按号存的
你可以批量下载
 
这样:
请他们管理员吃饭。
然后让它把数据库发给你不就行了吗?
你想让它显示几页就是几页
 
做美梦呀?动态网页都可以下载下来?
除非你有办法知道他的数据库,找到书本文件存放的路径,那样还差不多!
 
我提一个想法,你可以试以下,比如:
http://dangdang.com/dd2001/search/search.asp?page=6&book_name=DELPHI&MEDIUM=0
看到地址中的page=6了吗?如果修改page的值范围如1-100就可以把1-100的100张页面全
访问到,打开flashget/任务/添加成批任务,在Url中输入:
http://dangdang.com/dd2001/search/search.asp?page=(*)&book_name=DELPHI&MEDIUM=0
注意page=(*),然后在通配符中输入1和100,就可以开始下载了,最后把下载的文件扩展名
.asp改为.htm,不过下载到的页面中看不到图片,也没有样式,很难看的:)
 
再有,过如果地址中有例如pagesize=?的这种格式(pagesize的意思是页面的记录数,
当然也可能是其他形式的参数),通过设置pagesize的值可以得到你想要数量的纪录。
 
变了。
为什么不好好讨论问题
说这些“做美梦呀?动态网页都可以下载下来?”干什么?
 
动态网页的内容可以下载,其实也是html,源代码估计没戏。。。
 
那个网站的书连看都看不倒呀??
是网上订购系统。。下来干什么??
 
好像没有什么困难吧,不过,又没有书的内容,要那些信息有什么用?
写一个蜘蛛就可以了。
 
我以为我就够白吃的了,居然还有比我还白吃的
 
蜘蛛是如何写的,可否告知。比如说GOOGLE的蜘蛛
 
可通过IndyClient的IdHTTP控件来下载.
memo1.Lines.Add (Idhttp1.get('http://dangdang.com/dd2001/search/search.asp?page=1&book_name=delphi&MEDIUM=-1'));
通过修改page=X来改变每一页。分析每页内容,将相关内容入库。
 

Similar threads

D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
1K
DelphiTeacher的专栏
D
D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
1K
DelphiTeacher的专栏
D
顶部