如果获取网页特定信息? ( 积分: 200 )

  • 主题发起人 主题发起人 ckzx
  • 开始时间 开始时间
C

ckzx

Unregistered / Unconfirmed
GUEST, unregistred user!
<tr class='flight'>
<th><div id='bxx1' title='281'star='1173842976'></div></th>
<th colspan='3'><span class='flight attack'>一位敌意的 <a href='#' onmouseover='this.T_WIDTH=200;return escape(&quot;飞船的数量:: 1 &amp;lt;br&amp;gt;探测器 1&amp;lt;br&amp;gt;&quot;)' class='attack'>舰队</a><a href='' title='飞船的数量:: 1 探测器 1'></a> 来自于 Apha <a href='writemessages.php?session=e2e22c5e9453&amp;messageziel=115390'><img src='http://80.237.203.201/ogame/game/img/m.gif' title='撰写信息' alt='撰写信息'></a> 正从 星球 Askey <a href=&quot;galaxy.php?galaxy=4&amp;system=132&amp;position=4&amp;session=e2e22c5e9453&quot;>[4:166:4]</a> 前往 星球 lovee <a href=&quot;galaxy.php?galaxy=4&amp;system=131&amp;position=4&amp;session=e2e22c5e9453&quot;>[4:65:4]</a>. 任务为: 攻击</span>
</th>
</tr>

这个是现在的网页的源码。
以前能过以下代码可以获取:
<DIV id=bxx/d+ title=(/d+) star=.{20,24}</DIV></TH>/s{1,2}<TH colSpan='3'><SPAN class=&quot;flight (/w+)&quot;>[^/[/]/n]*/[(.{5,10})/][^/[/]/n]*/[(.{5,10})/]/.[^/n]*</SPAN>
但是现在不能用了,谁知道问题出在什么地方了吗?
1.剩余秒数 2.消息类型 3.出发星球的坐标 4.目标星球的坐标
 
flight (/w+)&quot;>[^/[/]/n]*/[(.{5,10})/][^/[/]/n]*/[(.{5,10})/]/.[^/n]*
或者有人告诉我这里是什么意思也可以
 
(/w+)&quot;>[^/[/]/n]*/[(.{5,10})/][^/[/]/n]*/[(.{5,10})/]/.[^/n]*
这个明显就是正则表达式。
现在的问题是,正则表达式和给出的字符串不匹配。
 
能修改成匹配吗?
 
上面的那段,你最后希望得到的是什么样子的?
是得到th里的东西吗?
 
我想提取每个()里的内容。 (/d+)提取的是attack , 正常的(/w+)提取的应该是网页里的281数字,/[(.{5,10})/]应该是第一个[4:166:4] , /[(.{5,10})/][应该是第二个[4:65:4]
 
大小写,还有'这些都和html里的相同,在测试一下。
 
哥们,我不知道你要得到什么,下面是我修改的
<div/s*id='bxx/d+'/s*title='/d+'/s*star='.{1,24}'></div></th>/s*<th colspan='3'><span class='flight/s*(/w+)'>/w*[^/[/]/n]*/[(.{5,10})/][^/[/]/n]*/[(.{5,10})/][^/n]*/w*</span>
你看看吧,另外,java中的正则表达式可以忽略大小写的(有参数),你提取页面上的信息,写的规则不完善,有时间在完善一下吧。
 
谢谢了。我自己已经改好了
 
后退
顶部