疑惑中,请问有谁知道新浪的那个rss阅读器的原理,xml格式是如何实现的 ( 积分: 100 )

  • 主题发起人 主题发起人 vigor0709
  • 开始时间 开始时间
V

vigor0709

Unregistered / Unconfirmed
GUEST, unregistred user!
大家知道新浪rss(Really Simple Syndication)是一种把网站的内容变成xml格式快速浏览的好工具,这不得不说是种很好的东西,我想知道是不是只有网站提供xml的才行,如果没有的话还能用什么办法使这种半结构化的数据变成结构化的xml的格式,小弟知道用mshtml接口可以获取网页源码,但是如何使之格式化却有难度,还有,rss倒不像是用webbrowser控件来完成的,所以请问一下原理,请高手不吝赐教
 
大家知道新浪rss(Really Simple Syndication)是一种把网站的内容变成xml格式快速浏览的好工具,这不得不说是种很好的东西,我想知道是不是只有网站提供xml的才行,如果没有的话还能用什么办法使这种半结构化的数据变成结构化的xml的格式,小弟知道用mshtml接口可以获取网页源码,但是如何使之格式化却有难度,还有,rss倒不像是用webbrowser控件来完成的,所以请问一下原理,请高手不吝赐教
 
我正在做RSS阅读器,工作原理如下:
1 首先从提供RSS连接的网站获取XML文件,分析里面的<channel>节点,读取相应的属性(NAME,LINK,Pubdate等)
2 通过link,取得新闻的HTML文件。
3 在阅读器上显示出来。

<rss>有固定的结构。
<?xml version="1.0" encoding="gb2312"?>
<rss>
<channel>
<title>频道标题</title>
<description>频道描述</description>
<link>频道连接</link>
<item>
<title>新闻标题1</title>
<link>新闻连接1</link>
<author>新闻作者1</author>
<pubDate>发布日期1</pubDate>
</item>
<item>
<title>新闻标题2</title>
<link>新闻连接2</link>
<author>新闻作者2</author>
<pubDate>发布日期2</pubDate>
</item>
<item>
<title>新闻标题3</title>
<link>新闻连接3</link>
<author>新闻作者3</author>
<pubDate>发布日期3</pubDate>
</item>
</channel>
</rss>

电脑报上有一个关于RSS阅读器的连载。。。
 
是不是只有提供rss服务的网站才可以进行这样的挖掘呢?
如果是普通的新闻网站能不能把之转化成xml形式呢
 
我似乎入门了,但是用什么做可以实现把这些xml文件按照软件的那个显示出来呢,用delphi可以实现吗?大侠请明示,有什么接口就像mshtml那样可以直接实现利用这些<title>标签的东西呢?请给在下一些提示
 
用DELPHI,里面有个XMLDOCUMENT控件(internet组)。
 
XMLDOCUMENT
或者直接用MSXML
普通网站转换成XML形式基本不可能.
 
这个一定要网站提供rss接口的
 
我知道的,谢谢大家,但是我不会用delphi的什么控件开实现,大家能给个简单的实例好吗?
我真的很需要,哪怕只实现读写xml就好了,我现在找资料到google搜索,还不如到大富翁来找高手,请高手不吝赐教.我的qq是53060081,邮箱是lovejoy0709@126.com
 
用TXMLDocument,或者Open XML
 
我知道,能给个小小的范例好吗
 
satanmonkey大哥,能加我qq或者给我做过简单的demo,拜托你了
 
刚才居然让我弄出来
其实delphi的帮助是最好的资料
下面我想把这些记录直接用ado写入数据库
delphi真是爽!
有大哥知道xml转数据库最爽的工具是什么?
 
谢谢大家
问题解决了
 
多人接受答案了。
 
后退
顶部