Z
zhfhq
Unregistered / Unconfirmed
GUEST, unregistred user!
我现在正在做一个毕业设计的课题,是关于数据仓库的,
我现在主要做得是在数据仓库的原数据的管理和异构数据库源的数据抽取这一块,我的具体
设想是这样的:
我准备用java作我的开发语言,
中央元数据的设计和管理我准备用三层结构来做,以便使我得元数据能够分布式的进行管理,这一块我准备用EJB组件进行实现
异构数据源的析取我准备对Web数据库的采集,但是考虑到如果通过智能Agent对网页上的数据进行采集和提取得话,要用到人工智能的东西,
而我只认为我的水平还不够,所以很难实现,我现在有个设想,就是采用网站数据库源自动登记的方式,利用这种方式对登记的数据库进行数据
的析取,但考虑到异构数据和数据仓库之间数据格式存在的问题,我准备采用xml将异构数据库中提取得数据进行封装,然后再导入到数据仓库中
去。
各位大侠对我的这个设想感觉如何,觉得可行性有多大,可现在我对整个计划的实施细节还是特别的不太了解,尤其是对xml,希望各位大侠能够给
我一些建设性的意见,尤其是再xml对数据进行封装的方面给一些技术性的解决方案,谢谢!
我现在主要做得是在数据仓库的原数据的管理和异构数据库源的数据抽取这一块,我的具体
设想是这样的:
我准备用java作我的开发语言,
中央元数据的设计和管理我准备用三层结构来做,以便使我得元数据能够分布式的进行管理,这一块我准备用EJB组件进行实现
异构数据源的析取我准备对Web数据库的采集,但是考虑到如果通过智能Agent对网页上的数据进行采集和提取得话,要用到人工智能的东西,
而我只认为我的水平还不够,所以很难实现,我现在有个设想,就是采用网站数据库源自动登记的方式,利用这种方式对登记的数据库进行数据
的析取,但考虑到异构数据和数据仓库之间数据格式存在的问题,我准备采用xml将异构数据库中提取得数据进行封装,然后再导入到数据仓库中
去。
各位大侠对我的这个设想感觉如何,觉得可行性有多大,可现在我对整个计划的实施细节还是特别的不太了解,尤其是对xml,希望各位大侠能够给
我一些建设性的意见,尤其是再xml对数据进行封装的方面给一些技术性的解决方案,谢谢!