有谁知道国图(SSREAD)的文件具体格式?(50分)

  • 主题发起人 主题发起人 Luckm
  • 开始时间 开始时间
L

Luckm

Unregistered / Unconfirmed
GUEST, unregistred user!
有谁知道国图文件(就是用超星SSREAD看的那种扫描格式文件)的具体格式?
用SSREAD看真是费劲死了!
 
有一点像是jpg或gif格式的压缩图像文件
 
图像文件,应该是用扫描仪扫下来的
 
不会是扫描的图像文件吧,那样效率太差。
再说我也没看见扫描的图像常见的斑点之类的东西呀。
要是有方法可以得到txt文件(不能是识别率?%的ocr)
就太好了。

 
好像是经过处理的tif,加入自已的文件头。
 
同 receyes,
请各路高手指点指点。
SSREAD真是垃圾中的垃圾
 
要是能转换为图像就好了
 
问问厂家吧。
 
>>要是能转换为图像就好了
能! 按print-screen就可以. :-)


 
cAkk:
不是吧?一本300多页的书,不累死人?
 
开个玩笑嘛!
你要是真想做,自己写一个程序.模拟按翻页按钮,然后每翻一页
再模拟按print-screen,然后在读取剪贴版,把内容保存成顺序
编号的文件.....

方法笨了点,但实用. :-)
 
你说的是那个超星PDG格式吗?SSREADER自带了一套类型库可以处理
我以前曾经写过一个浏览器,具体情况你可以给我写信讨论:)
 
我曾经多次以各种方式给该公司发过信,
但没有任何回音,
可能他们觉得不屑一顾吧。(这是我为什么向大家请教的原因)
很高兴,大家都热情地回答了,而且跟我也有同感。
我也分析过,
1、可以肯定它是扫描后经过去斑(部分去斑,有些书你甚至可以看到图书馆的“黑印”)的黑白两色图像,而不是文本格式。
2、通过计算一页需占的字节,我发现以单纯位图格式以原样大小储
存成的文件比原文件略大,应该是以无损方式压缩的文件,具体
是TIFF还是重复字节压缩法,我还没具体研究。
希望大家能比我早一步找到答案。
 
Pay attention to the background of the picture(图像)!
I found something is strange about the background
of the picture(图像).
 
我原来编程力求完美,看了超星的这个阅读器,发现这样的shit的程序
也敢腆着脸拿出来卖!(遂降低对自己的要求;))
它的格式我看就是一般的二值文件.扫描仪也花不了什么时间.
 
哪位兄弟能把它转为二值图像,然后找个OCR的SDK再进一步翻为文本,不要
太爽(不过插图是个问题)
 
不太可能,没看见背景上专门加上了干扰条纹?
 
背景只是后来加上的,并不存在于原文件中。
 
后退
顶部