L Luckm Unregistered / Unconfirmed GUEST, unregistred user! 2000-01-26 #1 有谁知道国图文件(就是用超星SSREAD看的那种扫描格式文件)的具体格式? 用SSREAD看真是费劲死了!
G g622 Unregistered / Unconfirmed GUEST, unregistred user! 2000-01-27 #4 不会是扫描的图像文件吧,那样效率太差。 再说我也没看见扫描的图像常见的斑点之类的东西呀。 要是有方法可以得到txt文件(不能是识别率?%的ocr) 就太好了。
L lha Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-01 #6 同 receyes, 请各路高手指点指点。 SSREAD真是垃圾中的垃圾
C cAkk Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-01 #9 >>要是能转换为图像就好了 能! 按print-screen就可以.
T thtfsyh Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-01 #10 cAkk: 不是吧?一本300多页的书,不累死人?
C cAkk Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-01 #11 开个玩笑嘛! 你要是真想做,自己写一个程序.模拟按翻页按钮,然后每翻一页 再模拟按print-screen,然后在读取剪贴版,把内容保存成顺序 编号的文件..... 方法笨了点,但实用.
F flier Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-01 #12 你说的是那个超星PDG格式吗?SSREADER自带了一套类型库可以处理 我以前曾经写过一个浏览器,具体情况你可以给我写信讨论
L Luckm Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-06 #13 我曾经多次以各种方式给该公司发过信, 但没有任何回音, 可能他们觉得不屑一顾吧。(这是我为什么向大家请教的原因) 很高兴,大家都热情地回答了,而且跟我也有同感。 我也分析过, 1、可以肯定它是扫描后经过去斑(部分去斑,有些书你甚至可以看到图书馆的“黑印”)的黑白两色图像,而不是文本格式。 2、通过计算一页需占的字节,我发现以单纯位图格式以原样大小储 存成的文件比原文件略大,应该是以无损方式压缩的文件,具体 是TIFF还是重复字节压缩法,我还没具体研究。 希望大家能比我早一步找到答案。
我曾经多次以各种方式给该公司发过信, 但没有任何回音, 可能他们觉得不屑一顾吧。(这是我为什么向大家请教的原因) 很高兴,大家都热情地回答了,而且跟我也有同感。 我也分析过, 1、可以肯定它是扫描后经过去斑(部分去斑,有些书你甚至可以看到图书馆的“黑印”)的黑白两色图像,而不是文本格式。 2、通过计算一页需占的字节,我发现以单纯位图格式以原样大小储 存成的文件比原文件略大,应该是以无损方式压缩的文件,具体 是TIFF还是重复字节压缩法,我还没具体研究。 希望大家能比我早一步找到答案。
L lha Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-06 #14 Pay attention to the background of the picture(图像)! I found something is strange about the background of the picture(图像).
Pay attention to the background of the picture(图像)! I found something is strange about the background of the picture(图像).
C Crane Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-06 #15 我原来编程力求完美,看了超星的这个阅读器,发现这样的shit的程序 也敢腆着脸拿出来卖!(遂降低对自己的要求) 它的格式我看就是一般的二值文件.扫描仪也花不了什么时间.
C cheka Unregistered / Unconfirmed GUEST, unregistred user! 2000-02-07 #17 哪位兄弟能把它转为二值图像,然后找个OCR的SDK再进一步翻为文本,不要 太爽(不过插图是个问题)