如何从某图中把文字读出来???(300分)

  • 主题发起人 主题发起人 honestman
  • 开始时间 开始时间
H

honestman

Unregistered / Unconfirmed
GUEST, unregistred user!
例如:http://reg.yimg.com/i/7lQvxOdZFek0_1pEHgf6SzAoeKjNqO5lHbxEyCNRYOvih4JS_fWv.jpg
中如何用Delphi把“cap”读出来呢???
据小雪说,这是OCR文字识别技术。
大家有没有具体一点的资料啊?
最好当然是有源代码啦!
 
对啊!这个是文字识别技术,你知道 尚书OCR文字识别 嘛?就是作这个的哦!
不是一个人能做的来的。
 
但是,那幅图看上去好象比较简单啊!
复杂的图片要用复杂的技术,简单的图片用简单的技术就应该可以了吧?
因为我并不需要100%准确,有80%我就可以接受了。

[h1]而且我想识别的只是键盘上可以直接输入的字母、数字和符号。[/h1]

其他的比较复杂的文字,例如:中文,就不用了。
 
相当难,
gz
 
按照我的想法,需要进行OCR识别,首先确定一行的位置,然后确定一个字的位置。
接着读出这个字的点阵,和标准的点阵进行比较,根据相似程度来取最大的作为识别出来的汉字。

估计难点有:
1、如何识别出整行,这是第一步,可能是从上到下整行点阵识别,然后根绝是否没有点阵判断行。
2、识别出整行后,如何识别出单个字,估计方法应该是一样的。
3、读取这个需要识别区域的点阵,转换成标准点阵(24*24等)。
4、使用这个标准点阵和你的标准模板进行比较。得出各识别近似度。
(当然了,如果近似度<50或者其他的,就应该舍弃了)
5、取识别近似程度最大的作为识别出来的汉字。

我的一点思路,不知道对你是否有帮助。
 
识别汉字就太复杂啦!
我想,因为我这里的图片的E文和数字都是一种字体,那么我穷举这么多种情况,再和当前
图片的比较,这样是否会比较简单呢?
而且那些字的颜色都是一样的,这样应该比较好办吧?
 
连这也要源码,为什么不要Windows XP的源码!
 
你要是能识别出来,汉王就黄了.
 
自个看看情况吧
http://www.google.com 搜索OCR,你找找会看到清华电子系的一个主页,
那里有一些简单的介绍

这些东东是问不来的
汉王啊清华文通啊 那些人都靠这吃饭呢
就算是有公司想作这类的产品,没个3、5年的积累是做不出的
你想想那金山词霸那样的东东好多人会作,咋就没见有人作出
个汉王OCR的玩艺儿
太专业了
 
不过找你描述的那样的情况
你看看清华网页上的那个介绍,也许就可以想出个简单处理算法了
 
或许可以调用别的现成的OCR软件?有些会有接口的吧
 
我也在找,可是都是商业机密,难
 
1.二值化
2 去噪声
3 平滑
4 细化
5 统计
6 作字模
 
太复杂了。
 
我们刚刚开发好OCR SDK,识别率99.5%以上,欢迎光临我的主页
http://wenjinshan.wx-e.com
http://wenjinshan.yeah.net
识别率与清华、汉王相当!即将推广DLL调用接口,价格不到清华、汉王的1/10
 
后退
顶部