一、一般识别方法
- 使用谷歌开源OCR引擎Tesseract
- 使用大公司的OCR开放平台(比如百度),使用他们的字符识别API
- 传统方法做字符的特征提取,输入分类器,得出OCR模型
- 暴力的字符模板匹配法
- 大杀器:基于深度学习下的CNN字符识别
二、字符模板匹配
-
适用于简单应用场景
定义出数字模板(0~9),然后用该模板滑动匹配电表上的字符,这种策略虽然简单但是相当有效。我们不需要左思右想去建模,训练模型,只需要识别前做好模板库就可以了。
-
针对复杂的场景,可以采用OCR一般方法
-
特征设计
字符特征,有字符的端点、交叉点、圈的个数、横线竖线条数等等
-
特征提取
-
进行分类
eg: SVM
-