求算法思路:Opencv 文字提取,未涉及识别

帮主颁布的一个任务,菜鸟的我翻了很多资料,没有发现这一个点上的。请各位大神楼下说说思路…

抛砖引玉,仅供参考。
1,准备工作:对需要提取的文字特征作统计,建立特征向量。
(1)建议可以采取的特征包括:黑白像素比例,霍夫曼线变化的统计量(因为文字中的笔画多数横平竖直)长宽比,如果文字大小固定,还可面积。
(2)根据以上统计特征建立支持向量机(SVM)
2,图像处理
(1)先对图像与处理,调整对比度亮度,腐蚀膨胀,二值化。让文字和背景区分开来。同时尽量让文字和文字分开。倾斜校正
(2)用opencv提取轮廓,然后计算包围轮廓的矩形。
(3)逐个计算矩形内的特征向量
(4)利用支持向量机进行分类处理
(5)需要考虑文字间有粘连的状况,对于特别长的矩形,需要适当切断后重复分类。