求算法思路：Opencv 文字提取，未涉及识别

帮主颁布的一个任务，菜鸟的我翻了很多资料，没有发现这一个点上的。请各位大神楼下说说思路…

抛砖引玉，仅供参考。
1，准备工作：对需要提取的文字特征作统计，建立特征向量。
（1）建议可以采取的特征包括：黑白像素比例，霍夫曼线变化的统计量（因为文字中的笔画多数横平竖直）长宽比，如果文字大小固定，还可面积。
（2）根据以上统计特征建立支持向量机（SVM）
2，图像处理
（1）先对图像与处理，调整对比度亮度，腐蚀膨胀，二值化。让文字和背景区分开来。同时尽量让文字和文字分开。倾斜校正
（2）用opencv提取轮廓，然后计算包围轮廓的矩形。
（3）逐个计算矩形内的特征向量
（4）利用支持向量机进行分类处理
（5）需要考虑文字间有粘连的状况，对于特别长的矩形，需要适当切断后重复分类。