怎样做海量k线的拟合分类?

预期目标
将几千只股票统一周期的k线图分别进行拟合,
测算相似度#难点一,
然后获得n种分类,每一类的k线拟合度较高,
并在n取最小和各类拟合度较高中取得平衡#难点二。
预期解决
方法一:
1.python爬取批量股票某周期开收高低价
2.利用以上数据进行计算
方法二:
1.爬取k线图
2.用图像识别获得结果

问题
1.请问哪一种方法更简单高效呢?
2.方法一需要的数学或者统计学知识有哪些?
3.app里的分析工具可以爬取吗?

像tushare和baostock都有免费的行情数据接口可以调用,直接获取历史行情,不需要去写爬虫爬了。app里面的一般都有加密啥的,应该是不太容易让你爬取的。