数据集:爬取各大平台网页中的图片
任务是:给定一张图片,找到在该数据集中找到该图片。
难点:数据集经常更新、数据集大、数据集图像无规则。
本人人工智能跨考生,求佬们帮忙,给点建议,好研究下去。
什么方法能适用这种场景呢?
特征提取:对于数据集中的每张图片,提取出其特征向量,可以使用深度学习模型中的卷积层或者特征提取算法如SIFT、SURF等。
建立索引:将数据集中所有图片的特征向量建立索引,可以使用倒排索引等方法。
查询匹配:对于给定的查询图片,同样提取出其特征向量,并与数据集中的特征向量进行匹配,可以使用相似性度量算法如余弦相似度等。
返回结果:根据匹配得分,返回数据集中与查询图片最相似的图片作为结果。
需要注意的是,在数据集经常更新、数据集图像无规则的情况下,需要定期更新索引以确保查询的准确性。同时,数据集大小也会对索引的建立和查询速度产生影响,可以使用分布式索引、GPU加速等方法加速处理。
不知道你这个问题是否已经解决, 如果还没有解决的话:
参考链接:
https://blog.csdn.net/u012308586/article/details/92795677https://blog.csdn.net/wanghuiqi2008/article/details/16925729
https://www.jianshu.com/p/e956c8eab721
参考书籍:
《OpenCV 计算机视觉编程攻略》