python 使用cv2实现以图搜图，并输出符合相似度的图片

2023-11-22 20:51:03

核心算法：
一、分别自定义三种计算图片相似度算法

1）计算图片相似度算法ORB算法

优点：

ORB 特征具有以下优点：
1、特征提取速度快；
2、在大多数情况下，去重效果能够与 SIFT/SURF 持平；
3、提取的特征直接是二元编码形式，无需使用哈希学习方法就可以直接利用汉明距离快速计算相似度。

参考【python 图像相似度】OpenCV图像相似度ORB算法--相似图像去重

https://blog.csdn.net/u013421629/article/details/87364489

2）局部敏感哈希phash算法

参考：文档的相似度（3）--局部敏感哈希算法分析的很透彻

https://blog.csdn.net/qq_29883591/article/details/63686371

3）传统的直方图计算相似度算法

参考：图像处理之相似图片识别（直方图应用篇）
https://blog.csdn.net/jia20003/article/details/7771651

2、定义融合相似度阈值为0.70，若三种算法计算出来的相似度最大值大于等于0.70，则取最大值为融合算法之后的相似度。
否则，则取三种算法计算出来的相似度的最小值，作为融合算法的之后的相似度。
3、定义最终相似度较高判断阈值为0.95，若融合之后的相似度值达到0.95，则认为图片非常相似。
4、图片相似的图片复制到一个文件夹下。

以下为具体实现

函数文件 image_similarity_function.py

# -*- encoding=utf-8 -*-# 导入包
import cv2
from functools import reduce
from PIL import Image# 计算两个图片相似度函数ORB算法
def ORB_img_similarity(img1_path,img2_path):""":param img1_path: 图片1路径:param img2_path: 图片2路径:return: 图片相似度"""try:# 读取图片img1 = cv2.imread(img1_path, cv2.IMREAD_GRAYSCALE)img2 = cv2.imread(img2_path, cv2.IMREAD_GRAYSCALE)# 初始化ORB检测器orb = cv2.ORB_create()kp1, des1 = orb.detectAndCompute(img1, None)kp2, des2 = orb.detectAndCompute(img2, None)# 提取并计算特征点bf = cv2.BFMatcher(cv2.NORM_HAMMING)# knn筛选结果matches = bf.knnMatch(des1, trainDescriptors=des2, k=2)# 查看最大匹配点数目good = [m for (m, n) in matches if m.distance < 0.75 * n.distance]similary = len(good) / len(matches)return similaryexcept:return '0'# 计算图片的局部哈希值--pHash
def phash(img):""":param img: 图片:return: 返回图片的局部hash值"""img = img.resize((8, 8), Image.ANTIALIAS).convert('L')avg = reduce(lambda x, y: x + y, img.getdata()) / 64.hash_value=reduce(lambda x, y: x | (y[1] << y[0]), enumerate(map(lambda i: 0 if i < avg else 1, img.getdata())), 0)return hash_value#计算两个图片相似度函数局部敏感哈希算法
def phash_img_similarity(img1_path,img2_path):""":param img1_path: 图片1路径:param img2_path: 图片2路径:return: 图片相似度"""# 读取图片img1 = Image.open(img1_path)img2 = Image.open(img2_path)# 计算汉明距离distance = bin(phash(img1) ^ phash(img2)).count('1')similary = 1 - distance / max(len(bin(phash(img1))), len(bin(phash(img1))))return similary# 直方图计算图片相似度算法
def make_regalur_image(img, size=(256, 256)):"""我们有必要把所有的图片都统一到特别的规格，在这里我选择是的256x256的分辨率。"""return img.resize(size).convert('RGB')def hist_similar(lh, rh):assert len(lh) == len(rh)return sum(1 - (0 if l == r else float(abs(l - r))/max(l, r)) for l, r in zip(lh, rh))/len(lh)def calc_similar(li, ri):return sum(hist_similar(l.histogram(), r.histogram()) for l, r in zip(split_image(li), split_image(ri))) / 16.0def calc_similar_by_path(lf, rf):li, ri = make_regalur_image(Image.open(lf)), make_regalur_image(Image.open(rf))return calc_similar(li, ri)def split_image(img, part_size = (64, 64)):w, h = img.sizepw, ph = part_sizeassert w % pw == h % ph == 0return [img.crop((i, j, i+pw, j+ph)).copy() for i in range(0, w, pw) \for j in range(0, h, ph)]
————————————————
版权声明：本文为CSDN博主「开心果汁」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/u013421629/article/details/87697794

实现文件：new_similarity_compare.py

# -*- encoding=utf-8 -*-from similarity.image_similarity_function import *
import os
import shutil# 融合相似度阈值
threshold1 = 0.70
# 最终相似度较高判断阈值
threshold2 = 0.95# 融合函数计算图片相似度
def calc_image_similarity(img1_path,img2_path):""":param img1_path: filepath+filename:param img2_path: filepath+filename:return: 图片最终相似度"""similary_ORB=float(ORB_img_similarity(img1_path,img2_path))similary_phash=float(phash_img_similarity(img1_path,img2_path))similary_hist=float(calc_similar_by_path(img1_path, img2_path))# 如果三种算法的相似度最大的那个大于0.7，则相似度取最大，否则，取最小。max_three_similarity=max(similary_ORB,similary_phash,similary_hist)min_three_similarity=min(similary_ORB,similary_phash,similary_hist)if max_three_similarity>threshold1:result=max_three_similarityelse:result=min_three_similarityreturn round(result,3)if __name__ == '__main__':# 搜索文件夹filepath = 'D:/test/'# 相似图片存放路径newfilepath = 'F:/same_pic_new/'for parent, dirnames, filenames in os.walk(filepath):for srcfilename in filenames:img1_path = filepath + srcfilenamefor parent, dirnames, filenames in os.walk(filepath):for filename in filenames:# 全量的比对效率差，所以形成图片时在名称上做了标记，下划线后面相同的进行比对name1 = srcfilename.split('_')[1]# 第二张照片对应的标记name2 = filename.split('_')[1]img2_path = filepath + filename# 取两张照片是否是同名if name1 == name2 :# 相同非同一张图片的则比较if img1_path != img2_path:kk = calc_image_similarity(img1_path, img2_path)try:if kk >= threshold2:# 将两张照片同时拷贝到指定目录（存在冗余操作，待优化）shutil.copy(img1_path, newfilepath)shutil.copy(img2_path, newfilepath)except Exception as e:# print(e)pass

以上功能可以实现对指定文件夹下所有具有相同标记的照片进行相似度的比对，并将比对的结果输出到指定路径。

初涉图像比对还有很多不足指出，希望大神指教！

感谢以下博主的文章：

【python 以图搜图】三种图片相似度计算融合算法

原文链接：https://blog.csdn.net/u013421629/article/details/87697794
参考：图像处理之相似图片识别（直方图应用篇）
https://blog.csdn.net/jia20003/article/details/7771651

参考：文档的相似度（3）--局部敏感哈希算法分析的很透彻

https://blog.csdn.net/qq_29883591/article/details/63686371

参考【python 图像相似度】OpenCV图像相似度ORB算法--相似图像去重

https://blog.csdn.net/u013421629/article/details/87364489

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 02 进程断链、线程断链
下一篇 > IC技术圈期刊 2021年第7期

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

python 使用cv2实现以图搜图，并输出符合相似度的图片

相关文章