tnblog
首页
视频
资源
登录

OpenCV 图像基本操作(学习笔记)

4306人阅读 2024/1/7 14:24 总访问:3455585 评论:0 收藏:0 手机
分类: opencv

OpenCV 图像基本操作(学习笔记)


在一张图像中,每取出一个像素块会分成红绿蓝三种颜色通道,每一种颜色通道都是一组矩阵,并且取的是颜色范围值0-255。

数据读取图像

参数 描述
cv2.IMREAD_COLOR 彩色图像
cv2.IMREAD_GRAYSCALE 灰度图像
  1. import cv2 #opencv读取的格式是BGR
  2. import matplotlib.pyplot as plt # 待会展示图片
  3. import numpy as np
  4. # 直接展示出来,不需要单独弹出一个窗口
  5. %matplotlib inline
  6. # 加载图片
  7. img=cv2.imread('cat.jpg')
  1. img # 接收的是一个numpy array的值,dtype=uint8的取值范围在0-255之间,每一组小的矩阵都是一个像素点

  1. #图像的显示,也可以创建多个窗口
  2. cv2.imshow('image',img)
  3. # 等待时间,毫秒级,0表示任意键终止
  4. cv2.waitKey(0)
  5. cv2.destroyAllWindows()

注意:我这里爆了一个错The kernel appears to have died. It will restart automatically.


这是因为cv2.imshow依赖于GUI的正常运行,而Jupyter Notebook通常不支持这种与GUI相关的操作。
cv2.imshow可能无法正确处理窗口的关闭和资源释放,从而导致内核崩溃。
可以改用plt进行显示

  1. # 定义一个函数去展示我们的图像
  2. def cv_show(name,img):
  3. cv2.imshow(name,img)
  4. cv2.waitKey(0)
  5. cv2.destroyAllWindows()
  1. # 图像的高度为 414 像素,宽度为 500 像素,并且有 3 个通道
  2. img.shape

(414, 500, 3)

  1. # 读取灰度图
  2. img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)
  3. img

  1. img.shape

(414, 500)

  1. #图像的显示,也可以创建多个窗口
  2. cv2.imshow('image',img)
  3. # 等待时间,毫秒级,0表示任意键终止
  4. cv2.waitKey(10000)
  5. cv2.destroyAllWindows()

  1. #保存
  2. cv2.imwrite('mycat.png',img)

True

  1. # 是一个numpy.ndarray格式
  2. type(img)

numpy.ndarray

  1. # 像素点的个数
  2. img.size

207000

  1. # 像素类型
  2. img.dtype

dtype(‘uint8’)

数据读取-视频


视频仍然是每一帧的图片不断的播放形成的,所以我们每获取一帧的图片也是一个[h,w,c]。

  • cv2.VideoCapture可以捕获摄像头,用数字来控制不同的设备,例如0,1。
  • 如果是视频文件,直接指定好路径即可。
  1. vc = cv2.VideoCapture('test.mp4')
  1. # 检查是否打开正确
  2. if vc.isOpened():
  3. # open该视频是否能打开,frame是BGR hwc,vc.read()获取每一帧的BGR
  4. open, frame = vc.read()
  5. else:
  6. open = False
  1. # 循环读取每一帧的
  2. while open:
  3. ret, frame = vc.read()
  4. if frame is None:
  5. break
  6. if ret == True:
  7. # BGR转成灰度图
  8. gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
  9. # 显示图片
  10. cv2.imshow('result', gray)
  11. # 等待多长时间显示下一张
  12. if cv2.waitKey(100) & 0xFF == 27:
  13. break
  14. vc.release()
  15. cv2.destroyAllWindows()

截取部分图像数据


ROI就是取出图片中部分的截图

  1. img=cv2.imread('cat.jpg')
  2. cat=img[0:50,0:200]
  3. cv_show('cat',cat)

颜色通道提取

  1. b,g,r=cv2.split(img)
  2. r

  1. img=cv2.merge((b,g,r))
  2. img.shape

(414, 500, 3)

  1. # 只保留R
  2. cur_img = img.copy()
  3. cur_img[:,:,0] = 0
  4. cur_img[:,:,1] = 0
  5. cv_show('R',cur_img)

  1. # 只保留G
  2. cur_img = img.copy()
  3. cur_img[:,:,0] = 0
  4. cur_img[:,:,2] = 0
  5. cv_show('G',cur_img)

  1. # 只保留B
  2. cur_img = img.copy()
  3. cur_img[:,:,1] = 0
  4. cur_img[:,:,2] = 0
  5. cv_show('B',cur_img)

边界填充


就是在图的边界进行填充图像内容。

  1. # 在上下左右都填充的大小
  2. top_size,bottom_size,left_size,right_size = (50,50,50,50)
  3. # 通过copyMakeBorder进行不同类型填充
  4. # 复制末尾一点进行衍生
  5. replicate = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, borderType=cv2.BORDER_REPLICATE)
  6. # 反射最后大小区域那段
  7. reflect = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_REFLECT)
  8. # 也是反射就是不反射最开始的那一点和最后的那一点
  9. reflect101 = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_REFLECT_101)
  10. # 在一次从对面开头进行复制衍生
  11. wrap = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv2.BORDER_WRAP)
  12. # 填充常数,这里那0填充的所以是黑的
  13. constant = cv2.copyMakeBorder(img, top_size, bottom_size, left_size, right_size,cv2.BORDER_CONSTANT, value=0)
  1. import matplotlib.pyplot as plt
  2. plt.subplot(231), plt.imshow(img, 'gray'), plt.title('ORIGINAL')
  3. plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('REPLICATE')
  4. plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('REFLECT')
  5. plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
  6. plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('WRAP')
  7. plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('CONSTANT')
  8. plt.show()


BORDER_REPLICATE:复制法,也就是复制最边缘像素。
BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abcdefgh|hgfedcb
BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴,对称,gfedcb|abcdefgh|gfedcba
BORDER_WRAP:外包装法cdefgh|abcdefgh|abcdefg
BORDER_CONSTANT:常量法,常数值填充。

数值计算

  1. img_cat=cv2.imread('cat.jpg')
  2. img_dog=cv2.imread('dog.jpg')
  1. # 在原始位置都加个10
  2. img_cat2= img_cat +10
  3. img_cat[:5,:,0]

  1. # 打印前五行
  2. img_cat2[:5,:,0]

  1. #相加超出256之后,相当于% 256
  2. (img_cat + img_cat2)[:5,:,0]

  1. # add函数相加,只要大于255了就以最大值为准
  2. cv2.add(img_cat,img_cat2)[:5,:,0]

图像融合


举例:我们将猫的图片和狗的图片部分添加在一起。

  1. # 将狗的shape设置为与猫一样的维度
  2. img_dog = cv2.resize(img_dog, (500, 414))
  3. img_dog.shape

(414, 500, 3)


添加权重img_cat为x1,img_dog为x2。
0.4是img_cat的权重,0.6是img_dog的权重在加上一个偏置项b=0。公式如下:

R=x_1\alpha+x_2\beta+b


这样通过addWeighted函数,可以进行一些图像融合的操作。

  1. res = cv2.addWeighted(img_cat, 0.4, img_dog, 0.6, 0)
  2. plt.imshow(res)

  1. # fx 表示x轴乘以多少倍,这里是4倍
  2. # fy 表示y轴乘以多少倍,这里是4倍
  3. res = cv2.resize(img, (0, 0), fx=4, fy=4)
  4. plt.imshow(res)

  1. res = cv2.resize(img, (0, 0), fx=1, fy=3)
  2. plt.imshow(res)


欢迎加群讨论技术,1群:677373950(满了,可以加,但通过不了),2群:656732739

评价

OpenCV 简介与安装

OpenCV 简介与安装[TOC] OpenCV 简介OpenCV是一个基于Apache2.0许可(开源)发行的跨平台计算机视觉和机器学习软件库。安...

OpenCV 图像处理(学习笔记)

OpenCV 图像处理(学习笔记)[TOC] 灰度图import cv2 #opencv读取的格式是BGR import numpy as np import matplotlib.pypl...

OpenCV 图像梯度计算(学习笔记)

OpenCV 图像梯度计算(学习笔记)[TOC] Sobel算子简介Sobel算子是一个图像边缘检测的算法。其基本原理是通过计算像素点梯度...

OpenCV Canny边缘检测(学习笔记)

OpenCV Canny边缘检测(学习笔记)[TOC] Canny边缘检测Canny边缘检测主要是按照如下步骤来进行的边缘检测:1.使用高斯滤波器...

OpenCV 图像金字塔、轮廓与模板匹配(学习笔记)

OpenCV 图像金字塔、轮廓与模板匹配(学习笔记)[TOC] 图像金字塔初始化代码。import cv2 #opencv读取的格式是BGR import n...

OpenCV 直方图与傅里叶变换(学习笔记)

OpenCV 直方图与傅里叶变换(学习笔记)[TOC] 直方图直方图是一种统计图表,用于展示数据的分布情况。这里将展示图片中直方...
这一世以无限游戏为使命!
排名
2
文章
633
粉丝
44
评论
93
docker中Sware集群与service
尘叶心繁 : 想学呀!我教你呀
一个bug让程序员走上法庭 索赔金额达400亿日元
叼着奶瓶逛酒吧 : 所以说做程序员也要懂点法律知识
.net core 塑形资源
剑轩 : 收藏收藏
映射AutoMapper
剑轩 : 好是好,这个对效率影响大不大哇,效率高不高
ASP.NET Core 服务注册生命周期
剑轩 : http://www.tnblog.net/aojiancc2/article/details/167
ICP备案 :渝ICP备18016597号-1
网站信息:2018-2025TNBLOG.NET
技术交流:群号656732739
联系我们:contact@tnblog.net
公网安备:50010702506256
欢迎加群交流技术