K230可以很轻松的实现颜色识别,识别颜色需要调用的函数为find_blobs,官方文档中说明:https://developer.canaan-creative.com/k230_canmv/main/zh/api/openmv/image.html#find-blobs
该函数的返回值如下
需要注意的是返回的不是一个色块的信息,而是多个色块的信息,返回值有点类似C语言中的二维数组
一.如何获取颜色参数
寻找色块函数最核心的参数就是要寻找的颜色是什么,也就是thresholds这个参数。我其实对如何使用一系列参数对一个颜色进行描述是不太懂的,例如我们平时说的RGB、YUV等,它里面具体参数代表什么含义我不是很清楚的。以下是我的简单理解,虽然不是很专业,但是可以帮助我们快速上手。正如上面所描述的,我们使用LAB这种方式描述一个颜色,他需要有6个参数,分别是(l_lo,l_hi,a_lo,a_hi,b_lo,b_hi)
我们可以让摄像头对需要测量的颜色拍照,然后我们就可以在IDE上看到对应的参数。我先在PPT中画一个色块,然后让摄像头对这个色块拍摄,即可在右下角得到对应的参数
我这边拍摄了一个红色的色块,得到的参数为(31,56,44,76,34,64)
二.颜色识别
我们现在已经得到一个颜色的参数了,就可以调用颜色识别函数尝试找一下,代码如下
import time, os, sys
from media.sensor import *
from media.media import *
from media.display import *
red = (31,56,44,76,34,64)
def camera_test():
print("camera_test")
#用默认配置构造一个Sensor对象
sensor = Sensor()
#复位摄像头
sensor.reset()
#设置摄像头水平翻转
sensor.set_hmirror(False)
#设置摄像头垂直翻转
sensor.set_vflip(False)
#设置指定通道的输出图像尺寸, 320x240
sensor.set_framesize(width=320, height=240)
#设置指定sensor设备和通道的输出图像格式
sensor.set_pixformat(Sensor.RGB565)
#通过IDE缓冲区显示图像
Display.init(Display.VIRT, sensor.width(), sensor.height())
#初始化media manager
MediaManager.init()
#摄像头开始工作
sensor.run()
try:
while True:
os.exitpoint()
#摄像头拍一张照片
img = sensor.snapshot()
###################图像识别代码#######################
#找色块
blobs = img.find_blobs([red])
#如果找到
if blobs:
print('find')
###################图像识别代码#######################
Display.show_image(img)
except KeyboardInterrupt as e:
print("user stop: ", e)
except BaseException as e:
print(f"Exception {e}")
#摄像头停止工作
sensor.stop()
# deinit display
Display.deinit()
os.exitpoint(os.EXITPOINT_ENABLE_SLEEP)
time.sleep_ms(100)
#media manager去初始化
MediaManager.deinit()
if __name__ == "__main__":
os.exitpoint(os.EXITPOINT_ENABLE)
camera_test()
当找到红色色块后,就会打印一句find,结果如下 ,
可以看到我这边并没有使用其他可选的参数,只填写了必选的,因为我现在这边的场景很简单,当图像复杂时,需要把他们用上,作为筛选过滤条件
接下来我们使用一下返回值,把找到的色块的中心坐标、外框给他画出来,代码如下
import time, os, sys
from media.sensor import *
from media.media import *
from media.display import *
red = (31,56,44,76,34,64)
def camera_test():
print("camera_test")
#用默认配置构造一个Sensor对象
sensor = Sensor()
#复位摄像头
sensor.reset()
#设置摄像头水平翻转
sensor.set_hmirror(False)
#设置摄像头垂直翻转
sensor.set_vflip(False)
#设置指定通道的输出图像尺寸, 320x240
sensor.set_framesize(width=320, height=240)
#设置指定sensor设备和通道的输出图像格式
sensor.set_pixformat(Sensor.RGB565)
#通过IDE缓冲区显示图像
Display.init(Display.VIRT, sensor.width(), sensor.height())
#初始化media manager
MediaManager.init()
#摄像头开始工作
sensor.run()
try:
while True:
os.exitpoint()
#摄像头拍一张照片
img = sensor.snapshot()
###################图像识别代码#######################
#找色块
blobs = img.find_blobs([red])
#如果找到
if blobs:
#遍历找到的每个色块
for blob in blobs:
#把色块的中心坐标用十字标出来
img.draw_cross(blob.cx(), blob.cy(), thickness = 2)
#用矩形框把色块框出来
img.draw_rectangle(blob.x(), blob.y(), blob.w(), blob.h(), thickness = 2)
###################图像识别代码#######################
Display.show_image(img)
except KeyboardInterrupt as e:
print("user stop: ", e)
except BaseException as e:
print(f"Exception {e}")
#摄像头停止工作
sensor.stop()
# deinit display
Display.deinit()
os.exitpoint(os.EXITPOINT_ENABLE_SLEEP)
time.sleep_ms(100)
#media manager去初始化
MediaManager.deinit()
if __name__ == "__main__":
os.exitpoint(os.EXITPOINT_ENABLE)
camera_test()