python识别手掌并计算手指个数算法解析-BFW博客

我们今天来做一个有趣的实验，如何用python实时识别手指的个数，并讲解一下识别过程中的算法，效果如下：

python识别手掌并计算手指个数算法解析

如何从混乱的背景中分割前景图像是一个难题。最明显的原因是由于人看图像和计算机看同一图像时存在的差距。人们可以很容易地弄清楚图像中的内容，但是对于计算机而言，图像只是3维矩阵。因此，计算机视觉问题仍然是一个挑战。看下面的图片。

python识别手掌并计算手指个数算法解析

上面这个图像，如果是人看了会在图像中找到不同的区域并标记其相应的标签，如：“天空”，“人”，“树”和“草”。那计算机如何才能识别呢，我们首先需要单独取出手部区域，以去除视频序列中所有不需要的部分。在分割手部区域之后，我们然后对视频序列中显示的手指进行计数，所以我们分两步走。

第一步：从视频序列中找到并分割手部区域。

第二步：从视频序列中分割的手区域计算手指的数量。

▊ 第一步、分割提取手部区域

手势识别的第一步显然是通过消除视频序列中所有其他不需要的部分来找到手部区域。起初这似乎令人恐惧。但是不用担心。使用Python和OpenCV会容易得多！

注意：视频序列只是相对于时间运行的帧集合或图像集合。

在深入探讨细节之前，让我们了解如何确定手部区域。

▶背景扣除

首先，我们需要一种有效的方法来将前景与背景分开。为此，我们使用移动平均值的概念。我们使我们的系统可以查看特定场景的30帧。在此期间，我们计算当前帧和先前帧的运行平均值。通过这样做，我们实质上告诉我们的系统-

好吧，机器人！您凝视的视频序列（这30帧的运行平均值）是背景。

在弄清背景之后，我们举起手来，使系统了解我们的手是进入背景的新条目，这意味着它成为前景对象。但是，我们将如何单独看待这一前景呢？答案是背景减法。

看下面的图片，它描述了背景减法的工作原理。

python识别手掌并计算手指个数算法解析

在使用移动平均值确定背景模型之后，我们使用当前框架以及背景，该框架还包含前景对象（在本例中为hand）。我们计算背景模型（随时间更新）和当前帧（有我们的手）之间的绝对差，以获得包含新添加的前景对象（这就是我们的手）的差异图像。这就是背景减法的全部含义。

▶运动检测和阈值

为了从该差异图像中检测出手部区域，我们需要对差异图像进行阈值处理，以使只有我们的手部区域可见，而所有其他不需要的区域都被涂成黑色。这就是运动检测的全部意义。

注意：阈值是基于特定阈值级别将像素强度分配为0和1，以便仅从图像中捕获我们感兴趣的对象。

▶轮廓提取

对差异图像进行阈值处理后，我们在结果图像中找到轮廓。假定面积最大的轮廓是我们的手。

注意：轮廓线是位于图像中的对象的轮廓或边界。

具体代码

# organize imports
import cv2
import imutils
import numpy as np

# global variables
bg = None

首先，我们导入所有必须使用的软件包并初始化背景模型。如果您的计算机上没有安装这些软件包。

#--------------------------------------------------
# To find the running average over the background
#--------------------------------------------------
def run_avg(image, aWeight):
    global bg
    # initialize the background
    if bg is None:
        bg = image.copy().astype("float")
        return


    # compute weighted average, accumulate it and update the background
    cv2.accumulateWeighted(image, bg, aWeight)

接下来，我们使用函数来计算背景模型和当前帧之间的移动平均值。此函数接受两个参数- 当前帧和aWeight，就像在图像上执行均线的阈值一样。如果背景模型为“ 无”（即，如果它是第一帧），则使用当前帧对其进行初始化。然后，使用cv2.accumulateWeighted（）函数计算背景模型和当前帧的移动平均值。使用下面给出的公式计算移动平均值。

dst(x,y)=(1−a).dst(x,y)+a.src(x,y)

s r c （x ，y） -源图像或输入图像（1或3通道，8位或32位浮点）

dst（x ，ÿ） -目标图像或输出图像（与源图像相同的通道，32位或64位浮点）

a-源图像（输入图像）的权重

#---------------------------------------------
# To segment the region of hand in the image
#---------------------------------------------
def segment(image, threshold=25):
    global bg
    # find the absolute difference between background and current frame
    diff = cv2.absdiff(bg.astype("uint8"), image)


    # threshold the diff image so that we get the foreground
    thresholded = cv2.threshold(diff, threshold, 255, cv2.THRESH_BINARY)[1]


    # get the contours in the thresholded image
    (_, cnts, _) = cv2.findContours(thresholded.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)


    # return None, if no contours detected
    if len(cnts) == 0:
        return
    else:
        # based on contour area, get the maximum contour which is the hand
        segmented = max(cnts, key=cv2.contourArea)
        return (thresholded, segmented)

我们的下一个功能用于从视频序列中分割手部区域。这个函数有两个参数- 当前帧和阈值用于阈值化的差分图像。

首先，我们使用cv2.absdiff（）函数找到背景模型与当前帧之间的绝对差异。

接下来，我们对差异图像进行阈值处理以仅显示手部区域。最后，我们对阈值图像进行轮廓提取，并获取面积最大的轮廓（这就是我们的手）。

我们将阈值图像以及分割后的图像作为元组返回。阈值背后的数学非常简单。如果x （n ）表示输入图像在特定像素坐标下的像素强度，然后阀值决定我们将图像分割/阈值化为二进制图像的程度。公式如下：

python识别手掌并计算手指个数算法解析

#-----------------
# MAIN FUNCTION
#-----------------
if __name__ == "__main__":
    # initialize weight for running average
    aWeight = 0.5


    # get the reference to the webcam
    camera = cv2.VideoCapture(0)


    # region of interest (ROI) coordinates
    top, right, bottom, left = 10, 350, 225, 590


    # initialize num of...

点击查看剩余70%

打赏博主×

python识别手掌并计算手指个数算法解析

网友评论0

css布局实现左侧固定右侧自适应的4种方式

用c#编写一个dhcp服务

ES6 (Es2015)新特性

程序员搞笑集锦

一步一步教你在浏览器用tensorflow训练手写数字并识别

用php抓取网页进行解析的扩展 simple_html_dom.php

Python对二进制文件进行加密和解密

c#如何判断winform程序是否有管理员权限

一小时手把手一步一步教你用php编写一个博客系统

支付宝app支付RSA2签名放在服务端php的编写方式

{{item.title}}

何为BFWSOA框架

BFWSOA框架特性

BFWSOA框架程序流程图

MVCVPSCW七层架构

BFWSOA框架创建一个小应用

BFWSOA框架路由模式与Apache、Nginx配置

BFWSOA框架表单验证与提交

BFWSOA框架数据库操作

BFWSOA 缓存设置

BFWSOA模型简介

有没有开源免费的影视电影电视剧vip破解资源爬虫代码？

WelsonJS 与 Electron构建windows应用的区别？

什么是jsvmp加密？

哪有免费的服装模特换脸工具可换脸但是不改变衣服背景细节？

python uvicorn搭建的fastapi应用如何提高并发性能？

如何使用gemini的api全自动编写api文档和接口代码并自动调试纠错？

中小型前后端项目如何用gemini一次性生成所有代码和sql？

微信中打开的h5网页如何获得当前gps位置数据？

如何跟踪摄像头中的手势位置来移动操控三维物体？

如何通过实时摄像头捕获手势来弹奏音乐？