对大量同类的图像样本迚行学习找出这些图像所有的产生了颜色突变本让机器对这些样本迚行学习并最织生成一个对象识别模型用来正确寻找一幅图像中你所需要寻找的元素
神经网络 & 深度学习 基础知识
1
图像的特征
计算机图像是由一定数量的点阵像素构成的。如上所示,我们看到的 是一辆车,但实际上计算机理解的是一个由各像素点的灰度值组成的 矩阵,它并不能直接理解“这是一辆车”。
感知器的本质就是对各个输入量的加权和进行分析,做出 Yes or No 的决策的模型。
12
上述你考虑的三个因素可以作为感知器的三个输入量 x1, x2, x3,并设积极的结果为 1,消极的结果为 0。三者都有对 应的权重量w1, w2, w3。现计算它们的加权和 w1x1 + w2x2 + w3x3,同时加上一个偏差值 b。若其为正(大于 0), 则最终的回答是 Yes,否则(小于或等于 0)回答 No。
这涉及到一个现象:颜色突变。上图所圈出的区域中,都是颜色变化较大的区 域。而我们就会自然地认为,这是物体的边缘,而由封闭边缘构成的区域就是 物体。
不仅是房子这个整体,房子里的门、窗户等元素我们都能发现,而原因自然也 是颜色突变。
思考:人能看见绝对透明(100% 透明)的玻璃吗?
6
我们定义一个形状的时候,本质 上就是在定义其产生颜色突变的 像素点的大致相对位置。比如圆, 在一个直角坐标系的图象上上, 存在所有满足 (x-a)2+(y-b)2=r2 条件的坐标点的某个小邻域内有 较大的颜色突变,那么这幅图像 上就有一个圆的形状。左上方是 一幅色盲测试图,不色盲的朋友 都能看到左下角有一个蓝色的圆, 而且是一个空心圆。
但是这里有一个问题,我们目前的决策是非此即彼的,非 常机械化的决策。比如一个数字 9,如果下方的那一撇写 得不弯,变成了一条直线,那是不是这个数字就不是 9 了 呢?我们是不是应该有一个过渡的过程呢?