图像识别

[转]:手写数字识别系统之图像分割

背景本文,主要介绍我之前在学校时候,研究的一些跟手写数字识别相关的技术心得,主要涉及:数字图像处理、特征提取、神经网络等等相关的一些技术。。虽然很多用到的还是网上现有的比较成熟的算法,但是在这些基础上,我还是有做了不少算法上的改进的。。并且为了写这个项目,我当时还特地写了一整套神经网络库,从图像处理开始到最后的识别过程,没有使用任何第三方库,都是从0还是写起也没有用到ope

[转]:手写数字识别系统之细化图像

简介所谓的细化就是经过一层层的剥离,从原来的图中去掉一些点,但仍要保持原来的形状,直到得到图像的骨架。骨架,可以理解为图象的中轴,例如一个长方形的骨架是它的长方向上的中轴线;正方形的骨架是它的中心点;圆的骨架是它的圆心,直线的骨架是它自身,孤立点的骨架也是自身。细化删除条件内部点不能删除孤立点不能删除直线端点不能删除如果P是边界点,去掉P后,如果连通分量不增加,则P可以删除

[转]:手写数字识别系统之数字提取

引言所谓数字分割就是指将经过二值化后的图像中的单个数字区域进行提取的过程。数字分割在数字识别中是一个必不可少的关键步骤,只有能够将数字进行准确的提取,才能将其一一识别。数字分割的方法数字分割的方法相当多,主要有以下几种:基于直方图的分割此类方法就是对每行和每列黑色像素数进行统计,生成行直方图和列直方图,并采用某种阈值选取法分别对图像进行行列分割。这种方法简单快速,对于按矩阵

[转]:手写数字识别系统之倾斜矫正

简介倾斜校正主要有两种,一种是整体倾斜校正,另一种是局部倾斜校正。由于本文主要研究具有不规则分布的多数字识别,因此只需要关注经过提取后的数字校正问题,也就是图像的局部校正。矫正算法目前的校正算法有很多,比如说:对于整体倾斜校正可以采用统计图像左右两边的平均像素高度,通过计算整体倾斜度来进行校正。这种方法对于像素较多的图像的处理效果明显,而且实现简单快速,但是对于那些已经经过

人类感知和深度学习有何不同?

人类与机器相比为什么会产生错觉?人类感知和深度学习系统在识别图像与声音上有什么区别?它们是如何感知的,原理是什么?本文将对上述几个方面的内容给出详细解释。我们如何看待这个世界?为了理解这一点,首先让我们探讨一下我们是如何错误地认识世界的。“矩阵中的瑕疵”(glitches in the matrix)将会向我们揭示我们感知的本质。Victoria Syke创造了上图所示的视