单个手写汉字识别-电动液压弯管机数控弯管机张家港电动液压弯管
作者:lujianjun | 来源:欧科机械 | 发布时间:2019-06-14 14:25 | 浏览次数:

本文在Goog Le Net网络基础上搭建了一个适合手写汉字识别的卷积神经网络。研究建立了新的手写汉字训练集,新训练集综合了现有的训练集并剔除了其中的错误,同时加入印刷体训练集,增加书写风格的多样性。训练神经网络时采用随机梯度下降算法,并加入动量项加速网络参数的收敛,使用正则项防止过度拟合,最终训练出的神经网络在训练集上的正确率为99.56%,在验证集上的正确率达到96%,并具有很好的泛化能力鍪中刺搴鹤值氖侗鹫仿剩⑻教址治隽?卷积神经网络的识别机理。1训练集本项目的识别目标是全部一级汉字,共3755个。一级汉字约占全部汉字使用量的99%。训练集为一个n×64×64×1的图像数组和一个n×1的标签数组单个手写汉字识别-电动液压弯管机数控弯管机张家港电动液压弯管机数控弯管机,其中n=(300+300+138)份×3755个,为汉字个数。标签数组的取值范围为[0,3755]

本文由
公司网站
张家港弯管机网站采集
转载中国知网
网络资源整理!
www.wangaunjimuju.com。单个手写汉字识别-电动液压弯管机数控弯管机张家港电动液压弯管机数控弯管机具体来说,0表示非汉字,1~3755与汉字的国标码顺序对应。训练集的来源分为3部分。第一个来源是中科院自动化所发布的HWDB1.1数据集,如图1(a)所示。该数据集包含300份一级汉字。图像为8位,书写较为疏放偏草。该数据集字迹较暗,对其亮度进行了调整。将每个像素开方,由于像素取值为[0,1],开方之后取值范围不变,但数值却有所增加。这就完成了数据集的变量操作。该训练集中还夹杂有一些错误,将会对训练造成干扰,因此需要剔除。这些错误约占1.5%,大部分为标签错误,有少量的涂抹图片。此外,剔除了一些根本无法识别的图像。第二部分是HCL2000数据集,如图1(b)所示。该数据集由北京邮电大学模式识别实验室发布,包含1000份一级汉字,是目前规模最大的脱机手写汉字库。数据为二值化模式,书写较为工整。该数据集更加利于识别,为了突出不易识别的HWDB1.1训练集,增强模型识别能力,HCL2000只撷取了其中的300份。HCL2000数据集中的错误主要为生成训练集时汉字的切割错误造成的空白。第三部分为网络上收集的印刷体,来源网站为,如图1(c)所示。采集了138份字库。有单个手写汉字识别-电动液压弯管机数控弯管机张家港电动液压弯管机数控弯管机
本文由
公司网站
张家港弯管机网站采集
转载中国知网
网络资源整理!
www.wangaunjimuju.com