在android上实现数字识别

2023-08-28 14:29:42

背景

1、前面文章提到，我们在使用辅助功能的时候遇到了一些数据无法直接抓取，本篇文章主要解决该问题

2、在无法抓取的数据中可以分为两大类

2.1、需要识别内容，比如说 数字、文字等

2.2、需要识别图标，比如说 性别标识、转向标识等

我们的目标

本次主要是为了解决上图的24的识别

开始前的思考

1、从常见程度来突破

我们平时关注的时候，很多的内容直接告诉你可以识别文字、数字等，并且准确率高达多少多少。这也就反应一个问题，这个场景应用多，并且已经相对成熟，应该是有比较成熟的、简单的方案。

2、从难易程度考虑

这个可以参考我们人类识别的过程，我们看到一个东西，把这个东西和我们脑子中的内容做比对，找出相似度最高的，然后输出相似度最高的选项的相关内容。按照人类的万物皆类人的特性，这个识别过程也应该是这样。所以应该是 识别数字的难度>识别图标的难度

思考结果

我们从最常见的方案入手，这样的我们可以有更多的参考资料；当然最常见的方案也是最难的方案，在解决这个问题的过程中也会帮我们构建更多的内容，这样在解决较简单但是资料相对较少的资料都时候，我们前面学习的知识也可以使用上了。

开搞

在android识别数字这种简单的东西，大家都在用 tess-two，我们这也从这里讲起。

tess-two的集成与简单使用

1、添加依赖

  implementation 'com.rmtheis:tess-two:9.1.0'

2、下载训练好的数据集

大家可以按需选择，我这边主要是识别数字，所以就选择数字的。大家可以从这个选择合适的数据集

而我选择了其中的enm.traineddata

3、配置数据集

将下载好的数据集放置在 assets 文件夹下

4、代码操作

1. 将assets下的文件移动到sd下

    //将识别文件拷贝到SD卡中。目前我这里是不管文件在不在都进行拷贝。public  void ocrfilecopy(Context context) {//在SD卡中创建存放识别库的目录。该目录名必须是tessdata 这个文件名是在API使用中规定了的。//定义tessdata目录在SD 卡的路径。String Chisim_dir = Environment.getExternalStorageDirectory().getAbsolutePath() + "/tessdata";//定义识别文件的绝对路径和文件名。chi_sim.traineddata 识别文件名。String orc_filename = Chisim_dir + "/enm.traineddata";Log.i("path", Chisim_dir);//检查是否存在此目录。如果存在则不创建，否则则创建目录。File dirfile = new File(Chisim_dir);if (dirfile.exists() == false) {//目录不存在。则创建。dirfile.mkdir();Log.i("提示信息", "目录已创建。");}//目录创建完成后将OCR识别文件CHI_SIM拷贝到该目录下。//判断识别文件Chi_sim.traineddata是否存在。File ocrfile = new File(orc_filename);//不管识别文件是否存在先删除在创建。ocrfile.delete();//开始创建文件。//首先文件是存放在资源文件夹assets下的。所以要先获取资源；AssetManager assetManager;assetManager = context.getAssets();//开始读取识别文件并开始复制。输入。InputStream inputStream;//开始写入文件。输出。OutputStream outputStream;try {//将识别文件读入到输入流中。inputStream = assetManager.open("enm.traineddata");//创建目标文件。outputStream = new FileOutputStream(orc_filename);//开始复制，每次复制1024k的字节。byte[] buff = new byte[1024];//开始循环写入。int ll_count;while ((ll_count = inputStream.read(buff)) != -1) {outputStream.write(buff, 0, ll_count);}//释放资源outputStream.flush();outputStream.close();inputStream.close();} catch (IOException e) {e.printStackTrace();}}

2. 初始化tess-two sdk

   //定义使用的字符集。String orctype = "enm";//实例化  ocr  APITessBaseAPI tessBaseAPI = new TessBaseAPI();//开始初始化 指定识别所用的资源位置。在SD卡中的位置。tessBaseAPI.init(Environment.getExternalStorageDirectory().getAbsolutePath() , orctype);tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "0123456789");tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "ABCDEFGHIJKLMNOPQRSTUVWYZabcdefghijklmnopqrstuvwxyz!@#$%^&*()_+=-[]}{;:'\"\\|~`,./<>?…】丨");tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);  //设置识别模式

3. 进行识别

   String number = "";//初始化后开始识别图片。设置需要识别的图片。tessBaseAPI.setImage(bitmap);//得到识别内容number = tessBaseAPI.getUTF8Text();Log.i("提示信息", "number=" + number);

5、tess-two的注意事项

1、需要尽量的保证保证数据集的范围精确，这样才能更好的识别。

所以初始化sdk的时候，设置黑白名单以及识别模式都非常的有必要

2、在完成上述操作之后发现确实可以识别数字了，但是识别率比较低。查找资料之后感觉和背景的复杂度有关系。于是就要想办法将内容和背景进行区分。

后续规划

1、下一部分会讲opencv的简单使用

2、下一部分会将图片相似度的简单使用

关注公众号： arigeweixin ，取得更多联系

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > UVA 11624 Fire! 【特殊BFS】
下一篇 > System.getProperty（ENM_HOME）中的值是从哪里获取的

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce