当前位置: 首页 > 学界要闻 >

基于Android平台的多语种文字识别翻译APP

来源:未知 作者:佚名 日期:2019-09-21 浏览:58

? 第 25 卷? 第 5 期 ? ? 2017 年 10 月 Journal of Xiamen University of Technology 厦门理工学院学报 Vol. 25? No. 5 Oct. 2017 基于 Android 平台的多语种文字识别翻译 APP ( 厦门理工学院光电与通信工程学院, 福建 厦门 361024 ) [ 摘? 要] 集成中? 英? 日? 韩? 法? 西班牙 6 种世界主要语种, 通过 jTessBoxEditor OCR 开发引擎自 张 ? 璘 , 唐瑞寒 主生成训练文字库, 利用 Tesseract 识别引擎对文字进行识别, 并将已识别文字送入第三方翻译接口进行目 标语种翻译, 开发了一款基于 Android 平台的集成了多语种文字的拍照识别翻译软件 APP? 通过景区样本 实测结果验证, 该 APP 的文字识别率可达 93% , 实现有效翻译, 达到市场准入水平? [ 关键词] APP; 文字识别; 文字翻译; Android 系统 [ 中图分类号] TP391 43? [ 文献标志码] A? [ 文章编号] 1673 - 4432 ( 2017 ) 05 - 0061 - 06 游度假已经成为百姓生活的一项重要内容, 但同时问题也随之而来, 语言不通? 看不懂餐厅菜单或景 区介绍都为出行带来很大的困难? 目前在提高同步图文识别率方面已经有很多探索 [1 - 4] , 也有很多手 机翻译系统研究 [5] , 但是在同一系统中自制文字识别库并翻译多语种的软件系统还未见? 本系统采 用目前较为流行的 Android 平台, 依托 Tesseract 识别引擎, 基于 UI 界面开发一款集成多语种文字的 拍照识别翻译软件 APP, 可以提高现有系统的文字识别率, 为人们出国旅行提供方便? 随着中国经济高速稳定的发展和人民生活水平的不断提高, 人们利用节假日或空闲时间到国外旅 1? APP 架构 1 1? 系统流程 为显示区和功能区? 显示区作为窗口将获取的图片和识别结果等信息显示在主界面上, 方便用户使 用; 功能区的 4 个功能则需要用户根据需求通过按钮进行操作, 分别实现相机功能? 相册功能? 语种 选择和翻译功能? 同时为了提高文字识别的准确率, 需要对选取的文字图片进行自动的图像处理, 主 要包括灰度变换? 中值滤波? 图像二值化等, 同时基于 jTessBoxEditor 工具进行文字识别样本训练制 作相应语种的文字库, 最后通过有道翻译接口提交 JSON 格式的数据, 得到文字翻译的结果, 并将结 1 2? 模块功能 果显示在软件主界面上? 软件需要实现的最基本功能为能够对图片上的文字进行提取识别, 并且对识别结果进行翻译? 图像处理主要是为了保证图片上的文字更加清晰, 从而使识别结果能够更加准确? 调用手机摄像 系统包含有 3 个界面单元, 每个单元为单独的 Activity 活动, 主要功能在软件主界面单元中, 分 1 2 1? 图像处理功能 头获取图片, 或者从手机相册中获取图片, 软件判断获取到图片后, 自动对图片进行预处理, 尽量去 除多余的影响因子? 图片处理的结果要求前景与背景色差对比度高, 方便对图像进行灰度变换? 中值 1 2 2? 文字识别功能 滤波? 图像二值化等图像处理, 可以提高文字的识别精确度 [1] ? 对处理后的图片进行文字切割, 通过与文字库进行特征匹配, 得出与提取字符的特征相似或相同 [ 修回日期] 2017 - 10 - 18 [ 作者简介] 张璘 (1981 - ) , 女, 讲师, 硕士, 研究方向为计算机网络, E?mail:zhanglin603@ aliyun. com? ? ? [ 收稿日期] 2017 - 09 - 28? ? ? ? ? 62? 厦门理工学院学报 2017 年 的字符, 并将其显示输出? 对预处理后的图像进行逐行扫描, 分析判断图片中文字的起始坐标和结束 坐标, 切出每一行文字; 再进行纵列扫描, 通过黑白像素交替变化判断每个字符起始纵坐标和结束纵 坐标, 可以得到单个字符 [2] ? 置, 或者以笔画作为字符的特征进行对比 [3] , 通过得到特征群组与文字库中保存的字集进行对比, 寻找特征字集最接近或者形同的特征值组, 输出其所对应的字符,即为识别的结果? 1 2 3? 文字翻译功能 识别的结果通过 EditText 可编辑文本框显示app内文字翻译, 用户可以对结果进行订正修改? 然后对字符进行特征提取, 例如提取文字黑白点数比, 或者笔画的端点或者交叉点的数量和位 译, 发送 HTTPGET 请求, 并且返回一个对象, 获取翻译结果? 获取翻译结果显示在主界面 TextView 部件中? 系统结构及主页面如图 1 所示? 文字识别翻译软件 在可编辑文本框中得到识别结果, 点击翻译按钮, 将文本框中的文字通过有道翻译接口进行翻 欢迎界面 软件主界面 版本界面 显示区 功能区 选取图片 显示界面 语言选择 预处理后的 图片界面 翻译功能 显示识别 结果界面 相册功能 相机功能 (a) 软件整体结构框图 图1 软件整体结构框图及系统主页面 (b) 系统主页面 Fig。

1 Diagram of the software system 2? APP 各功能模块设计 2 1? 图像处理功能 对获取对象的图片进行预处理, 得到更清晰的文字图像,从而增强对文字的识别准度? 在获取对 利用 getMinMaxGrayValue ( ) 计算图像的最大灰度值和最小灰度值? 利用 getGrayImg ( ) 方法获 象图片后app内文字翻译, 首先进行预处理, 将其转换成灰度图像得到灰度图? 然后设置图像的位图, 定义灰度值最 大为 0, 最小值为 255 [4]97 ? 取图像灰度值, 定义位图的每一个像素点, 获取像素点的红? 绿? 蓝 3 种颜色



上一篇:英译中IdonampquottlikeMrChangHeis(anoldma)A老太婆B喜欢罗嗦的人C

下一篇:【谷歌翻译新功能:短信的内容可以直接翻译,无需切换APP】