iis服务器助手广告广告
返回顶部
首页 > 资讯 > 移动开发 >android实现汉字转拼音功能 带多音字识别
  • 500
分享到

android实现汉字转拼音功能 带多音字识别

转拼音Android 2022-06-06 11:06:41 500人浏览 八月长安
摘要

Android 汉字转拼音带多音字识别功能,供大家参考,具体内容如下 问题来源 在做地名按首字母排序的时候出现了这样一个bug。长沙会被翻译拼音成zhangsha,重庆会被

Android 汉字转拼音带多音字识别功能,供大家参考,具体内容如下

问题来源

在做地名按首字母排序的时候出现了这样一个bug。长沙会被翻译拼音成zhangsha,重庆会被翻译拼音成zhong qing。于是排序出了问题。

汉字转拼音库和多音字识别库
1.多音字对应的词汇库
2.文字的二进制大小对应的拼音库

关键代码

1.我在这里首先将要转化的文字转化成对应的”gb2312”编码。汉字转化成二进制编码一般占两个字节,如果一个字节返回字符,如果是两个字节算一下偏移量。代码如下


 
  private int getChsAscii(String chs) {
   int asc = 0;
   try {
    byte[] bytes = chs.getBytes("gb2312");
    if (bytes == null || bytes.length > 2 || bytes.length <= 0) {
     throw new RuntimeException("illegal resource string");
    }
    if (bytes.length == 1) {
     asc = bytes[0];
    }
    if (bytes.length == 2) {
     int hightByte = 256 + bytes[0];
     int lowByte = 256 + bytes[1];
     asc = (256 * hightByte + lowByte) - 256 * 256;
    }
   } catch (Exception e) {
    System.out.println("ERROR:ChineseSpelling.class-getChsAscii(String chs)" + e);
   }
   return asc;
  }

2.将单个汉字获取的拼音再和多音字库的HashMap进行比较,代码如下:


public String getSellingWithPolyphone(String chs){
   if(polyphoneMap != null && polyphoneMap.isEmpty()){
    polyphoneMap = initDictionary();
   }
   String key, value, resultPy = null;
   buffer = new StringBuilder();
   for (int i = 0; i < chs.length(); i++) {
    key = chs.substring(i, i + 1);
    if (key.getBytes().length >= 2) {
     value = (String) convert(key);
     if (value == null) {
      value = "unknown";
     }
    } else {
     value = key;
    }
    resultPy = value;
    String left = null;
    if(i>=1 && i+1 <= chs.length()){
     left = chs.substring(i-1,i+1);
     if(polyphoneMap.containsKey(value) && polyphoneMap.get(value).contains(left)){
      resultPy = value;
     }
    }
//    if(chs.contains("重庆")){
     String right = null; //向右多取一个字,例如 [长]沙
     if(i<=chs.length()-2){
      right = chs.substring(i,i+2);
      if(polyphoneMap.containsKey(right)){
       resultPy = polyphoneMap.get(right);
      }
     }
//    }
    String middle = null; //左右各多取一个字,例如 龙[爪]槐
    if(i>=1 && i+2<=chs.length()){
     middle = chs.substring(i-1,i+2);
     if(polyphoneMap.containsKey(value) && polyphoneMap.get(value).contains(middle)){
      resultPy = value;
     }
    }
    String left3 = null; //向左多取2个字,如 芈月[传],列车长
    if(i>=2 && i+1<=chs.length()){
     left3 = chs.substring(i-2,i+1);
     if(polyphoneMap.containsKey(value) && polyphoneMap.get(value).contains(left3)){
      resultPy = value;
     }
    }
    String right3 = null; //向右多取2个字,如 [长]孙无忌
    if(i<=chs.length()-3){
     right3 = chs.substring(i,i+3);
     if(polyphoneMap.containsKey(value) && polyphoneMap.get(value).contains(right3)){
      resultPy = value;
     }
    }
    buffer.append(resultPy);
   }
   return buffer.toString();
  }

3.将asserts文件内容解析生成HashMap列表.


 public HashMap<String, String> initDictionary(){
  String fileName = "py4j.dic";
  InputStreamReader inputReader = null;
  BufferedReader bufferedReader = null;
  HashMap<String, String> polyphoneMap = new HashMap<String, String>();
  try{
   inputReader = new InputStreamReader(MyApplication.mContext.getResources().getAssets().open(fileName),"UTF-8");
   bufferedReader = new BufferedReader(inputReader);
   String line = null;
   while((line = bufferedReader.readLine()) != null){
    String[] arr = line.split(PINYIN_SEPARATOR);
    if(isNotEmpty(arr[1])){
     String[] dyzs = arr[1].split(Word_SEPARATOR);
     for(String dyz: dyzs){
      if(isNotEmpty(dyz)){
       polyphoneMap.put(dyz.trim(),arr[0]);
      }
     }
    }
   }
  }catch(Exception e){
   e.printStackTrace();
  }finally{
   if(inputReader != null){
    try {
     inputReader.close();
    } catch (IOException e) {
     // TODO Auto-generated catch block
     e.printStackTrace();
    }
   }
   if(bufferedReader != null){
    try {
     bufferedReader.close();
    } catch (IOException e) {
     // TODO Auto-generated catch block
     e.printStackTrace();
    }
   }
  }
  return polyphoneMap;
 }

GitHub源码下载:https://github.com/loveburce/ChinesePolyphone.git

您可能感兴趣的文章:Android实现中文按拼音排序方法Android实现ListView的A-Z字母排序和过滤搜索功能 实现汉字转成拼音android仿微信通讯录搜索示例(匹配拼音,字母,索引位置)Android开发实现的IntentUtil跳转多功能工具类【包含视频、音频、图片、摄像头等操作功能】android实用工具类分享(获取内存/检查网络/屏幕高度/手机分辨率)android开发教程之实现toast工具类19个Android常用工具类汇总android 一些工具类汇总Android7.0 工具类:DiffUtil详解非常实用的Android图片工具类Android开发之拼音转换工具类PinyinUtils示例


--结束END--

本文标题: android实现汉字转拼音功能 带多音字识别

本文链接: https://www.lsjlt.com/news/28417.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • android实现汉字转拼音功能 带多音字识别
    android 汉字转拼音带多音字识别功能,供大家参考,具体内容如下 问题来源 在做地名按首字母排序的时候出现了这样一个bug。长沙会被翻译拼音成zhangsha,重庆会被...
    99+
    2022-06-06
    转拼音 Android
  • C#实现汉字转拼音(多音字)功能详解
    缘由:根据姓名创建账号,存在生僻字以及多音字 做法:自己根据网上信息自己写了类,词库可能不完整(有待补充) 其他不多说了,先上代码如下: using System; using Sy...
    99+
    2023-02-15
    C#实现汉字转拼音 C#汉字转拼音 C# 汉字 拼音
  • Java实现汉字转拼音,多音字处理,简单明了
    背景: 之前一直是前端直接调用公司公共城市组件获取城市列表,现在由于公共组件不再支持,需要由后端接口提供城市查询,并且按照城市首字母分组展示。 后端实现: 最开始选择pinyin4j来实现,但发现对多音字的处理不太友好,比如需要转重庆的拼音...
    99+
    2023-09-25
    java 开发语言 mysql
  • JavaScript如何实现汉字转拼音
    这篇文章将为大家详细讲解有关JavaScript如何实现汉字转拼音,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一.汉字转拼音的现状首先应该说,汉字转拼音是个强需求,比如...
    99+
    2022-10-19
  • js怎么实现汉字转拼音
    在JavaScript中,可以使用第三方库 `pinyin` 来实现汉字转拼音的功能。可以使用 `npm` 来安装该库,然后在项目中...
    99+
    2023-08-19
    js
  • jQuery如何实现QQ空间汉字转拼音功能
    这篇文章主要介绍了jQuery如何实现QQ空间汉字转拼音功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。具体如下:html:<!DO...
    99+
    2022-10-19
  • sqlserver实现获取汉字助记码功能汉字拼音字母
    --01--首先创建一个函数,其功能就是功能是得到汉字拼音首字母 go if exists (select * from sysobjects where name='fun_g...
    99+
    2022-10-18
  • 详解如何利用C#实现汉字转拼音功能
    目录实践过程效果代码实践过程 效果 代码 public partial class Form1 : Form { public Form1() { ...
    99+
    2022-12-23
    C#汉字转拼音 C# 汉字 拼音
  • 怎么在Android中利用ListView实一个汉字转成拼音功能
    本篇文章为大家展示了怎么在Android中利用ListView实一个汉字转成拼音功能,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。项目结构我按照项目中类的顺序来一一介绍其功能SortModel 一个...
    99+
    2023-05-31
    android listview roi
  • C#实现汉字转汉语拼音的示例代码
    目录一、使用PinYinConverterCore获取汉语拼音二、编写工具扩展类实现获取汉字的拼音三、编写测试用例一、使用PinYinConverterCore获取汉语拼音 最新在做...
    99+
    2022-11-13
  • C# 汉字与拼音互转的实现示例
    这个功能,大家也都可以去百度以下,千篇一律都自己写的(抄的)封装好的公共类,此处还是得膜拜下原创的大佬,可以花时间去搞这个,我看着都头皮发麻。 对于一个有代码洁癖的码农来说,我并不喜...
    99+
    2022-11-13
  • php汉字转拼音函数的实现方法
    本文将为大家详细介绍“php汉字转拼音函数的实现方法”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“php汉字转拼音函数的实现方法”能够给你意想不到的收获,请大家跟着小编的思路慢慢深入,具体内容如下,一起去收获...
    99+
    2023-06-06
  • 如何用js实现汉字转拼音的效果
    要实现汉字转拼音的效果,可以使用第三方库 pinyin.js。以下是一个示例:1. 在页面中引入 pinyin.js:```html...
    99+
    2023-08-18
    JS
  • 教你使用Python pypinyin库实现汉字转拼音
    一、前言 这里我先为大家提供一个中文网站,大家可以下去更深入的学习。 https://pypi.org/project/pypinyin/ pypinyin库,主要有几下几个特性: 智能匹配最正确的拼音;...
    99+
    2022-06-02
    pypinyin库汉字转拼音 Python pypinyin库
  • 怎么使用Python pypinyin库实现汉字转拼音
    这篇文章主要介绍了怎么使用Python pypinyin库实现汉字转拼音,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、前言pypinyin库,主要有几下几个特性:智能匹配...
    99+
    2023-06-15
  • 基于Python实现简单的汉字拼音转换工具
    目录1.准备2.基本使用3.高级使用将汉字转为拼音,可以用于批量汉字注音、文字排序、拼音检索文字等常见场景。 现在互联网上有许多拼音转换工具,基于Python的开源模块也不少,今天给...
    99+
    2022-11-11
  • 基于Python实现语音识别和语音转文字
    目录前言直接使用获取权限1.环境准备2.获取权限代码实现1.获取access_token2.获取转换后音频3.配置接口参数4.完整demo5.执行前言 嗨嗨,大家好呀 ~ 今天给你们...
    99+
    2022-11-11
  • Android studio如何实现语音转文字功能
    这篇文章主要介绍了Android studio如何实现语音转文字功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、在科大讯飞的官网上注册并下载SDK首先去讯飞开...
    99+
    2023-06-29
  • C#实现文字转语音功能
    本文实例为大家分享了C#实现文字转语音的具体代码,供大家参考,具体内容如下 客户提出要求,将文字内容转为语音,因为内网环境,没办法采用联网,在线这种方式,灵机一动,能否写一个简单的例...
    99+
    2022-11-13
  • android语音识别功能怎么实现
    要实现Android平台的语音识别功能,可以使用Android提供的语音识别API,具体步骤如下: 在AndroidManife...
    99+
    2023-10-22
    android
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作