首页 > 编程语言 > JAVA实现汉字转拼音功能代码实例
2020
09-29

JAVA实现汉字转拼音功能代码实例

JAVA中汉字转拼音的方法并不复杂,可以使用pinyin4j包来实现。

一、下载pinyin4j的架包,并导入项目中,如下:

如果是maven项目,maven依赖如下:

 <dependency>
   <groupId>com.belerweb</groupId>
   <artifactId>pinyin4j</artifactId>
   <version>2.5.0</version>
 </dependency>

二、汉字转拼音方法,附上代码例子,如下:

public class PinyinUtil {

  public static void main(String[] args) throws Exception {
    System.out.println(getPinyin("haha你笑起来真好看", " "));
    System.out.println(getPinyinInitials("你笑起来真好看"));
  }

  /**
   * 将汉字转换为全拼
   *
   * @param text 文本
   * @param separator 分隔符
   * @return {@link String}
   */
  public static String getPinyin(String text, String separator) {
    char[] chars = text.toCharArray();
    HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
    // 设置大小写
    format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    // 设置声调表示方法
    format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    // 设置字母u表示方法
    format.setVCharType(HanyuPinyinVCharType.WITH_V);
    String[] s;
    String rs = StringUtils.EMPTY;
    try {
      StringBuilder sb = new StringBuilder();
      for (int i = 0; i < chars.length; i++) {
        // 判断是否为汉字字符
        if (String.valueOf(chars[i]).matches("[\\u4E00-\\u9FA5]+")) {
          s = PinyinHelper.toHanyuPinyinStringArray(chars[i], format);
          if (s != null) {
            sb.append(s[0]).append(separator);
            continue;
          }
        }
        sb.append(String.valueOf(chars[i]));
        if ((i + 1 >= chars.length) || String.valueOf(chars[i + 1]).matches("[\\u4E00-\\u9FA5]+")) {
          sb.append(separator);
        }
      }
      rs = sb.substring(0, sb.length() - 1);
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      e.printStackTrace();
    }
    return rs;
  }

  /**
   * 获取汉字首字母
   *
   * @param text 文本
   * @return {@link String}
   */
  public static String getPinyinInitials(String text) {
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < text.length(); i++) {
      char ch = text.charAt(i);
      String[] s = PinyinHelper.toHanyuPinyinStringArray(ch);
      if (s != null) {
        sb.append(s[0].charAt(0));
      } else {
        sb.append(ch);
      }
    }
    return sb.toString();
  }
}

其中,拼音格式参数说明:

HanyuPinyinCaseType 设置拼音的大小写 LOWERCASE 小写
UPPERCASE 大写
HanyuPinyinToneType 设置拼音的音调 WITH_TONE_NUMBER 用数字表示音调。如:wo3
WITHOUT_TONE 不表示音调。如:wo
WITH_TONE_MARK 用符号表示音调。如:wŏ
HanyuPinyinVCharType 设置拼音的表示方法 WITH_U_AND_COLON 用字母u和冒号表示。如:lu:
WITH_V 用字母v表示。如:lv
WITH_U_UNICODE 用Unicode编码表示。如:lü

PS:这里有一个注意的点,就是音调和表示方法是配合使用的,所以用符号表示音调的时候,只能使用Unicode编码的方法显示,如果设置其他两种表示方式会报错。

格式效果:

     表示方法
WITH_U_AND_COLON WITH_V WITH_U_UNICODE
声调 WITH_TONE_NUMBER lu3 lv lü3
WITHOUT_TONE lu lv3
WITH_TONE_MARK Exception Exception

三、使用效果如下:

文本:haha你笑起来真好看

全拼:haha ni xiao qi lai zhen hao kan

首字母:nxqlzhk

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持自学编程网。

编程技巧