汉字拼音小认识

寻找拼音数据库

感谢Github,在这找到相对完整的汉字拼音汇总数据库:
https://github.com/mozillazg/pinyin-data/
使用其中的pinyin.txt v0.4.1 总共41437个汉字,如有多个拼音,就取其中的第一个拼音

转入Excel,简单处理:

  • 粘贴入数据后,替换掉各种声调的字母,如:áàǎā -> a
  • 利用if or right left mid len 等工具取出声母(如首字母是s的,碰到含sh就取sh,要不就只取s),韵母(碰到首字母是a o e 的,就直接包含这几个字母,如:an,ang,ao,ai等...)
  • 利用数据透视表汇总各种声母,韵母,结果数量如下图:
  • 声母与韵母.png

初浅的结论:

  • 声母总共26个(含ch,sh,zh),而26字母中,刚好有3个字母是不在声母中的:v,u,i,所以双拼里基本都是把这3个字母设置为ch,sh,zh
  • 韵母总共36个(含没有韵母的几个单声母m,n r/er,m),

    • a开头5个
    • e开头5个
    • i开头10个,其中ia开头4个,
    • u/ü开头11个,其中ua开头5个
    • 其他4个,
添加新评论