粤语 G2P :Cantonese Jyutping

音系

https://jyutping.org/docs/cantonese/

声调

普通话得四个声调,粤语有六个 。我们先回忆下普通话四个声调:

picture.image

总结出来普通话四个声调慨调值如下表:

第1 声第2 声第3 声第4 声
55(高平调)35(高升调)214(曲折调)51(高降调)

而粤语慨6 个声调如下图:

picture.image

6 个调值如下表:

第1 声55(高平调)第2 声35(高升调)第3 声33(中平调)
诗si1史si2试si3
第4 声21(低降调)第5 声13(低升调)第6 声22(中低平调)
时si4市si5事si6

ToJyutping

Phonemes

  
initial = { 'b': 'p', 'p': 'pʰ', 'm': 'm', 'f': 'f', 'd': 't', 't': 'tʰ', 'n': 'n', 'l': 'l', 'g': 'k', 'k': 'kʰ',  
   'ng': 'ŋ', 'gw': 'kʷ', 'kw': 'kʷʰ', 'w': 'w', 'h': 'h', 'z': 't͡s', 'c': 't͡sʰ', 's': 's', 'j': 'j' }  
nucleus = { 'aa': 'aː', 'a': 'ɐ', 'e': 'ɛː', 'i': 'iː', 'o': 'ɔː', 'u': 'uː', 'oe': 'œː', 'eo': 'ɵ', 'yu': 'yː' }  
unit = { 'ei': 'ei̯', 'ing': 'eŋ', 'ik': 'ek̚', 'ou': 'ou̯', 'ung': 'oŋ', 'uk': 'ok̚', 'eoi': 'ɵy̑', 'm': 'm̩', 'ng': 'ŋ̍' }  
terminal = { 'i': 'i̯', 'u': 'u̯', 'm': 'm', 'n': 'n', 'ng': 'ŋ', 'p': 'p̚', 't': 't̚', 'k': 'k̚' }  
  
tone = { '1': '˥', '2': '˧˥', '3': '˧', '4': '˨˩', '5': '˩˧', '6': '˨' }  

使用

  
>>> import ToJyutping  
>>> ToJyutping.get_jyutping_list('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
[('咁', 'gam3'), ('啱', 'ngaam1'), ('老', 'lou5'), ('世', 'sai3'), ('要', 'jiu1'), ('求', 'kau4'), ('佢', 'keoi5'), ('等', 'dang2'), ('陣', 'zan6'), ('要', 'jiu3'), ('開', 'hoi1'), ('會', 'wui2'), (',', None), ('剩', 'zing6'), ('低', 'dai1'), ('嘅', 'ge2'), ('嘢', 'je5'), ('我', 'ngo5'), ('會', 'wui5'), ('搞', 'gaau2'), ('掂', 'dim6'), ('㗎', 'ga3'), ('喇', 'laa3'), ('。', None)]  
>>> ToJyutping.get_jyutping('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
'咁(gam3)啱(ngaam1)老(lou5)世(sai3)要(jiu1)求(kau4)佢(keoi5)等(dang2)陣(zan6)要(jiu3)開(hoi1)會(wui2),剩(zing6)低(dai1)嘅(ge2)嘢(je5)我(ngo5)會(wui5)搞(gaau2)掂(dim6)㗎(ga3)喇(laa3)。'  
>>> ToJyutping.get_jyutping_text('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
'gam3 ngaam1 lou5 sai3 jiu1 kau4 keoi5 dang2 zan6 jiu3 hoi1 wui2, zing6 dai1 ge2 je5 ngo5 wui5 gaau2 dim6 ga3 laa3.'  
>>> ToJyutping.get_ipa_list('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
[('咁', 'kɐm˧'), ('啱', 'ŋaːm˥'), ('老', 'lou̯˩˧'), ('世', 'sɐi̯˧'), ('要', 'jiːu̯˥'), ('求', 'kʰɐu̯˨˩'), ('佢', 'kʰɵy̑˩˧'), ('等', 'tɐŋ˧˥'), ('陣', 't͡sɐn˨'), ('要', 'jiːu̯˧'), ('開', 'hɔːi̯˥'), ('會', 'wuːi̯˧˥'), (',', None), ('剩', 't͡seŋ˨'), ('低', 'tɐi̯˥'), ('嘅', 'kɛː˧˥'), ('嘢', 'jɛː˩˧'), ('我', 'ŋɔː˩˧'), ('會', 'wuːi̯˩˧'), ('搞', 'kaːu̯˧˥'), ('掂', 'tiːm˨'), ('㗎', 'kɐ˧'), ('喇', 'laː˧'), ('。', None)]  
>>> ToJyutping.get_ipa('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
'咁[kɐm˧][ŋaːm˥][lou̯˩˧][sɐi̯˧][jiːu̯˥][kʰɐu̯˨˩][kʰɵy̑˩˧][tɐŋ˧˥][t͡sɐn˨][jiːu̯˧][hɔːi̯˥][wuːi̯˧˥],剩[t͡seŋ˨][tɐi̯˥][kɛː˧˥][jɛː˩˧][ŋɔː˩˧][wuːi̯˩˧][kaːu̯˧˥][tiːm˨][kɐ˧][laː˧]。'  
>>> ToJyutping.get_ipa_text('咁啱老世要求佢等陣要開會,剩低嘅嘢我會搞掂㗎喇。')  
'kɐm˧.ŋaːm˥.lou̯˩˧.sɐi̯˧.jiːu̯˥.kʰɐu̯˨˩.kʰɵy̑˩˧.tɐŋ˧˥.t͡sɐn˨.jiːu̯˧.hɔːi̯˥.wuːi̯˧˥ | t͡seŋ˨.tɐi̯˥.kɛː˧˥.jɛː˩˧.ŋɔː˩˧.wuːi̯˩˧.kaːu̯˧˥.tiːm˨.kɐ˧.laː˧'  

Jyut6ping3 - 粵拼詞庫

https://raw.githubusercontent.com/rime/rime-cantonese/5b6d334/jyut6ping3.dict.yaml

  
# Rime dictionary  
# encoding: utf-8  
#  
# Jyut6ping3 - 粵拼詞庫  
#  
# 字音數據來源  
# UNICODE HAN DATABASE (UNIHAN)  
# Version: Unicode 12.0.0  
# Date: 2019-02-15  
# http://www.unicode.org/reports/tr38/  
#  
# 字音校對參考資料  
# 1. LSHK 字表 https://github.com/laubonghaudoi/cantonese\_orthography/blob/master/LSHK%20Jyutping%20-%20Char%20-%20JP.csv  
# 2. 粵音小鏡  
# 3. 廣州話正音字典  
# 4. 常用字廣州話讀音表  
# 5. 粵語審音配詞字庫 https://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/  
# 6. 電腦用漢字粵語拼音表 https://github.com/lshk-org/jyutping-table  
# 7. 香港增補字符集 https://www.ogcio.gov.hk/tc/our\_work/business/tech\_promotion/ccli/hkscs/  
#  
# 詞條數據參考  
# LSHK Jyutping Word List https://corpus.eduhk.hk/JPwordlist/  
# Cantonese dictionary https://words.hk/  
# open Cantonese dictionary http://kaifangcidian.com/han/yue  
# open-source Cantonese-to-English dictionary (CC-Canto) http://www.cccanto.org/  
# Kingsley Bolton, Christopher Hutton. A Dictionary of Cantonese Slang.  
#  
# 碼表製作與校對人員  
# Ayaka Mikazuki <ayaka@mail.shn.hk>  
# chaaklau <chaakming@gmail.com>  
# LeiMaau <leimaau@qq.com>  
# laubonghaudoi <laubonghaudoi@icloud.com>  
# tanxpyox <tanxpyox@gmail.com>  
# William915 <William915@gmail.com>  
# szc126 (@szc126)  
# Bing Jeung <bing@ososo.io>  
# Henry Chan (@hfhchan)  
  
---  
name: jyut6ping3  
version: "2021.09.05"  
sort: by\_weight  
use\_preset\_vocabulary: true  
import\_tables:  
  - jyut6ping3.phrase  
  - jyut6ping3.lettered  
  - jyut6ping3.maps  
...  
  
# 單字音  
 a1  
 a3  
 aa1  
 aa1  
 aa1  
 aa1 0%  
 aa1  
 aa1  
 aa1  
 aa1  
 aa1  
 aa1  
 aa1 0%  
 aa1 0%  
 aa1  
 aa1  
𠮩 aa1  
 aa2 0%  
 aa2  
 aa2  
 aa2  
 aa2 3%  
 aa2  
 aa2 3%  
 aa3  
 aa3 0%  
 aa3  
 aa3  
 aa3 0%  
 aa3  
 aa3  
 aa3 3%  
 aa3  
 aa3  
妿 aa3 0%  
 aa3  
 aa3  
 aa3  
 aa3  
 aa3  
 aa3 0%  
 aa3  
 aa3  
 aa3  
𥮳 aa3  
𥺼 aa3  
𦩒 aa3  
𩤃 aa3  
 aa4  
 aa5  
 aai1 0%  
 aai1  
 aai1  
 aai1  
 aai1 3%  
 aai1  
 aai1 0%  
 aai1  
 aai1  
 aai2  
 aai2 0%  
 aai3  
...  
絕望的境地 zyut6 mong6 dik1 ging2 dei6  
絕無 zyut6 mou4  
絕無花假 zyut6 mou4 faa1 gaa2  
絕無僅有 zyut6 mou4 gan2 jau5  
絕無二樣 zyut6 mou4 ji6 joeng6  
絕門兒 zyut6 mun4 ji4  
絕藝 zyut6 ngai6  
絕詣 zyut6 ngai6  
絕配 zyut6 pui3  
絕殺 zyut6 saat3  
絕世 zyut6 sai3  
絕世佳人 zyut6 sai3 gaai1 jan4  
絕世好橋 zyut6 sai3 hou2 kiu2  
絕世好竅 zyut6 sai3 hou2 kiu2  
絕詩 zyut6 si1  
絕色 zyut6 sik1  
絕食 zyut6 sik6  
絕食抗議 zyut6 sik6 kong3 ji5  
絕域 zyut6 wik6  
絕活 zyut6 wut6  
絕子絕孫 zyut6 zi2 zyut6 syun1  
絕跡 zyut6 zik1  
黜陟 zyut6 zik1  
絕症 zyut6 zing3  
絕招 zyut6 ziu1  
絕章 zyut6 zoeng1  
絕種 zyut6 zung2  

参考资料

0
0
0
0
评论
未登录
暂无评论