HOME > 馬鹿 > 日本語テキスト読み上げ(ガイジン風)
日本語テキスト読み上げ(ガイジン風)
まずは、サンプルをどうぞ(mp3)。カビパン男と私、東京都特許許可局、金太負けるな。
日本語読み上げのフリーなツールが何かないものかと、考えた。英文用のなら、Linux 環境でも簡単に手に入るのだが……
そこで、アメリカ人が読めるような形でアルファベット表記してやれば、英文用の読み上げソフトが使えそうだと、まあ安易に考えたわけだ。
まず、漢字かな交じりの文を kakasi で平仮名にして、sed のスクリプトでアルファベット化(kakasi でローマ字出力しただけでは駄目駄目なのだ)。それを flite というアメリカ英語読み上げソフトで読ませてみた。費用0円。
$ echo "カビパン男と私" | kakasi -JH -KH | sed -f nihongo.sed | flite - kabipan.wav
のようにやった(文字コードの問題は各自の環境で対処してくれぇ)。この sed スクリプトの作成が結構面倒だった。たとえば「カビパン男と私」は「ka be pa unn o toh ko toh wa ta shi」に変換されるのだ。
(2009-10-30(Fri)改訂)
s/\([あかがさざただなはばぱまやゃらわ]\)ー/\1あ/g s/\([いきぎしじちぢぬひびぴみりゐ]\)ー/\1い/g s/\([うくぐすずつぬふぶぷむゆゅる]\)ー/\1う/g s/\([えけげせぜてでねへべぺめれゑ]\)ー/\1え/g s/\([おこそとのほぼぽもよろをょ]\)ー/\1お/g s/きゃ/cah /g s/きゅ/kyoo /g s/きょ/kjo /g s/ぎゃ/gaeh /g s/ぎゅ/ghiu /g s/ぎょ/kyo /g s/しゃ/sha /g s/しゅ/shoo /g s/しょ/sho /g s/じゃ/dzae /g s/じゅ/joo /g s/じょ/jo /g s/ぢゃ/dzae /g s/ぢゅ/dzoo /g s/ぢょ/dzoe /g s/ちゃ/cha /g s/ちゅ/choo /g s/ちょ/cho /g s/ひゃ/hih ja /g s/ひゅ/hue /g s/ひょ/heo /g s/みゃ/meaa /g s/みゅ/miu /g s/みょ/mih yo /g s/あ/ah /g s/い/ee /g s/う/oo /g s/え/eh /g s/お/o /g s/か/ka /g s/き/ki /g s/く/koo /g s/け/keh /g s/こ/ko /g s/が/ga /g s/ぎ/ghi /g s/ぐ/goo /g s/げ/geh /g s/ご/go /g s/さ/sa /g s/し/shi /g s/す/soo /g s/せ/seh /g s/そ/so /g s/ざ/za /g s/じ/zi /g s/ず/zoo /g s/ぜ/zeh /g s/ぞ/zo /g s/た/ta /g s/ち/chee /g s/つ/tsoo /g s/て/teh /g s/と/toh /g s/だ/da /g s/ぢ/dzi /g s/づ/dzoo /g s/で/deh /g s/ど/doh /g s/な/na /g s/に/ni /g s/ぬ/noo /g s/ね/neh /g s/の/no /g s/は/ha /g s/ひ/he /g s/ふ/foo /g s/へ/heh /g s/ほ/ho /g s/ば/ba /g s/びょ/byo /g s/び/be /g s/ぶ/boo /g s/べ/beh /g s/ぼ/bo /g s/ぱ/pa /g s/ぴょ/hyo /g s/ぴ/pe /g s/ぷ/poo /g s/ぺ/peh /g s/ぽ/po /g s/ま/ma /g s/み/mi /g s/む/moo /g s/め/meh /g s/も/mo /g s/や/ya /g s/ゆ/yoo /g s/よ/yo /g s/ら/ra /g s/り/ri /g s/る/roo /g s/れ/re /g s/ろ/ro /g s/わ/wa /g s/ゐ/wi /g s/ゑ/weh /g s/を/wo /g s/ん/unn /g
while read text;do echo $text | kakasi -JH -KH | sed -f ~/bin/nihongo.sed | flite - tmp.wav; beep-media-player tmp.wav;done
などとやっても遊べる。
