HOME > 馬鹿 > 日本語テキスト読み上げ(ガイジン風)

日本語テキスト読み上げ(ガイジン風)

まずは、サンプルをどうぞ(mp3)。カビパン男と私、東京都特許許可局、金太負けるな。

日本語読み上げのフリーなツールが何かないものかと、考えた。英文用のなら、Linux 環境でも簡単に手に入るのだが……

そこで、アメリカ人が読めるような形でアルファベット表記してやれば、英文用の読み上げソフトが使えそうだと、まあ安易に考えたわけだ。

まず、漢字かな交じりの文を kakasi で平仮名にして、sed のスクリプトでアルファベット化(kakasi でローマ字出力しただけでは駄目駄目なのだ)。それを flite というアメリカ英語読み上げソフトで読ませてみた。費用0円。

$ echo "カビパン男と私" | kakasi -JH -KH | sed -f nihongo.sed |  flite - kabipan.wav

のようにやった(文字コードの問題は各自の環境で対処してくれぇ)。この sed スクリプトの作成が結構面倒だった。たとえば「カビパン男と私」は「ka be pa unn o toh ko toh wa ta shi」に変換されるのだ。

(2009-10-30(Fri)改訂)

s/\([あかがさざただなはばぱまやゃらわ]\)ー/\1あ/g
s/\([いきぎしじちぢぬひびぴみりゐ]\)ー/\1い/g
s/\([うくぐすずつぬふぶぷむゆゅる]\)ー/\1う/g
s/\([えけげせぜてでねへべぺめれゑ]\)ー/\1え/g
s/\([おこそとのほぼぽもよろをょ]\)ー/\1お/g
s/きゃ/cah /g
s/きゅ/kyoo /g
s/きょ/kjo /g
s/ぎゃ/gaeh /g
s/ぎゅ/ghiu /g
s/ぎょ/kyo /g
s/しゃ/sha /g
s/しゅ/shoo /g
s/しょ/sho /g
s/じゃ/dzae /g
s/じゅ/joo /g
s/じょ/jo /g
s/ぢゃ/dzae /g
s/ぢゅ/dzoo /g
s/ぢょ/dzoe /g
s/ちゃ/cha /g
s/ちゅ/choo /g
s/ちょ/cho /g
s/ひゃ/hih ja /g
s/ひゅ/hue /g
s/ひょ/heo /g
s/みゃ/meaa /g
s/みゅ/miu /g
s/みょ/mih yo /g
s/あ/ah /g
s/い/ee /g
s/う/oo /g
s/え/eh /g
s/お/o /g
s/か/ka /g
s/き/ki /g
s/く/koo /g
s/け/keh /g
s/こ/ko /g
s/が/ga /g
s/ぎ/ghi /g
s/ぐ/goo /g
s/げ/geh /g
s/ご/go /g
s/さ/sa /g
s/し/shi /g
s/す/soo /g
s/せ/seh /g
s/そ/so /g
s/ざ/za /g
s/じ/zi /g
s/ず/zoo /g
s/ぜ/zeh /g
s/ぞ/zo /g
s/た/ta /g
s/ち/chee /g
s/つ/tsoo /g
s/て/teh /g
s/と/toh /g
s/だ/da /g
s/ぢ/dzi /g
s/づ/dzoo /g
s/で/deh /g
s/ど/doh /g
s/な/na /g
s/に/ni /g
s/ぬ/noo /g
s/ね/neh /g
s/の/no /g
s/は/ha /g
s/ひ/he /g
s/ふ/foo /g
s/へ/heh /g
s/ほ/ho /g
s/ば/ba /g
s/びょ/byo /g
s/び/be /g
s/ぶ/boo /g
s/べ/beh /g
s/ぼ/bo /g
s/ぱ/pa /g
s/ぴょ/hyo /g
s/ぴ/pe /g
s/ぷ/poo /g
s/ぺ/peh /g
s/ぽ/po /g
s/ま/ma /g
s/み/mi /g
s/む/moo /g
s/め/meh /g
s/も/mo /g
s/や/ya /g
s/ゆ/yoo /g
s/よ/yo /g
s/ら/ra /g
s/り/ri /g
s/る/roo /g
s/れ/re /g
s/ろ/ro /g
s/わ/wa /g
s/ゐ/wi /g
s/ゑ/weh /g
s/を/wo /g
s/ん/unn /g
while read text;do echo $text  | kakasi -JH -KH | sed -f ~/bin/nihongo.sed |  flite - tmp.wav; beep-media-player tmp.wav;done

などとやっても遊べる。

Thank you.

——目次——
HOME
├雑文
├写真
├壁紙
├馬鹿
├読書
├語学
│├英語
│└日本語
├電算
├地理
│└白地図
└ブログ