大漁船

NHKクローズアップ現代初音ミク特集。人間は音の変化するところに注目して言葉を聞き分けている。このため「ak」「ot」「ro」など音が変化するところの音を独自に500個ほど抽出している。たとえばひらがなだと3文字で書ける言葉を6個の音に分割して表現している。これが合成音声なのに人の歌らしく聞こえる理由という。一方演歌では音程どうりに歌っていなくて音程を上げるところではもっと上まで上げてから目的の音程まで下げるとか、一定の音程のはずのところを細かく上げ下げする歌い方をする。この表現を人間の歌い方をまねて自動的に再現するソフトを利用すると初音ミクに演歌を歌わせることができる(実際それらしく聞こえるから驚き)。名古屋工大がもとになった音声データベースを用いたソフトはある人の声を再現するのが目的。「あ」とか「い」の発音の仕方をもとにその人が他のすべての音をどう発音するかを予測する。これによって声を失った人の音声合成が進んでいる。これの行きつく先は「息子の声」を完全合成した振り込め詐欺だが「写真には合成がありうることを皆知っているので『ひょっとしたら合成か?』という身構えができるが、音声ではまだそこまで認知されていない。まず社会に合成音声がここまで来ていることを認知してもらう必要がある」とのこと。