音声をテキストに変換(google speech api)

google の cloud speech api のサンプルを使用。

transcode.py の

language_code='en-US'

language_code='ja-JP'

に変える必要あり。

wav ファイルは、16k 1ch でないと駄目なようなので、(transcode.pyの設定を変えればよさそうだが)

ffmpeg -in infile.wav -ac 1 -ar 16000 outfile.wav

などで変換する。

TBS のニュースを xperia で録音して PC にダウンロードして変換:

Transcript: 大月1日に召集される特別国会で自民党は大島理森前衆院議長再任する方針を固めました
Transcript: 衆院議長が総選挙ごとに交代する寒冷になっていますが天皇陛下の退位を実現する法整備で調整に当たったことなどが消化された他太陽控え衆院議長は皇室会議のメンバーであることなどが考慮されたい年の見通しとなりました大島氏は国会運営に精通していて野党とのパイプがあることなども考慮されたもの

まあまあいい感じかもしれない。

鬼平犯科帳のオープニング:

1st try:

Transcript: いつも世にも悪は
Transcript: その頃67巻クワ型盗賊改方という特別警察を設けていた
Transcript: ダークな床濡れを容赦なく取り締まるために行った時の機動性を与えられたこのすけ盗賊改方のお父さんこそが長谷川ふとんで鬼の映像

2nd try:(flac でエンコードして storage にアップして変換)

Transcript: いつも世にも悪は絶え
Transcript: その頃67巻クワ型盗賊改方という特別警察を送っていいんだと悪魔族の群れを容赦なく取り締まるために僕の希望を与えられたこのすけ盗賊改方のお父さんこそが備わっている人呼んで鬼の平蔵である

3rd try:(1st try と同じ wav)

Transcript: いつも世にも悪は
Transcript: その頃67巻クワ型盗賊改方という特別警察を設けていた
Transcript: ダークな床濡れを容赦なく取り締まるためにドキドキ同性を与えられたこのすけ盗賊改方のお父さんこそが長谷川ふとんで鬼の映像

まあ、人間でもこのくらいの聞き間違いはあるかもしれない。鬼平犯科帳を読書か試聴させ続ければ、認識が強化されるのかもしれない。