最近では動画にテロップを載せるために音声認識入力を活用してますが、なんのアプリを使うにしても共通する音声認識させるコツがわかってきました。
音声認識率を高めるために意識しておきたいことと、必要なスキルについてまとめました。
目次
音声認識入力でテキストを起こすためのコツ
音声認識入力でテキストを起こすためのコツと言っても、「聴き取りやすいと思ってもらえる会話の仕方」ができていれば十分だと思ってます。
それが
- はっきりとした口調
- なるべく大きな声
- 2人以上で話すなら言葉がかぶらないように
の3点じゃないかなと。
はっきりとした口調でしゃべる
タイトルにも書きましたが、滑舌良くはっきりとした口調でしゃべることが重要です。
人間の耳は結構都合良く解釈してしまうので、「普段の会話は通じてるけども音声認識率は低い」ということもあるんですよ。
普段よりさらにはきはきと話すように意識するとうまくいくと思います。
なるべく大きな声でしゃべる
はっきりとした口調でしゃべった上で、その音量はなるべく上げましょう。大きな声でしゃべることで口調もはっきりしますし、結局ははっきりとした口調にもつながってるんですけどね。
また、録音する際のレベル合わせは必ずやりましょう。しゃべり声が大きくても録音レベルが小さかったら意味がないので。
2人以上で話すなら言葉がかぶらないようにしゃべる
実際に試してみて意外と困ったのが、2人以上で対談していると会話がかぶることが多いということ。
多少のかぶりは諦めるしかないんですが、事前に「あとで音声認識でテキスト化するから会話がかぶらないようにしたい」という説明をしておけば、過剰に会話がかぶることは回避できるかもしれません。
音声認識によるテキスト入力ならUDトークがおすすめ
音声認識によるテキスト入力なら、UDトークというアプリがおすすめです。
UDトークは長文の認識率が高く、ブログの執筆・メールの作成・動画のテロップ用テキスト起こしなど、文章を作成する際に大活躍してくれます。
動画用のテロップの作り方については記事も書いてますので、こちらもぜひご覧ください。
最後に
頭の回転が速いという意味でのトーク力も欲しいんですが、滑舌の良さとか声の張り具合といった伝わりやすいように話す技術ももっと鍛えて行きたいなと、改めて感じました。
動画を撮るだけでなく、編集をしていることで気づけたことだったので、続けることでもっと成長できる感覚があります。これからも頑張ります。