音声ファイルをテキスト化!文字起こしアプリ12選【iPhone/Android/Mac/Windows】

2019年9月15日

transcribe-audio-app
  • 会議や取材の音声ファイル(録音データ)を文字起こしする作業が、本当に面倒で……。
  • 音声ファイルを自動でテキスト化できる便利なツールがあれば知りたい!
  • こういったツールをもっと活用できるアイデアも教えて!

こんな悩みに応える記事を書いてみました。

音声ファイルのテキスト化って、本当に大変な作業ですよねぇ……。

ただひたすらに耳から入ってくる音声を機械的に入力していく作業が、永遠と続く地獄。効率よく作業をすすめるために一切の雑念を捨て、耳から指先までが一体化したような感覚で、半ば自動的に文字起こしを進めていく……。

まるで自分がロボットになったかのような錯覚にさえ陥ってしまいます。

そんな苦行とはきっぱりと決別しましょう。自分が機械にならなければ効率よく出来ない作業であれば、はじめから機械に任せてしまえばいいんです。

というわけで、この記事では、

  • おすすめの音声ファイルテキスト化ツール(アプリ)
  • 音声⇢テキスト化の活用アイデア

といった情報をまとめています。

今回紹介するようなツールを活用すれば、退屈だった機械的作業がぐっと楽になるだけでなく、新しいアイデアをどんどん出したり、文章をハイスピードで書けるようになりったりしますよ。

おすすめの音声ファイルテキスト化アプリ・サービス

ドラゴンスピーチ11(Windows・有料)

おそらくこのジャンルでもっともメジャーなソフトがこちら。

ドラゴンスピーチ11

音声認識技術に高い定評を持つメーカーが作っているアプリだけあり、非常に高い認識精度が特徴。100万語の辞書や認識候補学習など、機能も充実しています。

ファイル形式はwav・wma・mp3・dss・ds2など幅広い形式に対応。付属のノイズキャンセルマイクやスマホを使って直接音声入力も可能です。

ただ、2019年の時点ですでに販売を終了しているもよう……。※ライバルソフトである『AmiVoice』も2018年に販売を終了しています。

Amazonではまだ買えるみたいなので、欲しい方は早めに手に入れておくといいかも。

これからはこういったスタンドアロン型よりも、↓で紹介するようなクラウドをベースにしたサービスが一般的になっていくのかもしれませんね。

AmiVoice Cloud Platform(ブラウザ・有料)

販売終了となった『AmiVoice』がクラウドサービスとして復活したのがこちら。

APIはブラウザで直接利用することも可能。汎用エンジンのほか、特定業界に特化したバージョンも用意されています。

汎用エンジンは毎月60分無料で使えるデモがあるので、興味がある人は試してみては?

AmiVoice Cloud Platform

Voice Rep 3 / Voice Rep PRO 3(Windows・有料)

Googleの音声認識エンジンを活用した音声テキスト化アプリ。

マイクを使ってのリアルタイム文章化がウリのソフトですが、PRO版では音声ファイル(wma・mp3・wav)の文字起こしにも対応しています。

ポイントはテキスト化した文章に「タイムライン」が自動で付加される点。まさにかゆいところに手が届くといった感じで、文字起こしの苦労がわかる人間にはとてもありがたいですね。

Voice Rep 3 / Voice Rep PRO 3

VoXT(Windows/クラウド・有料)

AmiVoiceを使った1文字30円からの音声テキスト変換サービスのほか、専門スタッフによる人力の文字起こし代行も行っているサイト。

しっかりした書き起こし文章を求めている場合は、やはり人の手で行ったほうが確実ですよね。

※セミナー動画に字幕をつけるサービスなんかもやってくれるようです。

VoXT

Smart書記(ブラウザ&アプリ・有料)

ブラウザを使って利用できるクラウド型の自動文字起こしツール。

辞書登録などの煩わしい作業も一切不要。学習機能を持ったAIは使えば使うほど成長し、使い勝手が良くなっていきます。

豊富な出力バリエーションやデータ共有など、会社で複数人と議事録等をやりとりするのにぴったりですね。

Smart書記

P-VoT(ブラウザ・有料)

こちらはパナソニックが去年から正式稼働させているマスメディア向けの文字起こしサービス。

放送システムで培ってきた技術・ノウハウを遺憾なく発揮し、特別な機器を使わずとも動画や音声を自動で文字に起こし、編集することができます。

今後はYouTuberなどもこういったサービスを利用するようになるんでしょうかね。

P-VoT

Amazon Transcribe(ブラウザ・有料)

こちらはAmazonのクラウドサービスAWS(Amazon Web Services)の中に導入されているツールです。

これまで日本語は利用できなかったのですが、去年末に正式に対応し、管理画面で「Japanese」が選べるようになりました。

AWSを利用しているので自社システム等に組み込みやすいのも特徴。AI技術にも定評があるので期待が持てますね。

Amazon Transcribe

Speech to Text Demo(ブラウザ・無料)

IBMのAI「Watson」を活用した音声ファイルテキスト化ツール。

mp3・mpeg・wav・flac・opusなど複数のファイル形式に対応しています。

あくまで無料デモ版ということで、個人情報の入力は推奨されていないようですのでご注意を。

Speech to Text Demo

AI文字起こしβ(ブラウザ・無料)

こちらもGoogleのAPIを活用した文字起こしツール。

ファイル形式はwav・mp3・ogg・m4aに対応。スマホからも利用できます。

β版の期間は無料で使えるようです。

AI文字起こしβ

Speechy Lite(iPhone・無料)

iPhoneで音声をテキスト化したいならこのアプリがおすすめかな。

無料版は時間制限などがありますが、リアルタイム入力だけでなく外部音声ファイルのインポートにも対応しています。

‎Speechy Lite

ボイスレコーダー(iPhone・有料)

このアプリもおすすめ。有料(¥360)ですが、音声の録音から編集、録音ファイルのテキスト化までひと通り行えます。

ボイスレコーダー

Qyur2(iPhone・有料)

こちらは無料のボイスレコーダーアプリですが、有料(1分5〜12円)で音声データのテキスト変換も行ってくれるようです。

‎Qyur2 キュルキュル

Googleドキュメントの文字起こし機能を使って、音声ファイルをテキスト化するテクニック

実は、GoogleドキュメントGoogleの音声認識エンジンによる音声入力に対応しているのですが、すでに録音したmp3やwavといった音声ファイルを読み込ませてテキスト変換するといった機能は付いていません。

しかし、とある工夫をすることで、音声ファイルをGoogleドキュメントを使って自動(しかも無料!)でテキスト化することができます。

Windowsの場合

  1. 環境設定「サウンド」⇢「録音」タブ
  2. 「ステレオミキサー」を有効化

Macの場合

  1. Soundflowerをインストール
  2. 環境設定「サウンド」⇢「出力」「入力」タブ
  3. 「Soundflower(2ch)」に設定

この方法は、MacやWindowsに標準搭載されている文字起こし機能にも使えます。

音声再生をスピーカーを通さずに、直接パソコンに認識させてしまうというわけですね。

仕組み上、音声ファイルの再生時間と同じだけの作業時間がかかってしまう点だけ注意してください。

音声ファイル⇢テキスト化の様々な活用シーン

インタビューの文字起こし

最も一般的なのが、この用途ではないでしょうか。

特に取材・インタビューの機会が多いライターは、文字起こしが自動化できるだけで大幅に原稿作成作業が楽になります。

どうせ同じ時間なら、記事の内容に使いたいですからね。

会議の議事録

昔は、いわゆる「書記」の人がリアルタイムで議事録を書いていくのが一般的でしたが、ある程度以上の速記能力を持った人材をこういった記録のためだけに雇う余裕は、現代の企業にはありません。

そこで最近では、会議の様子を録音(録画)して、後で部下に「文字起こしして(まとめて)おいて」と指示出しするような光景をよく見かけます。

しかし、部下だって貴重な人材です。機械化(自動化)できる作業は機械に任せて、余計な時間をとらせないようにしましょう。

動画の文字起こし

最近ニーズが高まってきているのがこちらの用途。

ブロガーからYouTuberに移行した人などが、アップした動画をブログ記事にも反映させたいときなどに、文字起こしツールを使ってコンテンツを作成する、というわけです。

忙しい人などは外注するケースも増えてきているそうですので、これらのツールを活用すれば副業で稼ぐこともできそうですね。

ブレインストーミング

これは僕がたまに使っているテクニックです。

スマホのボイスレコーダーを使って思いつくアイデアをどんどん口に出していくというのがそのやり方。

目を瞑って思考の赴くままに言葉を発していると、普段は思いつかないようなアイデアやフレーズが浮かんできたりしますよ。

執筆

アイデア出しだけでなく、文章の執筆自体を口頭で行ってしまうという方法もあります。

最近は音声入力ができるテキストエディタなどもあるので、そちらを使ってもよいのですが、後から見直したときに入力・変換のミスなどでせっかくの文章が何を書いたのかわからなくなってしまうといったこともあります。

そういった事態を防ぐためには、一旦ボイスレコーダーなどに録音した音声ファイルをあらためてテキスト化するという方法が確実です。

パソコンやキーボードの前で構えて「さあ、文章を書くぞ!」と気負う必要もないので、ラクな気分でスラスラと文章が書けるようにもなりますよ。

文字起こしをもっと手軽にしよう!

今回の記事のまとめです。

こんな感じで利用シーンに合わせて最適なツールを選ぶのがいいかと。

※最近は、取材インタビューなどでもスマホで音声を録音しているケースが増えているようですが、後からテキスト化をこういったツールで自動化しようと考えている人は、クリアな音声ファイルのほうが精度が高くなるので、できれば専用のICレコーダースマホに取り付けるタイプの高性能マイクを使うのがおすすめです。

僕はMacユーザーなので、現在のところはステレオミキサー機能を活用していますが、今後音声ファイル⇢テキスト化の機会がもっと増えてきたら、仮想WindowsでVoice Rep PRO 3を使ってみようかなぁと考えています。

AIスピーカーなども普及してきましたし、これからは音声入力の機会がもっと増えてくるかもしれません。

今後は↑で紹介したような、文章の執筆にキーボードではなくボイスレコーダーを利用する方法というのも、積極的に試していこうかな……。肩こりも治りそうですしね。

文章

Posted by orikasse