【無料】おすすめの音声認識ソフト7選を比較
最初は、おすすめの無料音声認識ソフトを6つ紹介します。性能の高さよりもコストの低さを重視する場合に適した製品です。
Group Transcribe
マイクロソフト社が提供する「Group Transcribe」は、リアルタイムな文字起こしと翻訳が可能なソフトです。話者を高い精度で特定し、誰が何を言ったのか正確に記録します。単に文字に起こすだけでなく、それをほかのユーザーと共有する機能にも優れています。
価格 |
無料 |
対応言語 |
80以上 |
対応OS |
iOS |
提供形態 |
DL |
文字起こしさん
株式会社さんが提供する「文字起こしさん」は、音声ファイルをアップロードするだけで内容を文字起こしできるサービスです。設定により、ITや医療・介護など、独特の用語が用いられる業界にも対応できます。無料でも利用できますが、音声の尺が限られるため、本格的に使うには有料版が必要です。
価格 |
無料 ※有料プランあり(月額1,000円~) |
対応言語 |
要問い合わせ |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
ブラウザ |
Sloos
株式会社Quantumcoreが提供する「Sloos」は、発言者ごとに文字起こしするサービスです。わずか10秒程度の音声を登録するだけで、話者を正確に識別できるようになります。誰が何を言ったのか整理する必要がある、議事録の作成などに役立つソリューションです。
価格 |
無料 |
対応言語 |
日本語 |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
ブラウザ |
Notta
Notta株式会社が提供する「Notta」は、50万人で使われてきた文字起こしサービスです。オンライン会議やインタビューが、わずか5分で文字になります。音声ファイルのインポートのほか、ライブマイクによる入力やWeb会議録音など、多様な方法に対応。タグ付けや画像の追加など、編集機能も充実しています。
価格 |
無料 ※有料プランあり(月額:1,200円~) |
対応言語 |
104 |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
ブラウザ・アプリ |
ユーザーローカル音声議事録システム
株式会社ユーザーローカルが提供する「ユーザーローカル音声議事録システム」は、議事録作成に特化したサービスです。ミーティングの開催から文字起こしまで、会議をワンストップで行えます。音声そのものが保存されることはなく、テキストも削除可能なため、セキュリティの観点から安心して使えます。
価格 |
無料 |
対応言語 |
要問い合わせ |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
ブラウザ |
Secure Meet
チャットプラス株式会社が提供する「Secure Meet」は、機能性に優れた国産のWeb会議ツールです。リアルタイムAI翻訳機能を備え、ネイティブスピーカーでなくても英語で円滑にコミュニケーションを取れます。翻訳以外にも、画面共有やスケジューリングなど、Web会議に必要な機能を幅広く備えています。
価格 |
無料 ※有料プランあり(初期費用0円、月額:1,500円~) |
対応言語 |
要問い合わせ |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
DL・クラウド |
Google Docs
Google社が提供する「Google Docs」は、オンラインドキュメント編集ツールです。テキスト入力方法の1つとして、音声入力機能が用意されています。マイクボタンをクリックし、話しかけるだけで発話内容を文字化可能です。そのほか、スペル候補の提示や翻訳機能など、多くの便利な機能が備わっています。
価格 |
無料(グループウェアの「Google Workspace」は月額1,360円~) |
対応言語 |
要問い合わせ |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
ブラウザ・クラウド |
【有料】おすすめの音声認識ソフト6選を比較
続いて、有料のおすすめ音声認識ソフトウェアを紹介します。ビジネスで本格的に利用したいのであれば、有料製品を比較・検討しましょう。
Voice Code
株式会社FREECSが提供する「Voice Code」は、文字入力を支援する音声認識ソフトです。マイクに向かって話した内容が、リアルタイムにテキスト化されます。テキストデータはクリップボードに保存されるため、そのまま「貼り付け」機能でWordやメールなど、さまざまなアプリにペーストできます。操作はシンプルで、ITツールに不慣れな人でも安心です。
価格 |
5,980円 |
無料トライアル |
× |
対応言語 |
要問い合わせ |
対応OS |
Windows |
提供形態 |
DL・クラウド |
VoiceRep スマート議事録forテレワーク
株式会社リオが提供する「VoiceRep スマート議事録forテレワーク」は、テレビ会議向けの文字起こしツールです。Google社の音声認識エンジンを利用しており、事前の音声登録なしで利用を始められます。マイクに向かって発話するほか、録音した音声ファイルからの入力が可能です。句読点の挿入や数値表記の変換など、編集を支援する機能も豊富に備わっています。
価格 |
6,800円 |
無料トライアル |
× |
対応言語 |
要問い合わせ |
対応OS |
Windows |
提供形態 |
DL・ブラウザ |
AmiVoice VoXT
株式会社アドバンスト・メディアが提供する「AmiVoice VoXT」は、音声認識機能とプロの手による文字起こしサービスです。音源をアップするだけで文字化できる「VoXTセルフ」と、文字起こしから納品までプロが手掛ける「VoXTフル」が提供されています。料金は分単位の従量課金制であるため、月額料金制と異なり、使用量に比べて料金が高くなる心配はありません。
価格 |
30円/分~(VoXTセルフ)、270円/分~(VoXTフル) |
無料トライアル |
○(1時間分まで) |
対応言語 |
要問い合わせ |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
クラウド |
もじこ
吉積情報株式会社が提供する「もじこ」は、AI音声認識を利用した文字起こしツールです。自治体や上場企業、大学などさまざまな組織での導入実績を誇ります。複数のエンジンが搭載され、言語などに応じて選択できます。エディタ機能も充実し、メモの挿入やサムネイル画像の確認などが可能です。
価格 |
初期費用0円、月額15,000円、従量課金25円/分 |
無料トライアル |
○(14日間) |
対応言語 |
125 |
対応OS |
Windows・MacOS・iOS・Android |
提供形態 |
クラウド |
おこし名人
アイネット株式会社が提供する「おこし名人」は、ワープロとプレイヤーが一体となった文字起こしツールです。音声を聞きながら手動で文字起こしを行えるほか、マイクに向かって発話すると、自動的に文字が入力される機能も搭載されています。
価格 |
39,900円 |
無料トライアル |
○(30日間) |
対応言語 |
要問い合わせ |
対応OS |
Windows |
提供形態 |
CD-ROM |
Excel聞き取り上手
有限会社エスワイシステムが提供する「Excel聞き取り上手」は、Excelの音声入力に特化したツールです。マイクで読み上げた数値や言葉が、選択中のセルに自動で入力されます。入力後は自動で復唱されるため、間違いにもすぐに気づけます。ユーザー辞書機能が搭載されているので、専門用語や業界用語にも対応可能です。
価格 |
3,000円 |
無料トライアル |
無料お試し版あり |
対応言語 |
要問い合わせ |
対応OS |
Windows |
提供形態 |
DL |
音声認識とは
音声認識とは、人間の話し言葉を理解する機能のことです。元来、機械にとって人間の言語を理解することは困難でしたが、AI技術の発展などにともなって、実用的なレベルにまで性能が向上しました。
音声認識は、さまざまな場面で利用されています。
例えば、音声データを文字起こしするツールがあります。会議の音声データを与えれば、議事録を作成させることが可能です。また、電話で音声を認識し、案内を行うツールもあります。コールセンターなどにおける顧客対応に役立つツールです。従来であれば、人間が耳で聴きとるしかなかったことを機械が代行できるようになり、ビジネスで使われることが増えました。
Windows・Macに搭載されている音声認識機能とは
実は、音声認識機能はWindowsとMacに標準搭載されています。それぞれの機能について見ていきましょう。
Windows
Windowsに搭載されている音声認識機能は、Windowsキーを押しながらHキーを押すことで立ち上がります。マイクボタンをクリックして話しかけると、その内容を文字に起こすことができます。メモ帳やWordなどで文書を作成する際、キーボードを使うことなく入力できるのが特徴です。手元の資料を見ながらパソコン上でメモを取りたい場合や、議論の内容を自動的に記録したい場合などに役立つでしょう。
Mac
macOSに搭載されている音声認識機能は、アプリの制限がないのが特徴です。Windowsではメモ帳やWordなどに限られますが、macOSではどのアプリにもテキストを入力できます。テキスト入力のみならず、アプリの操作が可能なほか、録音機能にも対応しています。
音声認識ソフトの選び方
WindowsやmacOSに標準搭載されている音声認識機能では、できることが限られます。より本格的にビジネスへ利用したいのなら、専用ソフトの導入がおすすめです。ここでは、音声認識ソフトの選び方を紹介します。
登録言語数の多さ
音声認識ソフトは、聞き取った音声をそのまま文字に変換しているのではありません。登録されている語彙の中から、聞き取った音声にもっとも近いものを選択して文字にしているのです。したがって、登録語数が多いほど、より多様な種類の文章を音声から文字へ変換できます。
基本的には、100万語以上が登録された音声認識ソフトを選びましょう。また、特定の業界で使うのであれば、その業界の専門用語や固有名詞に対応した音声認識ソフトを選ぶとよいでしょう。
自社に必要な機能はあるか
一口に音声認識ソフトといっても、備わっている機能は製品によってさまざまです。比較・検討する際には、自社が求める機能を備えているかどうか確認しましょう。そこで、代表的な機能を6つ紹介します。
辞書登録機能
標準搭載されている言葉だけで事足りれば理想的ですが、なかなかそうはいきません。そこで、音声認識ソフトには辞書登録機能が備わっていることがあります。これは、辞書を登録することで登録語異数を増やす機能です。音声認識の精度を高め、修正の手間を省けます。
カスタム登録機能
専門用語や固有名詞など、任意の語彙を登録する機能です。自社の業界でよく使われる語彙を登録しておけば、通常の辞書には掲載されていない語彙にも対応できるようになります。
自動学習機能
音声認識ソフトには、語彙を自動的に学習するAIを搭載した製品もあります。使えば使うほど、よく使われる語彙を記憶し、スムーズに音声を文字化してくれるようになります。長期的に運用したい場合におすすめです。
自動文字化エージェント機能
録音データを文字起こしする機能です。会議の録音データを文字に起こして共有したり、動画に字幕を付けたりするのに役立ちます。また、聴覚に障害をもつ人に情報を提供する際にも役立つでしょう。
議事録自動作成
議事録の作成に特化した音声認識機能です。会議の発言内容を文字として記録し、後の情報共有を円滑にします。多少の修正や整理は求められますが、ゼロから手動でメモを取る必要がなく、時間を削減できます。
翻訳機能
音声入力された言語を、異なる国の言語として文字化する機能です。多言語が用いられる会議などの音声を、特定の言語で統一して文書化したい場合などに適しています。
「声の登録」が必要か
音声認識ソフトには、声の登録が必要なものがあります。事前に話者の声を登録しなければ、その人の声を認識できません。一方、声の登録が不要で、導入後すぐに使い始められるものもあります。手間がかからないうえ、不特定多数の発話が入った音声も文字化できるため、幅広い用途に利用できます。ただし、事前に声を登録する音声認識ソフトよりも、精度が低いことがあります。特定の話者による発言を高精度で文字化したいのであれば、声の登録が必要な音声認識ソフトを選びましょう。
Bluetoothに対応しているか
Bluetooth対応のソフトであれば、ヘッドマイクなどと連動して音声を入力できます。音声入力時に有線を使う必要がなく、快適な作業環境を保持可能です。頻繁に音声認識ソフトを使うのであれば、無線で使えるBluetooth対応の製品を選びましょう。
音声認識ソフトの感度を高めるおすすめのマイク
音声認識ソフトの感度は、ソフトそのものだけでなく、マイクによっても左右されます。そこで、最後はおすすめのマイクを2種類紹介します。
バッチ型マイクデバイス
バッチ型のマイクは首からかけて使う、小型のデバイスです。口元から発せられる音声をキャッチしやすい位置に装着するため、高い精度で音声を認識できます。装着しているデバイスが、身体の動きの邪魔になりづらく快適です。
超指向性ピンマイク
超指向性ピンマイクは、話者の口元から放たれる発言を、ピンポイントで収音します。感度調節機能を使うことでノイズを消し去り、クリアな音声を入力可能です。多くの人が集まる会議室や、カフェなどの場所でも安心して使えます。
音声認識ソフトは機能性や登録言語数を比較して適切な導入を
音声認識ソフトとは、話者の音声を認識し、文字化するソフトウェアのことです。会議を録音して議事録を作成するなど、多くのビジネスシーンで活躍します。
音声認識ソフトは、登録語数が多いほど認識精度が向上します。また、カスタム登録機能や自動学習機能を活用すれば、さらに精度を高められます。機能性や精度の観点から製品を比較し、自社に適したものを導入しましょう。