Macでの音声文字起こし:Siriの音声認識とAIサービスのススメ

0
37

Macでは、音声を文字起こしするためのいくつかの方法が提供されており、それぞれに独自の進歩が見られます。

音声のライブ文字起こしや既存のオーディオファイルの文字起こしは、時間とともに進化してきました。ここでは、Macで利用可能な最適なオプションとその使用方法について解説します。

音声ファイルの文字起こしは、オーディオ録音の各単語の各音節を一時停止し、再生し、巻き戻し、ダブルチェックするという、まさに悪夢のような作業です。ライブスピーチの場合は、さらに困難で、人に何度も繰り返してもらうことが望ましくなかったり、できなかったりするかもしれません。どのような理由であれ、Macで音声を文字起こしするための複数のオプションが利用可能です。



Siriを使った音声文字起こし

Siriを使った音声認識にはいくつかの欠点があります。すぐに使えるオプションはSiriです。マイクを通じてライブストリームのオーディオをSiriを使って文字起こしできます。ただし、最初にこの機能を有効にする必要があります。

Siriでの音声認識を有効にする方法

Siriを通じて音声認識が有効になると、Macの特定のインスタンスでタイプできるようになり、ショートカットを押すとSiriが文字起こしを開始します。Siriがあなたのためにタイプしてくれない例外的な場合として、Google ChromeのGoogleドキュメントなど、Safari以外のブラウザ内の特定のWebページが挙げられます。

精度に関しては、Siriは通常、あなたが言っていることを理解し、複数の言語での書き起こしもうまくいきます。しかし、Siriが本当に遅れをとるのは句読点の部分で、ほとんどのスピーチを一つの連続したテキスト文字列として書き起こします。Siriを使用することは、大量のテキストをタイピングすることを避けるために便利かもしれませんが、声で明確に各句読点を指定したくない場合は、AIベースの書き起こしアプリを使用する方がよいかもしれません。

AIサービスを使った音声文字起こし

Macで使用できる2つのAIベースの書き起こしサービスはOtter.aiWhisper Transcriptionです。どちらのサービスも、ユーザーが自分で録音して書き起こすか、オーディオファイルをインポートして書き起こすことができます。さらに、どちらのサービスも有料のプレミアムオプションを提供しており、SlackやZoomなどの特定のアプリをリンクして、通話のオーディオを書き起こすことができます。

どちらのアプリケーションも、提供されるオーディオファイルがクリアであればあるほど、結果は良くなります。ライブで入力されたオーディオの書き起こしに関しては、どちらのアプリも非常に優れています。一般的に、どちらのアプリケーションも単語を正確に書き起こし、句読点の面でも優れています。ただし、各サービスには独自の利点があります。



OpenAIのWhisper

OpenAIによって開発されたWhisperは、ほぼ必要とするあらゆる言語でオーディオを書き起こすことができるという明確な利点があります。現時点では、Otterは英語のみを書き起こすことができます。Siriに対する精度と句読点の正確性の利点は、他の言語でも持続します。英語以外のオーディオを正確に書き起こす必要がある場合、WhisperはMacで利用可能な最良のオプションです。Whisper Transcriptionアプリは、AppleのApp Storeからダウンロードできます。

Otter

Otterの主な利点は、ビジネス利用に傾斜していることです。Otterで録音されたオーディオは、話者を区別するだけでなく、録音にタイムスタンプを付けることができます。Otterはまた、リアルタイムでの書き起こしフィードを提供し、その精度は驚くほど高いです。Otterがオーディオを処理する時間を少し与えると、特に句読点でさらに正確な書き起こしが得られます。

Audio Hijack

Macユーザーにとっての音声文字起こしの最終オプションはAudio Hijackです。Audio Hijackは主にオーディオ録音アプリですが、OpenAIのWhisper Transcriptionによって動力を得た書き起こし機能も備えています。Audio Hijackは、Macで再生されるあらゆるオーディオを録音し、それに応じて書き起こすことができます。

OpenAIのWhisperを使用して、Audio Hijackは正確な書き起こしを提供することができます。ただし、一部のユーザーが遭遇するかもしれない問題は、アプリ自体のインストールです。インストールには、Macのリカバリーモードで設定を変更する必要があり、一部のユーザーにとっては少し手間がかかるかもしれません。

オーディオ書き起こしのニーズに関わらず、あなたのニーズに合ったオプションがあります。英語以外の正確な書き起こしから、複数の話者がいる会議の書き起こしまで、選択肢は豊富です。