以下では、音声認識や合成など、Web上で音声を操作するためのテクノロジーについて説明します。この記事にはコード例や複雑な技術的説明は含まれません。私の目標は、このトピックの研究の一環として開発された例として、単純なアプリケーションを使用して、これらのテクノロジーの機能と成熟度を示すことです。このアプリケーションのコードはGitHubで表示できます。
Web SpeechAPIが提供するもの
地図上の住所や電話での長い検索は音声で入力する方が簡単であることに多くの人が同意します。音声アシスタントが私たちの要求に答えることがよくあります。これらのテクノロジーは多くのモバイルアプリケーションで使用されていますが、サイトでこれをどのくらいの頻度で見ていますか?
モバイルユーザーにとってのメリットは明らかですが、それだけではありません。Web Speech APIは、障害を持つ人々や子供のためのWebアプリケーションのアクセシビリティを向上させます。場合によっては、このテクノロジーは、Webチャットなどのデスクトップユーザーにも役立つことがあります。
GoogleChromeでWebSpeech APIがどのように機能するかの例については、リンクを開いてみてください(この特定のブラウザをお勧めする理由については、後で説明します)。開いたページは2つの部分に分かれています。
- 音声生成-選択した言語でフレーズを入力し、PLAYを押してみてください。
- – START, .
, .
? , , -.
Speech API , ? , , — .
, , , :
- -
, , .
, , Google Chrome. , Chrome , API. , .
, ( , ) , Web Speech API . Firefox, Edge Safari, , , — .
, , , ?
, Web Speech API , , . , API, — , .
Pocketsphinx Tensorflow. , PWA (Progressive Web Application) — , .
. API . =)
API. , .
— , -. , Web Speech API, .
.