オーディオトランスクリプションの状態

ノート: 音声認識オーディオトランスクリプションは限定された初期リリース中であり、Vivox で有効にする必要があります。利用料金および組織におけるこのサービスの有効化については、販売担当者にお問い合わせください。

あるプレイヤーが音声認識トランスクリプションが有効になっている別のプレイヤーと一緒にチャンネルにいるときは、そのプレイヤーたちの音声が以下の条件の下でトランスクライブされて送信されます。

オーディオトランスクリプションの完了時にプレイヤーが可聴範囲内にいて、トランスクリプションがクライアントに送信されるまで可聴範囲内にとどまる場合、それらのプレイヤーはオーディオトランスクリプションを受信します。
プレイヤーが話しているときに再び可聴範囲に入った場合、最後に入った可聴範囲以降のすべてがトランスクライブされます。

以下の条件の下ではトランスクリプションは送信されません。

音声の完了から Vivox SDK がトランスクリプションを受信するまでの間の遅延発生中にプレイヤーが可聴範囲外に出た場合、トランスクリプションは送信されません。
トランスクリプション中にプレイヤーが可聴範囲から出た場合、トランスクリプションは送信されません。

ノート: 音声の完了から、Vivox SDK がトランスクリプションを受信するまでの間に遅延が発生します。

音声認識トランスクリプションは、参加者のオーディオのミュート状態に従います。参加者のオーディオがミュートされている場合、そのオーディオトランスクリプションはアプリケーションに配信されません。これには、ローカルでミュートされた参加者とすべてのユーザーに対してミュートされた参加者、およびエコーチャンネルで自分だけミュートするデバイスが含まれます。自分をミュートしたユーザーは引き続き、チャンネル内の他のユーザーからのトランスクライブされたテキストを受け取ります。

一般に、音声認識トランスクリプションにとって話し声の音量は問題ではなく、言葉が明瞭に話されているかどうかだけが問題となります。ユーザーのオーディオの音量を変更するハードウェアレベルまたはソフトウェアの音量調整が、トランスクライブされた音声の精度に影響を与えないようにする必要があります。ただし、小さい声で話す人やぼそぼそと話す人はトランスクリプションにマイナスの影響を及ぼす可能性がありますが、これを開発者が制御することはできません。