ドキュメント

サポート

Vivox Unity SDK

Vivox Unity SDK

オーディオトランスクリプションの状態

Understand audio transcription conditions for speech-to-text.
読み終わるまでの所要時間 1 分最終更新 23日前

あるプレイヤーが音声認識トランスクリプションが有効になっている別のプレイヤーと一緒にチャンネルにいるときは、そのプレイヤーたちの音声が以下の条件の下でトランスクライブされて送信されます。
  • オーディオトランスクリプションの完了時にプレイヤーが可聴範囲内にいて、トランスクリプションがクライアントに送信されるまで可聴範囲内にとどまる場合、それらのプレイヤーはオーディオトランスクリプションを受信します。
  • プレイヤーが話しているときに再び可聴範囲に入った場合、最後に入った可聴範囲以降のすべてがトランスクライブされます。
以下の条件の下ではトランスクリプションは送信されません。
  • 音声の完了から Vivox SDK がトランスクリプションを受信するまでの間の遅延発生中にプレイヤーが可聴範囲外に出た場合、トランスクリプションは送信されません。
  • トランスクリプション中にプレイヤーが可聴範囲から出た場合、トランスクリプションは送信されません。
音声認識トランスクリプションは、参加者のオーディオのミュート状態に従います。参加者のオーディオがミュートされている場合、そのオーディオトランスクリプションはアプリケーションに配信されません。これには、ローカルでミュートされた参加者とすべてのユーザーに対してミュートされた参加者、およびエコーチャンネルで自分だけミュートするデバイスが含まれます。自分をミュートしたユーザーは引き続き、チャンネル内の他のユーザーからのトランスクライブされたテキストを受け取ります。 一般に、音声認識トランスクリプションにとって話し声の音量は問題ではなく、言葉が明瞭に話されているかどうかだけが問題となります。ユーザーのオーディオの音量を変更するハードウェアレベルまたはソフトウェアの音量調整が、トランスクライブされた音声の精度に影響を与えないようにする必要があります。ただし、小さい声で話す人やぼそぼそと話す人はトランスクリプションにマイナスの影響を及ぼす可能性がありますが、これを開発者が制御することはできません。