→Amazon Transcribe:音声をテキストに変換する自動音声認識(ASR)サービスです。
・PIIの再編集をオンにして、Amazon Transcribeテープ起こしジョブを構成します。音声ファイルがS3バケットにアップロードされたら、Lambda関数を呼び出して、テープ起こしジョブを開始します。出力を別のS3バケットに保存します
この選択肢が正解の理由は以下の通りです。
まず、必要な機能として音声のテキスト化と個人識別情報の削除があげられます。これらの要件を満たすためには、Amazon Transcribeというサービスが適しています。Amazon Transcribeは音声をテキストに変換するサービスであり、このサービスには機密情報を削除するオプションが存在します。これにより、個人識別情報の削除という要求も満たせます。
次に、この選択肢では、音声ファイルがS3バケットにアップロードされたタイミングでLambda関数を呼び出し、テープ起こしジョブを開始するとあります。これにより新しく音声ファイルがアップロードされたときに、自動でテキスト変換と個人識別情報の削除を行うことができるため、運用の手間や遅延を最小限に抑えることができます。
最後に、出力を別のS3バケットに保存するとあります。これにより、原音ファイルとテキスト化されたファイルが混在することを防ぎ、データの整理を容易にします。
選択肢:トランスクリプションをオンにして音声ファイルをインジェストするAmazon Connectコンタクトフローを作成します。既知のPIIパターンをスキャンするAWS Lambda関数を組み込みます。Amazon EventBridgeを使用して、音声ファイルがS3バケットにアップロードされたときにコンタクトフローを開始します
この選択肢が正しくない理由は以下の通りです。
Amazon Connectコンタクトフローは音声をテキスト化することができますが、PIIの削除機能を直接独自に提供してはいません。Lambda関数を使用して既知のPIIパターンを処理するには確かに可能ですが、それはオプションであり、労力が必要です。正解の選択肢であるAmazon Transcribeは、テープ起こし時に自動的にPIIを再編集(削除)する機能を提供しているため、より効率的で専門的な選択肢となります。

コメント