NTTは、大きな雑音の中でも必要な音声を認識して正確に書き起こすことができる人工知能(AI)技術を開発した。複数の人の会話を発言者ごとに聞き分けることも可能で、会議の議事録をほぼリアルタイムで作成することができるようになるという。1〜2年後の実用化を目指す。 人の言葉を理解して学習するAIにとって音声認識は重要な技術で、雑音はその大敵となっている。雑音を除去しようとすると、必要な音声も変質してしまい正確に認識できなくなるという課題があった。 NTTは、音の大きさや方向などから認識すべき音声と雑音を自動的に推定し高精度で識別するアルゴリズム(手順)を開発。必要な音声をひずませることなく、雑音だけを低減させる技術を確立した。必要な音声が聞き取りにくいほどの雑音にも対応できる。 会議などでの複数の人の会話でも、この技術を使い音の方向など空間的情報から発言者の位置を特定。6人程度のやり取りを聞き分