Pages

Thursday, September 3, 2020

ビデオ会議からキータイプ音をなくせ! 「タイプ音除去アプリ」を試す - ITmedia

 ビデオ会議に新しいマナーはいらないと思っているが、それでも生まれるものはある。その典型は、「相手が話している時で、自分が話す必要がない時は小まめにミュートする」ということだろうか。

 特にメモにPCを使っている場合には、このことが重要になる。筆者の場合だと、インタビューや記者会見のQ&A中、質問しつつメモを取る場合、どうしてもタイプ音が出る。それをマイクで拾われると、聞いている全員に聞こえるので耳障りなのだ。

 というわけで、いまは自分で小まめにミュートする場合が多いし、主催者が回答者以外を強制的にミュートするようになっている場合もある。

 確かに必要な配慮だが、これはけっこう煩わしいものだ。こちらでミュートするのを忘れていたりするとちょっと恥ずかしい。また、質問には「相づち」などがあった方が反応しやすいのも事実だ。

 そういう課題の解決方法は2つある。指向性の高いマイクを使って声以外を拾わなくする方法、そして「タイプ音ノイズの除去ソフト」を使うことだ。今回は特に、後者のアプローチを試してみよう。意外なほど効果的で、この先の未来が予想できる面白い技術だ。

 なお、今回の記事では動画を多数紹介しているが、「音」が重要なので、ぜひ音声をオンにして(もしくはヘッドフォンを使って)再生しながら読んでいただきたい。

この記事について

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2020年8月31日に配信されたものです。メールマガジン購読(月額660円・税込)の申し込みはこちらから

ノイズキャンセルヘッドフォンとは原理が異なる「AI」でのアプローチ

 ノイズキャンセルというと、多くの人はいわゆる「ノイズキャンセルヘッドフォン」を思い浮かべるだろう。だが、今回紹介するノイズ除去ソフトは、それらとは仕組みが大きく異なる。

 ノイズキャンセルヘッドフォンは、簡単に言えば外部の音を取り込み、その逆位相の音を重ねることで音を消す。仕組み上、(理想的には)外部の音が全て消える。複雑な処理ではないので遅延もほとんど発生しない。

 一方この場合には、「特徴的な耳障りな音」だけを消すのが難しい。例えば「声だけ」とか「キーボードのタイプ音だけ」とかだ。ジェット機のエンジン音や電車の走行音、声などに多く含まれる「特徴的な周波数帯」をまとめて対処することはできるが、別に音そのものを認識しているわけではないから、ピンポイントに消せるわけではないのだ。

 だが、今回テストした「タイプ音ノイズの除去ソフト」はちょっと違う。機械学習によって「必要な音」、すなわち音声を学習し、その成分以外を消すことで対処している。いわゆる「エッジAI」の活用例なのだが、その性質上、相応の処理能力が必要になるし、原理的に遅延が避けられない。

 同じノイズキャンセルであっても、「全体アプローチ」と「個別の要素へのアプローチ」であり、まったく違う存在なのだ。

エッジAI技術を使って「音声だけ」をエンハンス

 「タイプ音ノイズの除去ソフト」に代表されるアプローチは、比較的最近生まれたものだ。

 この種のソフトで最も有名なのは、米NVIDIAが4月に公開した「RTX Voice」ではないだろうか。NVIDIAが自社GPUを活用するソフトとして発表したことで話題となった。

 ではその実力を……といいたいところだが、このツールはNVIDIAの「RTX」シリーズのGPUを使っていないと利用できない。筆者は1世代前の「GTX」シリーズを搭載したPCを使っているので公式にはインストールできない。非公式な方法でインストールできるのは知っているが、利用許諾などに抵触する可能性が否定できないので、ここで紹介するのはやめておく。

 というわけで、別の選択肢を用意した。

 今回テストに使ったのは、米Krisp Technologiesの「Krisp」と、米BabbleLabsの「Clear Edge」。どちらも試すだけなら無料だ。KrispはWindowsとMacの両方で、Clear EdgeはWindowsで利用できる。

 今回は同じ条件で比べるため、どちらも動作するWindowsを使っている。

 ソフトとしてはどちらも似たような作りだ。簡単に言えば、各アプリが「仮想的なマイクデバイス」「仮想的なスピーカーデバイス」として動作する。

 もう少し平易に動作だけを説明すれば、マイクデバイスや音声出力デバイスからの音をソフトが受け取り、ノイズを消して声を明瞭にする処理をした上で次に受け渡す。すなわち、「マイクデバイスの入力音からノイズが消える」「再生している音からノイズが消える」ということになるわけだ。

photo KrispのUI。マイク・スピーカーそれぞれでノイズを消すかどうかと、どのデバイスを対象にするかを選ぶ
photo Clear EdgeのUI。考え方はKrispと同じ

 Zoomなどのアプリから利用する場合には、「仮想的なマイクデバイス」になっている各アプリを、各アプリの設定から「マイク」「スピーカー」などとして選べばいい。

photo Zoomでの設定例。例えば赤枠内で「Krisp」を選べば、マイクを通した音からノイズが消える

 注意点としては、「自分が発するタイプ音」などのノイズを消すには「マイク」の設定を変え、「相手が発するタイプ音」などを消すには「スピーカー」の設定を変える、ということくらいだろうか。言われてみれば当たり前だが、逆にすると、自分にはノイズが消えて聞こえても、相手からは消えているように聞こえない。

タイプ音がほとんど聞こえなくなるほど「効果は劇的」

 結果が知りたい方、お待たせしました。では、テストの結果をお聞きいただこう。以下のYouTubeで公開した動画を「音付きで」ご覧いただきたい。

 「無設定」「Krisp」「Clear Edge」の順に収録している。

 動画は3パートに分かれている。どれも話しながら、キーボードを派手にタイプし続けている点に留意して欲しい。

 最初はソフト的には何もしていないので、けっこう派手にキーボードの音が聞こえる。同じようにタイプしながら、「Krisp」「Clear Edge」の順にオンにしている。

 どちらも、コメント不要なくらいきれいにキーボードのタイプ音が消えているのにご注目いただきたい。わざと「よりタイプ音が大きいキーボード」でも試してみたが、こちらでもちゃんと消えていたので、効果は相当なもの、と断言できる。

 KripsとClear Edgeを比較すると、音質でも精度でもClear Edgeの方が良いように思える。Krispは全体に音が少しくぐもってしまう。また、状況によっては、Krispではほんのりキータイプ音が残るような場合でも、Clear Edgeでは音が消えていた。

 どちらのソフトでも、副作用がないわけではない。声は「少し強めに圧縮をかけた」ような、不自然さを感じるものになる。また、バックグラウンドで流れるごく小さな音量の音楽なども消えてしまうようだ。なので、音楽や動画配信を楽しむ時には、「スピーカー」でのノイズ消去をオフにした方がいい。

 また「処理を伴う」という性質上、ほんの少し遅延が大きい。今回数値では計測していないが、生音に比べ多少遅れる傾向のようであるのは聞き取れた。だが、Zoomのような「オンラインでの音声コミュニケーション」で使う場合、そもそもネットで音声を伝えるための遅延の方がずっと大きいので、このことが問題と感じられることは考えづらい。

今使うなら「Krisp」をお勧め、本命は「製品への組み込み」か

 というわけで、効果は絶大。筆者も最近は積極的に利用するようになった。

 ではどちらを使うか? これは正直な話、今は「Krisp」をお勧めする。Clear Edgeはメーカー側に直接交渉しないと使い続けることができないのだ。それに対してKrispは、ちゃんと有料プランもあるし、無料の場合も制約はあるが使い続けられる。WindowsとMacの両方に対応している点も、筆者的にはありがたい。

 Clear Edgeが「無償トライアル版」を公開しているにもかかわらず「PC用ソフトとして手軽に有料で使い続ける」仕組みがないのには理由がある。同社のビジネスモデルはあくまで「技術を他社に提供する」というB2Bモデルだからだ。実はKrispも同様。本命は個人向けではない。

 Krispはすでに、同社の技術を統合コミュニケーションサービス「Discord」に提供しており、「ノイズ抑制(ベータ)」として機能が搭載されている。

photo Discordの設定画面から。アプリそのものに組み込まれており、PCでもiOSでも、AndroidでもKrispのノイズキャンセルが使える

 この種の技術にはさまざまな企業が積極的に取り組んでおり、近いうちに当たり前の機能になるだろう、と予測している。

 例えば米Microsoftは、2020年3月、Microsoft Teamsに今後実装予定の機能として「ポテトチップスを食べる時に出る咀嚼(そしゃく)音や袋が立てる音をなくす」機能をアピールした。「いや会議中にポテチ食べるなよ」というツッコミはともかくとして、筆者もデモを見たが、きれいに消えている。

 この他にも同社は、屋外のノイズまみれの会話から「声だけを聞きやすくする」機能を発表済みだ。こうした機能を広く搭載していけば、「ノイズが邪魔になる」「ノイズ対策のために特別なマイクを使う」シーンは減っていくだろう。

 以下は、Microsoft 365の機能として公開された「Voice Enhance」機能に関するYouTube動画だ。

 PCで自ら設定するのは本命ではなく、おそらく各種サービスやアプリ、機器などに、この種の機能が搭載されていくのがこれからの姿だ。ヘッドフォンにおけるノイズキャンセルとは違う形で、処理能力を生かしたノイズキャンセルもしくは「特定音のエンハンス」という技術として、ここから急速に一般化してくるだろう。

 例えば、スマホのボイスレコーダーアプリにこの機能が搭載され、ノイズやタイプ音が消えた形で録音できるようになると便利ではないだろうか。あるいは、PCやスマホに標準で組み込まれ、音声通話品質を向上させる技術として活用されるとしたら?

 現状アプリが公開されているのは、そうした未来を売り込むためのテストケースのようなもの、と考えると分かりやすいだろうか。

Let's block ads! (Why?)



"キー" - Google ニュース
September 04, 2020 at 06:24AM
https://ift.tt/3bpUbGl

ビデオ会議からキータイプ音をなくせ! 「タイプ音除去アプリ」を試す - ITmedia
"キー" - Google ニュース
https://ift.tt/345Kg3K
Shoes Man Tutorial
Pos News Update
Meme Update
Korean Entertainment News
Japan News Update

No comments:

Post a Comment