配信
2コメント2件(写真:PHILE WEB)
人のあるところに技術は生まれ、技術によりモノは形作られる。人と資源が集積する地ではそのペースが早まり、新しいモノを生み出す力はマグマのように蓄えられる...それが現在の深センだ。彼の地に拠点を置くエレクトロニクス企業は多く、しかも増加し続けている。かつてはトレンドを追う立場だったがいまや生み出す側、我々日本の消費者も “深センの現在” を見ずしてエレクトロニクス製品のトレンドは語れない。VOCPLUSのイメージ。「音のオブジェクト」を認識・処理してノイズを低減する本連載では、著者がチャットツール(微信/WeChat)で築き上げた人脈を駆使し、深センを中心としたエレクトロニクス分野のトレンド、気になる新技術・新製品を追う。昨今の情勢により渡航は難しいが、鮮度の高い情報をお届けする所存だ。■ファブレス企業も続々登場深セン市の人口は2019年末時点で1,343万人(※)と東京都に匹敵するが、改革開放路線により経済特区に指定された1980年と比べ、人口は約42倍と伸び率は桁違い。GDPもこの40年で1.4万倍(!)にまで増大した。隣接する東莞市や広東市、香港・マカオを含めた広域都市圏(グレーターベイエリア、粤港澳大湾区)の経済は、現在も驚くべき速度で成長している。(※参照:http://www.sz.gov.cn/cn/zjsz/gl/content/post_7979820.html)その深センはエレクトロニクス産業の一大集積地であり、世界中の企業が進出している。それは中国企業、特にざっくり「IT系」と括られる企業も同様で、小米科技(シャオミ)や百度(バイドゥ)のように日本でも高い知名度を持つ大企業、誕生したばかりのスタートアップ企業も、深センに拠点を構えているケースが多い。今回紹介する大象声科(深セン)科技有限公司も、そんな深センにある企業のひとつ。2017年設立のファブレス企業で、得意とするのは「インテリジェントな音声処理技術」。ELEVOC(エレボック)という彼らのブランド名に聞き覚えがあるかどうかはさておき、「VOCPLUS」という彼らの技術を採用した製品名を聞けば、どのような技術を売りにしているかピンとくるに違いない。たとえば、レノボのノートPC「YOGA Slim 9」、シャオミ「Mi 10 Lite」などのスマートフォンや、モトローラ「Boom3」といったワイヤレスヘッドセットにもVOCPLUSが採用されている。早い話が、音声通話時の環境雑音を機械学習/AIを応用した技術で取り除く、通話ノイズ低減技術だ。VOCPLUSに興味を持つきっかけとなったのが、VGP審査会のとき出会ったサウンドピーツの完全ワイヤレスイヤホン「Mini」。通話相手は相当騒がしいところにいるはずなのに、不思議なほど声がはっきり聞き取れるのだ。マイクの数はLRそれぞれ1基ずつとシンプルなのに、一体どうやって? と興味を抱いた。プレスリリースによれば、内蔵マイクが収集した音の解析と環境雑音やエコーの除去、ゲインコントロールをリアルタイムに行うことで、テレビ会議や通話相手の声を聞き取りやすくすることがVOCPLUSの役割というが、それ以上の情報はネット上を探しても見つからない。ならば、伝手を頼ってELEVOCの人に直接(WeChatで)話を聞こう、というわけだ。■AI/ディープラーニングによるノイズ低減話を訊いたのは、ELEVOCでアシスタントマネージャーを務める畢英哲(Liam Bi)氏。基本的なやり取りはWeChat、長くなりそうな質問はeメールと道具を使い分け質疑応答を行った。実際には中国語と英語のミックス、しかもチャットならではの軽いノリで進行しているが、雰囲気は伝わるだろうか?海上 まずは、VOCPLUSの実装について。Miniのどこに組み込まれているのですか?畢 VOCPLUSは純粋にソフトウェアですよ。コードはSoC上、SOUNDPEATS Miniの場合「Airoha 1562M」にソフトウェアモジュールとして組み込まれています。マイクで収集した音をチップ前段(SDK)で受け取り、内部のVOCPLUSモジュールで処理したあとSDKへ送り返す、という流れでノイズを取り除きます。海上 ANC(アクティブ・ノイズ・キャンセリング)におけるフィルタの働きと似ているような気がします。畢 ANCではマイクで集めたノイズの逆位相の信号を生成しますよね。一方VOCPLUSでは、ディープニューラルネットワークを用いたノイズキャンセリング、エコーキャンセリング、自動ゲインコントロールなどさまざまな技術やデータを組み合わせることで、通話時のクリアな音声を実現します。海上 ANCではノイキャンの効きとチップ性能には相関関係がありますが、同じことがVOCPLUSにもいえる?畢 そうですね、VOCPLUSの効果はチップの演算性能とメモリ容量に影響されます。ざっくりといえば、演算性能とメモリ容量が大きければ大きいほど、強力なアルゴリズムを展開してノイズ低減効果を得ることができます。海上 特定の周波数帯域ではノイズ低減効果を得やすい/得にくい、ということはありますか?畢 特定の周波数が得意/不得意ということはありません。VOCPLUSのアルゴリズムでは、特定の周波数帯をターゲットにするのではなく、ディープニューラルネットワークを利用して、その時々の音/周波数がノイズであるかどうかを判断し、ノイズと判断されれば除去するがそうでなければ残す、という方法で行われます。海上 なるほど。具体的には、どのような音が認識されるのですか?畢 VOCPLUSは、いわばノイズ低減の万能選手です。 膨大なデータをもとに学習したディープニューラルネットワークは、地中の騒音やロードノイズ、風切り音、ドアをノックする音、人が咳こむ音、犬の鳴き声、赤ちゃんの泣き声といった「非定常雑音」の低減に優位性を持ちます。日常生活で発生する雑音の多くはこれに分類されますから、効果は大きいですよ。■次回のテーマは「部品不足」これまでBluetoothイヤホンといえば、どのチップベンダーのSoCを採用しているか、どのコーデックに対応しているかは話題になっても、SoCに他社製ソフトウェアを組込むことで機能を付加する、というアプローチはあまり耳にしたことがない。しかし、チップ微細化技術の進展とそれに比例して進む高性能化・多機能化は、Bluetooth SoCも例外ではなく、用途もノイズキャンセルや立体音響などと広がっている。特に市場に勢いがあるTWSイヤホンは技術革新のペースが速いことから、今後はサードパーティのソフトウェア技術にも注目する必要がありそうだ。さて、次回は「部品不足」をテーマに、深センのスタートアップ企業に取材する予定。ご期待いただきたい。
海上 忍
最終更新:PHILE WEB