翻訳の支援: 推論のブレイクスルーによる iFLYTEK 音声アプリケーションの強化

投稿者: Jamie Beckett

少なくとも「宇宙大作戦」 (「スタートレック」シリーズの最初のテレビ ドラマ) が放映されていた頃から、人々はポケットサイズのインスタント翻訳機があったらどんなにいいかと夢見てきました。また、あの読みづらい医師のカルテをさっと解読できればいいのにという思いもずっと昔からありました。

ディープラーニング推論の進化のおかげで、中国最大の技術企業の 1 つである iFLYTEK (本社合肥) は、これら 2 つに対応する実際的なソリューションを実現しました。ここで活躍するのがトレーニングを受けたニューラル ネットワークです。推論することにより、学習を重ねてあらゆるタスクを実行します。

音声の翻訳

iFLYTEK のポータブル翻訳機は、その名のとおりコンパクトな携帯機器で、話された言葉を聞き取って別の言語に翻訳します。

ほぼリモコンのサイズで、GPU アクセラレーションに対応したこの機器では、NVIDIA の Tesla P4 と P40 のトレーニング/推論アクセラレータと iFLYTEK の高度な翻訳アルゴリズムにより、中国語、英語、ウイグル語がリアルタイムに翻訳されます。

iFLYTEK のクラウド コンピューティング研究所副所長であるシコウ チャン (Zhijiang Zhang) 氏は、次のように述べています。「ポケット内にプロの通訳がいるようなものです。これはいつでもどこでも必要なときに、言語の壁を超えるために役立ちます。」

推論効率が 15 倍向上

Tesla P4 と P40 の GPU アクセラレータを利用することにより、iFLYTEK の音声クラウド プラットフォームの音声認識精度は 97% に達し、その推論効率は CPU で実現した数値よりも 15 倍向上しました、とチャン氏は言います。iFLYTEK は、これらのブレイクスルーによって、新しいビジネス アプリケーションとビジネス モデルを実現できると予想しています。

iFLYTEK によると、3 月に発売されて以来、このポータブル翻訳機は 97 か国で販売され、200 万回を超えるサービスを提供しました。

AI を利用したスマート医療

iFLYTEK が取り組んでいることは、翻訳だけではありません。複数の中国の病院や医療機関と協力して、音声テクノロジと AI の専門知識を組み合わせ、医師と患者のための医療のスマート化に取り組んでいます。

医師の手書きのメモや処方を苦心して読み取る必要はなくなります。これからは、医師が情報を口述するだけで、iFLYTEK のテクノロジにより、その音声が電子カルテに自動変換されます。


iFLYTEK 音声クラウドによって、医師が走り書きしていた内容が、読み取り可能な文字へと変わります

FLYTEK によると、Tesla P4 アクセラレータを搭載した iFLYTEK 音声クラウド上に配備されるインテリジェント音声認識によって、不要情報が排除され、医療データがテキストにすばやく変換されます。中国語の音声認識精度は 97% です。

iFLYTEK は、クラウドで大量データ処理を行う音声クラウド プラットフォームを利用して、IFlyDictation、iFLYTEK Voice Touch、Lingxi Voice Assistant など、多数のインテリジェント音声サービスの提供を開始しました。この音声クラウド プラットフォームのユーザーは 15 億人を超え、1 日当たりのサービス実行回数は 40 億回に達しています。

「iFLY 音声クラウドの継続的なアップグレードとアプリケーション範囲の拡大に伴って、NVIDIA のディープ ラーニング GPU プラットフォームは iFLYTEK を技術面で後押ししてきました。これにより、速やかに最新のテクノロジの恩恵をユーザーに提供し、ユーザー エクスペリエンスを改善してきたのです。」とチャン氏は述べています。

iFLYTEK の詳細については、シリコン バレーで 3 月 26 日 ~ 29 日に開催される NVIDIA の GPU テクノロジ カンファレンスにご参加ください。iFLYTEK Healthcare の CEO であるショウトウ タオ (Xiaodong Tao) 氏が、医師を支援するために AI と音声認識テクノロジの研究にどのように取り組んでいるかを説明します。今すぐご登録ください