機械学習は、Waseem Alshikh 氏が大学の教科書を読み進めるのに役立ちました。そして現在、彼は生成 AI を活用し、数百の企業向けのコンテンツを作成しています。
シリアで生まれ育った Alshikh 氏は英語が話せませんでしたが、ソフトウェアには堪能で、その才能はレバノンの大学に入学したときに役に立ちました。
「入学初日、大学から何冊もの教科書が配られました。それぞれが 1,000 ページもあり、すべて英語でした」と彼は回想します。
そこで彼は、書籍を要約する、粗雑ながら効果的な統計分類器であるプログラムを作成し、その要約を熟読しました。
コンセプトから会社へ
2014 年、彼はドバイで働いていたときに出会った起業家 May Habib 氏に、その時のエピソードを共有しました。2 人は、少ない労力でより多くのことを達成するよう常にプレッシャーをかけられているマーケティング部門が機械学習を使用し、ウェブ ページ、ブログ、広告などのコピーを迅速に作成可能にする、スタートアップの設立に至ったのです。
「当初、私たちのビジョンを実現するためのテクノロジはありませんでしたが、Transformer モデルの登場により、アイデアを形にすることができました」と、このスタートアップの CTOとなった Alshikh 氏は述べています。
「私たちは数人のエンジニアを見つけ、ほぼ 6 か月をかけて最初のモデルを構築しました。このニューラル ネットワークは、かろうじて機能し、約 1 億 2,800 万のパラメータを持っていました。」パラメータは、AI モデルの能力を測るのによく使われる尺度です。
その過程で、この若い企業はビジネス契約を獲得し、社名を Writer に変更、そして NVIDIA とのつながりを得ました。
スタートアップとしての加速
「NVIDIA NeMo を導入してからは、30 億、その後 200 億、そして今では 400 億のパラメータを備えた業界向けの強力なモデルを構築できるようになり、現在も拡張し続けています」と Alshikh 氏は述べています。
NeMo は、企業がトレーニング データセットをキュレーションし、大規模言語モデル (LLM) を構築およびカスタマイズし、本番環境で大規模に実行するのに役立つアプリケーション フレームワークです。韓国からスウェーデンに至るあらゆる組織が使用して、現地の言語や業界に合わせて LLM をカスタマイズしています。
「NeMo が登場する前は、新しい 10 億パラメータのモデルを構築するのに 4 か月半かかりました。今では 16 日以内にそれができるようになりました。これは驚くべきことです」と Alshikh 氏は語ります。
チャンスを切り拓くモデル
今年の最初の半年間で、20 名未満の AI エンジニアからなるこのスタートアップのチームは NeMo を使用して、それぞれ 300 億以上のパラメータを持つ 10 のモデルを開発しました。
これは大きなチャンスにつながります。現在、何百もの企業が、NeMo でカスタマイズされた金融、ヘルスケア、小売、その他の垂直市場向けの Writer のモデルを使用しています。
このスタートアップの顧客リストには、Deloitte、L’Oreal、Intuit、Uber などの著名な企業や、Fortune 500 にランクインする企業が含まれています。
NeMo による Writer の成功例は物語の始まりにすぎません。他にも数十の企業がすでに NeMo をダウンロードしています。
このソフトウェアは間もなく誰でも使用できるようになる予定です。これは、生成 AI ワークロードを加速するために最適化され、エンタープライズ グレードのサポート、セキュリティ、アプリケーション プログラミング インターフェイスの安定性によって支えられたフルスタック ソフトウェアである NVIDIA AI Enterprise の一部です。
1 か月あたり 1 兆回の API 呼び出し
一部の顧客は、独自のシステムまたはクラウド サービスで Writer のモデルを実行しています。他は Writer にモデルをホストするよう依頼するか、Writer の API を使用しています。
「基本的に 2 人のメンバーで管理している当社のクラウド インフラストラクチャは、月に 1 兆回の API 呼び出しをホストしています。毎秒 9 万ワードを生成していることになります」と Alshikh 氏は語っています。「私たちは、より大規模なチームとより大きな予算を持つ企業の製品と競合する高品質のモデルを提供しているのです」
Writer は、NeMo にパッケージ化されている Triton Inference Server を使用して、顧客向けの実稼働環境でモデルを実行しています。Alshikh 氏によると、LLM を実行する多くの企業で使用されている Triton は、代替のプログラムよりも小さいレイテンシと高いスループットを実現しています。
「これは、10 万ドルではなく 2 万ドルでサービスを実行できることを意味します。そのため、有意義な機能の構築により多くの投資を行うことができます」と彼は言います。
生成 AI における次のビジネス チャンス
Writer は、最先端のスタートアップを育成するプログラムである NVIDIA Inception のメンバーでもあります。「Inception のおかげで、私たちは NeMo に早期アクセスでき、必要なツールを見つけて使用するプロセスを指導してくれる素晴らしい人々とつながることができました」と Alshikh 氏は言います。
Writer のテキスト製品が注目を集めている今、フロリダとカリフォルニアの自宅を行き来する Alshikh 氏は、次に何が起こるかを模索しています。今日の生成 AI の幅広いフロンティアにおいて、彼は画像、オーディオ、ビデオ、3D、おそらくすべてにチャンスがあると考えています。
「私たちはマルチモダリティこそ未来だと考えています」と彼は言います。
NeMo を使い始めるには、こちらのページをご覧ください。さらにマルチモーダル NeMo の早期アクセス プログラムについては、こちらをご覧ください。