AIには、ByteDanceやPinduoduoのような新たな巨人を生み出すチャンスがあるのか?
例年と比べて、今年のWAICの特徴は、業界関係者が基盤となる大規模モデルの議論にとどまらず、より多くの垂直的なシナリオに向けたアプリケーション製品が登場したことです。これは、技術開発者の考え方がより明確になり、AIが一般の人々の生活にますます近づいていることを示しています。
2022年末のChatGPTのリリースからわずか1年半しか経っていません。Quwan Technologyの副社長兼最高戦略責任者である庄明浩氏は、1年前の議論がAIの言語とテキストへの応用に限られていたことを覚えています。しかし今では、画像、動画、音声、音楽などのマルチモーダル分野で人気製品が次々と登場し、新しい波の生命力を証明しています。
この競争の激しいAIの波の中で、スタートアップ企業も中小企業も、大手企業と同じ舞台で競争する機会を再び得ました - 10年以上前にモバイルインターネットが作り出した舞台のように。
庄氏は現在の混戦状況を「AIは起業家にとっては伏せ札、大手企業にとっては表向きの札」という言葉で表現しています。
「大手企業にとっては表向きの札」とは、今日すべての大手企業にとってAIに取り組むことは当然のことであり、既存のビジネスを強化するために必要不可欠で、計画的かつ段階的に行うべきことを指します。一方、「起業家にとっては伏せ札」とは、スタートアップ企業にとってAIの起業方向を判断することは、推測や推察に頼らざるを得ないことを意味します。
しかし、新世代の巨人は往々にして伏せ札の機会の中に隠れています。「2010年、大手企業がすべてワイヤレス化を進めていた時、数年後にPinduoduoやDouyin(TikTok)のような企業が現れるとは誰も想像していませんでした」と庄氏は言います。「表向きの札だけではゲームにならない、森があってこそ大木が育つ、複雑な生態系があってこそ優れた企業が生まれる」のです。
10年前、Quwan Technologyはその「伏せ札」を掴み、TTボイスをリリースしてモバイル音声市場の空白を埋めました。10年後、新たな表向きの札と伏せ札が交錯する時代に、Quwan Technologyがゲームテーブルに座る資格を持つ理由を、庄氏は3つ挙げています。
まず、Quwanがエンターテインメント等の垂直分野で10年間深く耕してきたことで、このシーンのエコシステムとユーザーを深く理解していることです。「私たちのようなビジネスを行う企業は、本質的にユーザーのシナリオを満たすために存在し、ユーザーの要求を満たし、常にユーザーのニーズに寄り添うことが、スタートアップ企業やビジネス企業の使命であり続けています」と庄氏は述べています。
次に、垂直モデルの研究開発において、Quwanが長期的に自社開発技術の蓄積と「他社にない」高品質なデータの蓄積に投資してきたことです。AI分野では、データの重要性がモデルよりもはるかに高く、独自のデータを持つ企業がより競争力を持つことになります。
最後に、Quwanは高い粘着性と高い活性度を持つ実験シナリオを有しています。前述のように、人気のある堅実な製品を持っているため、Quwanの革新的な技術は迅速に実験室を出て、ユーザーと市場の検証と洗練を受け、早期に「研究開発-効率向上-収益増加」の正の発展サイクルに入ることができます。
まず専門家になり、得意分野で新しい機会を見つける
2011年、モバイルインターネットの台頭時に、有名なベンチャーキャピタルのパートナーであるジョン・ドーアが「SoLoMo」の概念を提唱しました。これはSocial(ソーシャル)、Local(ローカル)、Mobile(モバイル)を意味します。この概念が提唱された時、多くの人々によってインターネットの将来の発展傾向として認識され、多くの企業の進むべき方向を示す標準的な答えとなりました。
現在の時点に戻ると、AIはまだ発展の初期段階にあり、皆が期待する標準的な答えはまだ現れていません。大手企業もスタートアップも、絶えず試行錯誤を重ね、取捨選択と駆け引きを行っており、多くのものが曖昧で混沌としています。しかし、一部の企業にとって、この「混沌」は深淵ではなく、むしろ階段なのです。
大手企業が汎用大規模モデルと大口顧客を「巻き込む」のに比べ、Quwan Technologyはより「ジェネラリスト思考を持つスペシャリスト」のようであり、垂直シナリオでの問題解決と新しい道筋を見つけることに長けています。これはQuwanの生来の強みと自信であり、すでに自らの能力を証明しています。
「現在、急速に進化する業界の状況と基盤となる大規模モデルの能力の迅速な反復は、エンジニアリング側やアプリケーション側の企業に課題をもたらしています」と庄氏は言います。これにより、大規模モデルに基づいて製品を形作る企業は常に「引きずられる」傾向があり、自社が改善を終えたばかりのときに底層モデルがまた変更され、サービスの安定性を保証するのが難しくなっています。
Quwan Technologyのアプローチは、自社が深く耕してきた音声とエンターテインメントのシナリオに基づいて、垂直的な「小」モデルを自社開発し、自ら訓練を行い、「製品とモデルの並行」発展パスを形成することです。「この分野では、このモデルが比較的安定していることを保証でき、底層の汎用大規模モデルの急速な反復がもたらす影響をあまり受けません」と庄氏は述べています。
現在までに、Quwan Technologyが自社開発した垂直大規模モデルは、音声、音楽、対話などの分野をカバーし、マルチモーダルな理解、生成、インタラクションにおいてより専門的で使いやすくなっています。以前に発表された「2024年中国AI業界大規模モデル企業競争力トップ100研究レポート」では、Quwanの大規模モデルもトップ100にランクインしています。
例えば、AI音楽の分野では、Quwan Technologyは世界初のマルチモーダル音楽作曲大規模モデルを自社開発しました。これはテキストから音楽を生成し、音声から音楽を生成し、さらには動画から音楽を生成する能力を持ち、AI作詞、自動作曲、編曲、ミキシングなどをサポートし、ユーザーの音楽創作の全プロセスの課題をワンストップで解決し、一般の音楽愛好家が本当にゼロから音楽を創作できるようにします。
AI音楽は、標準的な答えのない新しい分野です。「音楽界のChatGPT」と呼ばれるSunoが登場し、世界中の注目がこの小さな分野に集まったとき、Quwan Technologyはすでに何年も耕してきました。Quwan Technologyは、業界で最も早く音楽大規模モデルとAIネイティブアプリケーション製品を開発した企業の一つと言えるでしょう。
さらに、自社開発の生成型アクション大規模モデルと音声大規模モデルなどの技術に基づいて、Quwan Technologyはデジタルヒューマン、多言語翻訳などのワンストップの企業向けソリューションを開拓しました。これらは、サプライチェーンの上下流にあるゲーム会社やMCN機関のビデオコンテンツ制作、海外展開などのビジネスにサービスを提供するだけでなく、インテリジェントカスタマーサービス、ローカルライフ、映画・テレビ・観光などのシナリオにも適用され、兆単位の市場規模に影響を与え、中国電信などの有名企業とのパートナーシップを結んでいます。
ほぼすべての大型製品は、垂直的な人々から始まり、徐々に一般化して最終的に国民レベルの製品になります。AIはユーザー体験と産業エコシステムを構造的に変革し、垂直的なアプリケーションシナリオが育む広範なビジネスチャンスは言うまでもありません。
AIの「平等化」により、誰もが同じスタートラインに立つ資格を得ました。しかし、スタートアップ企業にとって、垂直産業で「製品とモデルの並行」を実現するというQuwanの道筋は、参考にはなるかもしれませんが、そのまま真似することはできません。結局のところ、データと業界のノウハウの蓄積が鍵であり、蓄積が長ければ長いほど障壁も高くなるからです。
「シンプルな公式」で確実性のアンカーを掴む
AI時代の大波が押し寄せる中、企業はどのように不確実性の中で確実性を掴むべきでしょうか?庄氏は、成功と失敗を決定するのは常に「正しい陳腐な言葉」であると考えています。それは「ユーザーのニーズに寄り添う」ということです。
「私たちの使命は常に、革新的な技術と製品を通じて、これまで満たされていなかったユーザーのニーズを解決することです」と庄氏は言います。技術がどのように進化し、資本環境がどのように変化し、X+AIを行うかAI Nativeを行うかに関わらず、この基本的なロジックは決して変わりません。
垂直大規模モデルの自社開発から、全スタックAIインタラクション技術産業エコシステムの構築まで。Quwan Technologyは常にユーザーのニーズから出発し、優先的に典型的な垂直シナリオをパイロットとしてブレークスルーを行い、成功後にその経験を他のシナリオに複製することで、AI転換における不確実性を低減しています。様々な「少し多めに行う」ことを通じて、ユーザーとクライアントの「少し安定」と「少し使いやすく」を実現しました。この一歩一歩の「愚直な方法」で、徐々に「一から二を生み、二から三を生む」という「シンプルな公式」を導き出しました。
同時に、一見すると万能に見えるAIに対して、Quwan Technologyは使用の「境界感」も強調しています。この境界には、AIとビジネスシナリオの融合の境界定義と、現段階でAIが技術的に何ができるかの境界理解の両方が含まれます。
「今年のWAIC大会は、10数年前にモバイルインターネット大会に参加した時の感覚を思い出させました」と庄氏は言います。当時の北京の鳥の巣スタジアム近くの巨大な展示ホールの雰囲気は、今のWAICが上海で引き起こしている人々の熱狂と同じです。
より厳しい競争環境に直面して、Quwan Technologyはすでに垂直分野で一定の障壁と優位性を確立し、AI時代の大波に乗るチケットを優先的に手に入れています。来年、AIの先駆者たちは何か新しいものをもたらすでしょうか?企業はどのようにしてより多くの「弾薬」を蓄えるべきでしょうか?
庄氏は、AI業界が1、2年以内に勝負の分かれ目を迎えると信じています。そして今、私たちは暗い森の中を歩いているようなものです。森のある場所で松明を灯しても、周りの範囲しか照らせません。しかし、ゆっくりと進んでいくと、微かな光のある場所が見えてきて、より多くの仲間を発見し、最終的にこれらの光をつなげて、共に新しい世界を迎えることができるのです。