Soraの登場に伴い、テキストから動画を生成するモデルが中国のテクノロジー企業間の新たな競争の焦点となっています。快手が発表した「可灵」AIモデルはSoraと類似のアプローチを採用し、最大2分間の高画質動画を生成できます。現在、100万人以上がベータテストに申し込んでいます。智谱AI、テンセント、ByteDanceなど他の企業も追随し、独自のテキストから動画生成モデルを発表しています。
可灵AIは公開から2ヶ月足らずで3回の更新を経験し、細部の生成、構図、カメラワークなどの面で大幅な改善が見られました。1080p解像度で最長2分間の動画を生成できる性能は、市場の大半の同種製品を上回っています。ユーザーからの評価は概ね良好で、その効果は「期待をはるかに超える」と評されています。
快手のCEO程一笑は昨年から新たなAI戦略を開始しました。今年3月のプロジェクト立ち上げから6月の公開まで、可灵AIはわずか3ヶ月で開発を完了しました。これは快手のリソース集中と技術革新の結果であり、Sora類似の技術アプローチと自社開発技術の組み合わせが含まれています。
各大手テクノロジー企業がテキストから動画生成分野に参入する理由は、巨大な市場需要が存在することと、大規模モデルの実用化による商業価値の創出を目指すためです。快手が先行できた主な要因は、膨大な動画データの蓄積、NVIDIAとのハードウェア協力、そして会社の全面的な支援です。
しかし、テキストから動画生成分野の技術格差はそれほど大きくなく、今後は主に計算能力の規模とトレーニングデータで競争することになります。快手は計算能力面で最強ではないため、今後も継続的にリードできるかは不透明です。現在、中国企業は一般的に「まず製品を作り、その後最適化する」戦略を採用し、市場シェアの獲得を目指しています。
可灵AIのユーザー急増は、ユーザーの好奇心と快手プラットフォームのトラフィック支援によるものです。現在、可灵AIは有料会員制度を導入し、商業化の試みを開始しています。将来的に快手は可灵AIを通じてコンテンツエコシステムを構築し、クリエイターに力を与え、プラットフォーム全体のコンテンツ品質を向上させることを目指しています。
総じて、テキストから動画生成モデルはAI分野の新たな競争の焦点となっており、各社が参入しています。快手は可灵AIで一時的にリードしていますが、今後の競争は激しさを増すでしょう。この技術はコンテンツ制作に革命的な変化をもたらす可能性があり、継続的な注目に値します。