Inteligência Artificial: Há oportunidade de recriar ByteDance ou Pinduoduo?
Em comparação com anos anteriores, a característica da WAIC deste ano é que os profissionais não se limitam mais à discussão de modelos básicos de grande escala, mas surgiram mais produtos de aplicação voltados para cenários verticais. Isso representa que o pensamento dos pesquisadores e desenvolvedores está se tornando cada vez mais claro, e a IA está se aproximando cada vez mais da vida das pessoas comuns.
Desde o lançamento do ChatGPT no final de 2022, passou-se apenas um ano e meio. Zhuang Minghao, vice-presidente e diretor de estratégia da Qufan Technology, lembra que há um ano as discussões ainda estavam limitadas às aplicações de IA em linguagem e texto, mas agora, imagens, vídeos, áudio, música e outros setores multimodais estão produzindo sucessos frequentes, provando a vitalidade da nova onda.
Nesta onda de IA em que milhares de empresas competem, tanto startups quanto pequenas e médias empresas têm mais uma vez a oportunidade de competir com gigantes - assim como a arena criada pela internet móvel há mais de uma década.
Zhuang Minghao resume a situação atual de competição com a frase "A IA é uma carta oculta para empreendedores e uma carta aberta para grandes empresas".
A chamada "carta aberta para grandes empresas" significa que para todas as grandes empresas, fazer IA hoje é uma obrigação, algo que deve ser feito para capacitar os negócios existentes e que está sendo feito de forma planejada e ritmada. Já a "carta oculta para empreendedores" refere-se ao fato de que para startups, determinar a direção do empreendedorismo em IA é algo que depende de adivinhação e especulação.
No entanto, a nova geração de gigantes geralmente está escondida nas oportunidades de jogar com cartas ocultas. "Em 2010, quando as grandes empresas estavam fazendo transformações sem fio em seus negócios, ninguém imaginaria que em poucos anos surgiriam empresas como Pinduoduo e Douyin", disse Zhuang Minghao. "Apenas cartas abertas não formam um jogo, é preciso uma floresta para ter árvores gigantes, e um ecossistema complexo para ter empresas excelentes".
Há dez anos, a Qufan Technology pegou aquela "carta oculta" e lançou o TT Voice, quebrando o vazio no mercado de voz móvel. Dez anos depois, em um novo momento de cartas abertas e ocultas se entrelaçando, por que a Qufan Technology tem a qualificação para se sentar à mesa de jogo? Zhuang Minghao deu três razões.
Primeiro, a Qufan já está profundamente enraizada em áreas verticais como entretenimento geral há dez anos, com uma compreensão profunda do ecossistema e dos usuários desse cenário. "Nós, empresas que fazemos negócios, essencialmente estamos fazendo isso para atender aos cenários dos usuários, satisfazer as demandas dos usuários, sempre próximos às necessidades dos usuários, que é a missão contínua das startups e empresas de negócios", disse Zhuang Minghao.
Em segundo lugar, no desenvolvimento de modelos verticais, a Qufan tem acumulado tecnologia de pesquisa e desenvolvimento própria de longo prazo e dados de alta qualidade "que outros não têm". No campo da IA, a importância dos dados é muito maior do que a dos modelos, e as empresas com dados exclusivos terão mais vantagens competitivas.
Por fim, a Qufan possui cenários de teste altamente adesivos e ativos. Como mencionado anteriormente, devido a produtos sólidos e populares, as tecnologias inovadoras da Qufan podem sair rapidamente dos laboratórios, ser testadas e polidas por usuários e mercados, entrando precocemente no ciclo positivo de "desenvolvimento - aumento de eficiência - aumento de receita".
Primeiro torne-se um especialista, depois encontre novas oportunidades em sua área de expertise
Quando a internet móvel surgiu em 2011, John Doerr, sócio de uma famosa empresa de capital de risco, propôs o conceito "SoLoMo", que significa Social (social), Local (localização) e Mobile (móvel). Quando esse conceito foi proposto, foi amplamente reconhecido como a tendência futura de desenvolvimento da internet, tornando-se a resposta padrão para orientar muitas empresas.
Voltando ao momento atual, a IA ainda está em estágio inicial de desenvolvimento, e aquela resposta padrão que todos esperam ainda não surgiu. Sejam grandes empresas ou startups, todas estão constantemente tentando, explorando, escolhendo e competindo, e muitas coisas ainda estão em um estado confuso e nebuloso. Mas para algumas empresas, essa "confusão" não é um abismo, mas sim uma escada.
Comparada às grandes empresas que "se esforçam" em modelos gerais de grande escala e grandes clientes, a Qufan Technology é mais como um "especialista com mentalidade generalista", sendo mais hábil em resolver problemas difíceis e encontrar novos caminhos em cenários verticais. Esta é a vantagem inata e a confiança da Qufan, e ela já provou sua capacidade.
"O estado de rápida evolução da indústria e a rápida iteração das capacidades dos modelos básicos de grande escala trouxeram desafios para as empresas que trabalham na engenharia e nas aplicações", disse Zhuang Minghao. Isso faz com que as empresas que moldam produtos baseados em grandes modelos sejam frequentemente "arrastadas", muitas vezes mal terminam de fazer ajustes e o modelo subjacente muda novamente, tornando difícil garantir a estabilidade do serviço.
A abordagem da Qufan Technology é desenvolver "pequenos" modelos verticais baseados em seus cenários de voz e entretenimento geral nos quais tem se aprofundado, fazendo seu próprio treinamento e formando um caminho de desenvolvimento "paralelo de produto e modelo". "Nesta área, podemos garantir que este modelo é relativamente estável e não será particularmente afetado pelo impacto da rápida iteração dos grandes modelos gerais subjacentes", disse Zhuang Minghao.
Até o momento, os modelos verticais de grande escala desenvolvidos pela Qufan Technology já cobrem áreas como áudio, música e diálogo, sendo mais especializados e úteis na compreensão, geração e interação multimodal. No "Relatório de Pesquisa sobre a Competitividade das 100 Principais Empresas de Modelos de Grande Escala na Indústria de Inteligência Artificial da China 2024" publicado anteriormente, o grande modelo da Qufan também se classificou entre os 100 melhores.
Por exemplo, na área de música AI, a Qufan Technology desenvolveu o primeiro grande modelo multimodal de composição musical do mundo, com capacidades de geração de música a partir de texto, áudio e até vídeo, suportando composição de letras por IA, composição automática, arranjo, mixagem e outros, podendo resolver de forma abrangente os desafios de todo o processo de criação musical para usuários comuns, permitindo que entusiastas musicais comuns realmente criem música sem barreiras.
A música AI é uma nova pista sem respostas padrão. Quando o Suno, o "ChatGPT do mundo da música", surgiu repentinamente e a atenção de todo o mundo se voltou para este pequeno setor, a Qufan Technology já estava cultivando há muitos anos. Pode-se dizer que a Qufan Technology também é uma das primeiras empresas do setor a desenvolver grandes modelos de música e produtos de aplicação nativos de IA.
Além disso, com base em tecnologias como seu grande modelo generativo de ação e grande modelo de áudio desenvolvidos internamente, a Qufan Technology desenvolveu soluções empresariais completas como humanos digitais e tradução multilíngue. Além de servir aos fabricantes de jogos, agências MCN para criação de conteúdo de vídeo, negócios internacionais e outros em sua cadeia industrial, também é aplicado em cenários como atendimento ao cliente inteligente, vida local, filmes e turismo cultural, irradiando um tamanho de mercado de trilhões, com parceiros incluindo empresas renomadas como China Telecom.
Quase todos os grandes produtos começam com um grupo vertical e depois se generalizam gradualmente até se tornarem produtos nacionais. E a IA mudará estruturalmente a experiência do usuário e o ecossistema industrial, com as amplas oportunidades de negócios incubadas em cenários de aplicação vertical sendo evidentes.
A "democratização" da IA dá a todos a qualificação para estar na mesma linha de partida. Mas para startups, o caminho da Qufan de fazer "produto e modelo em paralelo" em indústrias verticais pode ser referência, mas não pode ser copiado rigidamente, afinal, o acúmulo de dados e know-how da indústria é fundamental, quanto mais longo o acúmulo, mais altas as barreiras.
Use uma "fórmula simples" para capturar a âncora da certeza
Na era da IA, como as empresas podem capturar a certeza em meio à incerteza? Zhuang Minghao acredita que o que determina o sucesso ou o fracasso é sempre um "clichê correto", que é "estar próximo às necessidades do usuário".
"Nossa missão sempre foi resolver as necessidades não atendidas dos usuários por meio de tecnologia e produtos inovadores", disse Zhuang Minghao. Independentemente de como a tecnologia evolua, como o ambiente de capital mude, fazendo X+AI ou AI Native, essa lógica subjacente nunca mudará.
Do desenvolvimento de grandes modelos verticais à construção de um ecossistema industrial de tecnologia de interação AI de pilha completa. A Qufan Technology sempre insistiu em partir das necessidades do usuário, priorizando cenários verticais típicos como pilotos para avanços, e então replicando experiências bem-sucedidas para outros cenários após o sucesso do piloto, reduzindo assim a incerteza na transformação AI. Através de vários "fazer um pouco mais", alcançou "um pouco mais estável" e "um pouco mais útil" para usuários e clientes. Usando esse método "tolo" passo a passo, gradualmente chegou a uma "fórmula simples" de um gera dois, dois geram três.
Ao mesmo tempo, diante da IA que parece onipotente, a Qufan Technology também enfatiza o "senso de limite" no uso. Esse limite inclui tanto a definição do limite da integração da IA com cenários de negócios, quanto a compreensão do limite do que a IA pode fazer tecnicamente no estágio atual.
"A conferência WAIC deste ano me lembrou da sensação de participar de conferências de internet móvel há mais de dez anos", disse Zhuang Minghao. A atmosfera no enorme salão de exposições ao lado do Ninho de Pássaro em Pequim na época é idêntica ao estado de multidões que a WAIC está causando em Xangai agora.
Diante de um ambiente competitivo ainda mais cruel, a Qufan Technology já estabeleceu certas barreiras e vantagens em áreas verticais, obtendo prioritariamente o ingresso para acompanhar a grande onda da era da IA. O que os pioneiros da indústria de IA trarão de novo no próximo ano? Como as empresas podem armazenar mais "munição"?
Zhuang Minghao acredita que a indústria de IA testemunhará um momento decisivo em um ou dois anos. E agora, somos como caminhantes em uma floresta escura, você acende uma tocha em algum lugar da floresta, só pode iluminar a área ao redor, mas conforme avança lentamente, verá alguns lugares com luz fraca, descobrirá mais semelhantes, até que essas luzes se conectem, dando as boas-vindas juntas a um mundo totalmente novo.