¿Tiene la inteligencia artificial la oportunidad de recrear ByteDance o Pinduoduo?
En comparación con años anteriores, la característica de WAIC este año es que los profesionales ya no se limitan a discutir sobre modelos básicos a gran escala, sino que han surgido más productos de aplicación orientados a escenarios verticales. Esto representa que el pensamiento de los desarrolladores técnicos se ha vuelto cada vez más claro, y la IA se está acercando cada vez más a la vida de las personas comunes.
Desde el lanzamiento de ChatGPT a finales de 2022 hasta ahora, solo ha pasado un año y medio. Zhuang Minghao, vicepresidente y director de estrategia de Qufan Technology, recuerda que hace un año las discusiones aún se limitaban a las aplicaciones de IA en lenguaje y texto, pero ahora, los éxitos frecuentes en los sectores multimodales como imágenes, videos, audio y música demuestran la vitalidad de la nueva ola.
En esta ola de IA donde compiten miles de empresas, tanto las startups como las empresas pequeñas y medianas han obtenido una vez más la oportunidad de competir en el mismo escenario que las gigantes, al igual que la plataforma creada por el internet móvil hace más de una década.
Zhuang Minghao resume la situación actual de batalla con la frase "la IA es una carta oculta para los emprendedores y una carta visible para las grandes empresas".
La llamada "carta visible para las grandes empresas" se refiere a que para todas las grandes empresas, hacer IA hoy es una obligación, algo que deben hacer para potenciar sus negocios existentes y que tienen planes y ritmos para hacerlo; mientras que "carta oculta para los emprendedores" se refiere a que para las startups, juzgar la dirección de emprendimiento en IA es algo que requiere adivinar y especular.
Sin embargo, la nueva generación de gigantes a menudo se esconde en las oportunidades de jugar con cartas ocultas. "En 2010, cuando las grandes empresas estaban haciendo transformaciones inalámbricas en sus negocios, nadie habría imaginado que unos años después surgirían empresas como Pinduoduo y Douyin", dijo Zhuang Minghao. "Solo con cartas visibles no se forma un juego de cartas, se necesita un bosque para tener árboles altos, y se necesita un ecosistema complejo para tener empresas excelentes".
Hace diez años, Qufan Technology aprovechó esa "carta oculta" y lanzó TT Voice, rompiendo el vacío en el mercado de voz móvil. Diez años después, en este nuevo momento de entrelazamiento de cartas visibles y ocultas, ¿por qué Qufan Technology tiene la calificación para sentarse a la mesa de juego? Zhuang Minghao dio tres razones.
En primer lugar, Qufan ha estado profundizando en áreas verticales como el entretenimiento general durante diez años, con una comprensión profunda del ecosistema y los usuarios en este escenario. "Nosotros, las empresas que hacemos negocios, esencialmente lo hacemos para satisfacer los escenarios de los usuarios, satisfacer las demandas de los usuarios, siempre cerca de las necesidades de los usuarios, esta ha sido siempre la misión de las startups y las empresas de negocios", dijo Zhuang Minghao.
En segundo lugar, en el desarrollo de modelos verticales, Qufan tiene una acumulación tecnológica de investigación y desarrollo a largo plazo y una acumulación de datos de alta calidad que "otros no tienen". En el campo de la IA, la importancia de los datos es mucho mayor que la de los modelos, y las empresas que poseen datos únicos tendrán una ventaja competitiva.
Por último, Qufan tiene escenarios de prueba de alta adherencia y alta actividad. Como se mencionó anteriormente, debido a que tiene productos sólidos y populares, las tecnologías innovadoras de Qufan pueden salir rápidamente del laboratorio, ser probadas y pulidas por usuarios y mercados, y entrar temprano en el ciclo de desarrollo positivo de "investigación y desarrollo - mejora de eficiencia - aumento de ingresos".
Primero conviértete en un experto, busca nuevas oportunidades en tu área de especialización
Cuando surgió el internet móvil en 2011, John Doerr, socio de una famosa empresa de capital de riesgo, propuso el concepto de "SoLoMo", es decir, Social (social), Local (localización) y Mobile (móvil). Cuando se propuso este concepto, fue ampliamente reconocido como la tendencia futura del desarrollo de internet y se convirtió en la respuesta estándar que guió el avance de muchas empresas.
Volviendo al punto actual en el tiempo, la IA todavía está en una etapa temprana de desarrollo, y esa respuesta estándar que todos esperan aún no ha aparecido. Tanto las grandes empresas como las startups están constantemente probando y explorando, sopesando y compitiendo, y muchas cosas todavía están en un estado confuso y borroso. Pero para algunas empresas, este tipo de "caos" no es un abismo, sino precisamente una escalera.
En comparación con las grandes empresas que se "enrollan" en modelos generales a gran escala y grandes clientes, Qufan Technology es más como un "experto con mentalidad generalista", más hábil en resolver problemas y encontrar nuevos caminos en escenarios verticales. Esta es la ventaja innata y la confianza de Qufan, y ya ha demostrado su capacidad.
"El rápido estado evolutivo de la industria actual y la rápida iteración de las capacidades de los modelos básicos a gran escala han traído desafíos a las empresas que hacen ingeniería y aplicaciones", dijo Zhuang Minghao. Esto hace que las empresas que dan forma a productos basados en modelos a gran escala a menudo sean "arrastradas", y a menudo cuando acaban de hacer mejoras, el modelo subyacente cambia nuevamente, lo que dificulta garantizar la estabilidad del servicio.
El enfoque de Qufan Technology es desarrollar "pequeños" modelos verticales basados en sus escenarios de voz y entretenimiento general en los que ha profundizado, hacer su propio entrenamiento y formar una ruta de desarrollo "paralelo de productos y modelos". "En este campo, podemos garantizar que este modelo es relativamente estable y no se verá particularmente afectado por el rápido impacto iterativo de los modelos generales subyacentes", dijo Zhuang Minghao.
Hasta ahora, los modelos verticales a gran escala desarrollados por Qufan Technology ya cubren áreas como audio, música y diálogo, y son más especializados y útiles en comprensión, generación e interacción multimodal. En el "Informe de investigación sobre la competitividad de las 100 principales empresas de modelos a gran escala en la industria de inteligencia artificial de China 2024" publicado anteriormente, el modelo a gran escala de Qufan también se ubicó entre los 100 mejores.
Por ejemplo, en el campo de la música de IA, Qufan Technology ha desarrollado el primer modelo multimodal de música de acompañamiento a gran escala del mundo, con capacidades de generación de música a partir de texto, generación de música a partir de audio e incluso generación de música a partir de video, que admite composición de letras de IA, composición automática, arreglos, mezcla, etc., y puede resolver de manera integral los problemas de todo el proceso de creación musical para los usuarios, permitiendo que los aficionados a la música comunes realmente logren crear música sin barreras.
La música de IA es un nuevo campo sin respuestas estándar. Cuando Suno, el "ChatGPT del mundo de la música", apareció de repente y atrajo la atención de todo el mundo hacia este pequeño sector, Qufan Technology ya había estado trabajando en él durante años. Se puede decir que Qufan Technology también es una de las primeras empresas de la industria en desarrollar modelos de música a gran escala y productos de aplicación nativos de IA.
Además, basándose en tecnologías como sus modelos de acción generativa a gran escala y modelos de audio a gran escala, Qufan Technology ha desarrollado soluciones empresariales integrales como personas digitales inteligentes y traducción multilingüe. Además de servir a los fabricantes de juegos upstream y downstream de su cadena industrial, la creación de contenido de video de instituciones MCN y negocios en el extranjero, también se ha aplicado en escenarios como servicio al cliente inteligente, vida local, cine y turismo, cubriendo un tamaño de mercado de billones de yuanes, con socios que incluyen empresas conocidas como China Telecom.
Casi todos los grandes productos comienzan con un grupo vertical y luego se generalizan gradualmente hasta convertirse en productos nacionales. Y la IA cambiará estructuralmente la experiencia del usuario y el ecosistema industrial, y las amplias oportunidades comerciales que se incuban en escenarios de aplicación vertical son evidentes.
La "democratización" de la IA da a todos la calificación para estar en la misma línea de salida. Pero para las startups, este camino de Qufan de lograr "productos y modelos en paralelo" en industrias verticales puede ser una referencia pero no se puede copiar directamente, después de todo, la acumulación de datos y know-how de la industria es clave, cuanto más tiempo se acumule, más alta será la barrera.
Usa una "fórmula simple" para capturar el ancla de la certeza
En la era de la IA, las empresas se tamizarán, ¿cómo pueden capturar la certeza en la incertidumbre? Zhuang Minghao cree que lo que determina el éxito o el fracaso siempre es una "palabrería correcta", que es "estar cerca de las necesidades del usuario".
"Nuestra misión siempre ha sido resolver las necesidades insatisfechas de los usuarios a través de tecnología y productos innovadores", dijo Zhuang Minghao. No importa cómo evolucione la tecnología, cómo cambie el entorno de capital, si se hace X+IA o IA nativa, esta lógica subyacente nunca cambiará.
Desde el desarrollo de modelos verticales a gran escala hasta la construcción de un ecosistema industrial de tecnología de interacción de IA de pila completa. Qufan Technology siempre ha insistido en partir de las necesidades del usuario, dando prioridad a escenarios verticales típicos como pilotos para lograr avances, y luego replicando las experiencias exitosas en otros escenarios después del éxito del piloto, reduciendo así la incertidumbre en la transformación de la IA. A través de varios "hacer un poco más", se logra que los usuarios y clientes sean "un poco más estables" y "un poco más fáciles de usar". Usando este método "tonto" paso a paso, gradualmente se llega a una "fórmula simple" de uno genera dos, dos generan tres.
Al mismo tiempo, frente a la IA que parece omnipotente, Qufan Technology también enfatiza el "sentido de límite" en su uso. Este límite incluye tanto la definición del límite de la integración de la IA con escenarios comerciales, como la comprensión del límite de lo que la IA puede lograr técnicamente en la etapa actual.
"La conferencia WAIC de este año me recuerda la sensación de participar en conferencias de internet móvil hace más de diez años", dijo Zhuang Minghao. La atmósfera en el enorme pabellón de exposiciones junto al Nido de Pájaro de Beijing en ese entonces es idéntica al estado de miles de personas que abarrotan las calles provocado por WAIC en Shanghai ahora.
Frente a un entorno competitivo aún más cruel, Qufan Technology ya ha establecido ciertas barreras y ventajas en campos verticales, obteniendo primero el boleto para subirse a la gran ola de la era de la IA. ¿Qué novedades traerán los pioneros de la industria de la IA el próximo año? ¿Cómo pueden las empresas almacenar más "municiones"?
Zhuang Minghao cree que la industria de la IA verá un momento decisivo en uno o dos años. Y ahora, somos como caminantes en un bosque oscuro, enciendes una antorcha en algún lugar del bosque, solo puedes iluminar el área circundante, pero a medida que avanzas lentamente, verás que hay lugares con luz tenue, descubrirás más semejantes, hasta que conectes estas luces y juntos demos la bienvenida a un mundo completamente nuevo.