Tantos plugins de IA, de onde eles surgiram?
"Há muita IA, não consigo acompanhar." Essa sensação de ansiedade não é infundada. O lado da oferta realmente explodiu, com um aumento de 59,3% no número de projetos de IA no GitHub em 2023; o número de desenvolvedores na comunidade de IA de código aberto Hugging Face quadruplicou.
A a16z compilou estatísticas sobre o uso de produtos de IA baseados na web pelos usuários. Entre os 50 principais produtos, 28% pertencem à categoria de geração de conteúdo (incluindo texto, imagem, vídeo, música), 22% são para edição de conteúdo, 14% são ferramentas de produtividade e 10% são assistentes de inteligência geral (como ChatGPT, Claude, etc.). No mobile, é diferente, os usuários tendem a preferir assistentes gerais (com uma interface de chat de IA na tela inicial).
Os produtos web são adequados para fluxos de trabalho mais complexos e de várias etapas. Na categoria de produtividade, seis dos sete produtos oferecem extensões para o navegador Chrome, ou até existem apenas como extensões. A lógica por trás das extensões é a "execução síncrona", não exigindo que os usuários saiam do software que estão usando, reduzindo significativamente a fricção de alternar entre várias páginas da web ou aplicativos.
A IA deve ser projetada para estar o mais próxima possível do usuário, preferencialmente integrada ao ambiente de uso. Esta é uma premissa para que a IA seja bem utilizada.
No entanto, os desenvolvedores não se contentam em simplesmente incorporar a tecnologia nos processos do produto. As aplicações de IA evoluem rapidamente, mas têm ciclos de vida curtos. O top 50 da a16z mudou 40% de novos rostos em apenas seis meses. A QuestMobile aponta que as taxas de atividade de aplicativos de IA generativa na China estão todas abaixo de 20%, a retenção de três dias está abaixo de 50%, e as taxas de desinstalação de alguns aplicativos estão acima de 50%.
Algumas aplicações de IA passaram de necessitar abrir uma página web para usar, para se tornarem produtos de extensão que acompanham constantemente, numa tentativa de implementação de uma forma mais leve. Os navegadores ainda são uma importante porta de entrada de tráfego, e a pesquisa é uma das necessidades mais universais e frequentes da internet. Estas extensões estão competindo por território na interface do navegador, tentando se posicionar como "pontos de entrada", para resolver o problema do crescimento de usuários.
As extensões (já) foram reis
Em 2008, o Chrome era apenas um novato em comparação com o Internet Explorer, que detinha 60% da participação global. Mas seu crescimento foi impressionante - de 5% em 2009, 15% em 2010, para 31% em 2012... O ecossistema aberto criado pelo Google contrastava fortemente com a abordagem fechada da Microsoft na época. As extensões (plugins) desempenharam um papel crucial nisso.
Dentro de uma estrutura de desenvolvimento estabelecida, os desenvolvedores terceiros podiam implementar funcionalidades com um mínimo de trabalho de desenvolvimento. Cada vez mais desenvolvedores foram atraídos, criando funcionalidades ricas que abriram as "limitações" do navegador. Os usuários estavam navegando na web, mas não apenas visualizando páginas - por exemplo, uma extensão chamada "Netflix Party is now Teleparty", projetada para serviços de streaming como Netflix e Hulu, permitia que as pessoas assistissem e discutissem em uma janela flutuante. Um usuário comentou na seção de avaliações da extensão, agradecendo ao desenvolvedor por salvar um casal em um relacionamento à distância.
Essas extensões, semelhantes a mods funcionais em jogos, podem oferecer melhores modos de leitura, modo escuro, aceitar automaticamente todos os pedidos de cookies, melhores modos de reprodução de vídeo... Realmente considerando a perspectiva do usuário.
As extensões do navegador acompanharam a prosperidade da internet para PC. A internet móvel desviou grande parte da atenção dos usuários, afetando algumas extensões leves que subsequentemente se "transformaram em aplicativos". Por exemplo, "Simpread" começou apenas como uma extensão para "gerar páginas formatadas adequadas para leitura em chinês", mas gradualmente se tornou mais robusta, integrando funções como anotação, leitura posterior, exportação, e posteriormente lançou um aplicativo independente.
Enquanto os aplicativos móveis tentavam capturar o máximo possível da atenção do usuário, também erguiam altos muros. Foi então que as pessoas perceberam que as extensões eram a melhor nota de rodapé para o "espírito da internet", e também seu último brilho.
Isso não é tão simples quanto colar cartazes em postes de luz
Em 2019, a empresa de segurança Extension Monitor realizou uma pesquisa sobre 180.000 extensões na Chrome Web Store e descobriu que as categorias mais comumente usadas pelas pessoas incluíam: bloqueadores de anúncios, comunicação, compras, segurança, gerenciadores de senhas, etc., com predominância de extensões funcionais.
Sobre o desenvolvimento de aplicações de IA generativa para o consumidor final, sempre houve uma discussão: com a iteração tão rápida dos grandes modelos, quando uma tecnologia de base mais forte surgir, ela substituirá o "enfeite" existente nas aplicações de nível superior? É um desafio para o desenvolvimento de software, se é possível deixar de lado o fardo do "desenvolvimento de aplicativos" e resolver os problemas reais dos usuários - descobrir onde e como a IA deve "dar uma mão" às pessoas.
A situação é um pouco diferente desta vez. Estas extensões de IA precisam se integrar bem com os cenários para gerar valor para o usuário.
Tomando a "pesquisa" como exemplo. Durante o GoogleI/O, o vice-presidente responsável pela pesquisa do Google compartilhou o comportamento do usuário que ele observou: "Quando os usuários não sabem exatamente o que querem pesquisar, geralmente começam com uma pergunta ampla, obtêm inspiração dos resultados da pesquisa, exploram e fazem mais perguntas."
Ao mesmo tempo, há uma intenção por trás de cada consulta. O que fazer com as informações encontradas? Resumir em um esboço, transformar em uma apresentação? Ou mudar o estilo de linguagem e compilar em um comunicado de imprensa? E assim por diante (isso também pode ser visto como a revolução da pesquisa de IA sobre os motores de busca tradicionais).
Essas extensões que aparecem após sublinhar o texto têm como cenário principal de uso a "leitura acompanhada". Enquanto os usuários navegam nas páginas web, podem seletivamente pedir à extensão para explicar, pesquisar, traduzir, resumir, expandir, converter em um post do Xiaohongshu e outras operações - reorganizando e entregando informações, girando em torno da demanda central de pesquisa.
No design do produto, algumas extensões colocam as funções mais comuns em uma barra de ferramentas flutuante no local sublinhado. Por exemplo, o Doubao até permite que os usuários personalizem "habilidades" (equivalente a criar um bot ou GPTs) e as adicionem. Outras funções são listadas na barra lateral.
Algumas seguem os "princípios de design" das extensões, como o Kimi, que é mais conciso e "radical". A IA irá automaticamente "identificar a intenção do usuário" e "entender o contexto". Um usuário testou e descobriu que com um botão flutuante e uma janela, não apenas pode fazer explicações e traduções, mas também resolver problemas matemáticos. O Kimi também configurou que, ao chamar o botão flutuante à direita, pode-se resumir a página e fazer perguntas em um diálogo.