AI转录进军日本:实现千万美金年收入里程碑 IA de transcrição avança no Japão: alcança marco de receita anual de dezenas de milhões de dólares

Preencher lacunas no mercado consumidor e expandir estrategicamente para o setor de serviços empresariais.

60% das empresas fundadas há menos de 4 anos, a transcrição de reuniões com financiamento frenético durante a pandemia é "frágil"?

A transcrição é um trabalho que pode ser considerado antigo, surgindo quase simultaneamente com a invenção da linguagem escrita, desempenhando um papel importante na promoção do comércio, direito, comunicação religiosa e registro histórico. Até hoje, ainda existem profissionais dedicados a trabalhos relacionados em áreas como saúde, direito e assuntos governamentais. No campo da saúde, por exemplo, nos Estados Unidos, há um "transcritor médico" para cada 10 médicos, ajudando a registrar o histórico médico dos pacientes, processos de tratamento, alergias e outras informações para facilitar as decisões médicas futuras. Como uma necessidade da indústria, é compreensível por que tantas startups estão entrando nesse campo, subdividindo-se em categorias como saúde geral, saúde mental e medicina veterinária. A transcrição de áudio de reuniões que discutimos hoje é, na verdade, uma área de nicho relativamente "emergente" que floresceu durante a pandemia.

De acordo com as estatísticas, entre as 15 startups de transcrição de reuniões mencionadas no gráfico acima, 60% foram fundadas em 2020 ou depois, e a maioria delas concluiu sua última rodada de financiamento durante a pandemia. Naqueles anos, o trabalho remoto tornou-se uma tendência, grandes plataformas como o Zoom colheram os benefícios do crescimento, e uma série de produtos como "instalações de apoio" também se desenvolveram rapidamente. Não é difícil imaginar que a Notta também foi um dos produtos que "pegou carona" nessa onda, recebendo um investimento de 10 milhões de dólares liderado pela Hillhouse Capital em 2022, e na primavera de 2023, seus usuários acumulados no Japão já haviam atingido 1 milhão.

Francamente, a transcrição de reuniões não parece ser um campo com uma alta barreira de entrada à primeira vista, e "é muito fácil eliminar esse tipo de produto" provavelmente é a primeira impressão de alguns profissionais ao ver produtos semelhantes. Para ser honesto, quando vi a Notta pela primeira vez, também fiquei confuso, como uma ferramenta de transcrição de reuniões pode alcançar um volume de visitas mensais tão alto, e até maio o tráfego do site da Notta ainda estava crescendo continuamente, e o Japão, que eles escolheram, aparentemente não é um mercado de startup de "transcrição de reuniões" muito popular.

Por que o Japão?

A escolha do Japão está realmente relacionada à experiência empreendedora inicial de Zhang Yan.

Zhang Yan é um empreendedor em série que trabalhou inicialmente em uma empresa de publicidade na internet (há rumores de que era a Allyes Ad Network), depois trabalhou na Youku, Baidu, DiDi e iFlytek, mas sua identidade mais conhecida ainda é como co-fundador da Mobike. Antes de fundar a Notta, Zhang Yan criou uma marca de máquina de tradução para o mercado internacional chamada Langogo, cujo produto originalmente fez crowdfunding no mercado americano, mas inesperadamente vendeu muito bem no mercado japonês. Foi justamente essa experiência empreendedora que, quando Zhang Yan se voltou para o empreendedorismo de software, deu uma atenção especial ao mercado japonês próximo.

Na época, Zhang Yan tinha uma previsão sobre o mercado de transcrição de linguagem japonesa naquela fase, que era que os produtos B2C no mercado tinham baixa precisão de transcrição, experiência do usuário e design de UI ruins, e se eles pudessem preencher essas lacunas, teriam uma chance. Mas logo depois, Zhang Yan entendeu os fatores mais profundos por trás da "escassez de bons produtos": primeiro, as empresas locais japonesas têm um forte gene B2B, de acordo com um "Mapa de Tecnologia de Voz (versão 2020)" compilado pela Epic Base, das 8 empresas locais que faziam transcrição de voz para reuniões naquele ano, todas sem exceção tinham como foco principal o negócio B2B, apenas metade podia fornecer serviços para indivíduos, e parecia mais um negócio secundário; segundo, poucas empresas estrangeiras prestavam atenção ao mercado japonês, e mesmo as que o faziam não localizavam bem, por exemplo, a otter.ai forneceu serviços de transcrição em inglês por um longo tempo depois de entrar no mercado japonês... Sob vários fatores, a Notta finalmente agarrou uma valiosa janela de oportunidade.

Agora vemos que o que a Notta realmente descobriu foi um caminho de desenvolvimento do B2C para o B2B, começando com uma ferramenta de ponto único, acumulando usuários e reputação no lado do consumidor, e depois gradualmente mudando para o lado empresarial para ampliar a receita. É realmente incrível, a indústria SaaS japonesa sempre foi conhecida por sua baixa taxa de perda de clientes, com uma média da indústria de cerca de 1,2%, o que por um lado significa cooperação estável, mas na verdade não é amigável para os recém-chegados ao mercado. No entanto, a estratégia "de baixo para cima" da Notta realmente funcionou, além de ter um produto sólido por si só, também vimos a profunda compreensão da equipe da Notta sobre crescimento e localização.

Capturando o vazio B2C, entrando "suavemente" no campo B2B

A Notta foi lançada na loja de aplicativos em dezembro de 2019, visando a função de "ajudar os usuários a gravar áudio e conversas", e embora a função principal fosse simples, a equipe deve ter investido bastante na experiência do usuário. A versão mais antiga da Notta que podemos ver nos dados da Point Point é de setembro de 2020, suportando importação rápida de arquivos pelos usuários, sincronização de dados em múltiplos terminais, transcrição em tempo real em 104 idiomas, pesquisa por palavras-chave, edição em tempo real, classificação de som e outras funções. Talvez pareça comum agora, mas podemos entender a melhoria na experiência que a Notta trouxe para os usuários japoneses de outra perspectiva. No meio daquele ano, a Notta recebeu uma reportagem da TV do jornal Asahi Shimbun do Japão sem nenhuma promoção ativa, o que levou a um aumento nas downloads, uma "fortuna inesperada" que chegou quase sem aviso prévio.

O autor não conseguiu encontrar o vídeo original da reportagem após várias buscas, mas não é difícil deduzir que receber a reportagem foi em parte devido à força da Notta, e por outro lado, permitiu que a demanda do lado do consumidor fosse liberada. Em julho de 2021, a composição de usuários divulgada pela Notta mostrou que negócios e notícias eram os dois cenários de alta frequência para os usuários da Notta, além disso, a aplicação em salas de aula e assistência de diálogo para pessoas com deficiência auditiva também representava mais de 20%.