AI transcription s'implante au Japon : réalisation d'un chiffre d'affaires annuel de plusieurs millions de dollars

Combler les lacunes du marché de la consommation et saisir l'opportunité d'étendre les services aux entreprises.

60% des entreprises créées il y a moins de 4 ans, la transcription de réunions qui a bénéficié d'un financement frénétique pendant la pandémie est-elle "fragile" ?

La transcription est un travail que l'on peut qualifier d'ancien, apparu presque simultanément avec l'invention du langage écrit, jouant un rôle important dans la promotion des échanges commerciaux, juridiques, religieux et l'enregistrement de l'histoire. Aujourd'hui encore, des professionnels spécialisés exercent ce métier dans des domaines tels que la médecine, le droit et les affaires gouvernementales. Dans le domaine médical par exemple, aux États-Unis, il y a environ un "transcripteur médical" pour 10 médecins, qui aide les médecins à enregistrer l'historique médical des patients, le processus de traitement, les antécédents d'allergies et d'autres informations, facilitant ainsi les décisions médicales ultérieures. L'enregistrement étant une nécessité dans l'industrie, on peut comprendre pourquoi tant de startups se lancent dans ce domaine, se spécialisant dans des catégories telles que la médecine générale, la santé mentale, la médecine vétérinaire, etc. La transcription vocale de réunions dont nous discutons aujourd'hui est en fait un créneau relativement "émergent" qui s'est développé de manière florissante pendant la pandémie.

Selon les statistiques, parmi les 15 startups de transcription de réunions mentionnées dans le graphique ci-dessus, 60% ont été créées en 2020 ou après, et la plupart d'entre elles ont réalisé leur dernier tour de financement pendant la pandémie. Au cours de ces années, le travail à distance est devenu une tendance, les grandes plateformes comme Zoom ont bénéficié de la croissance, et un groupe de produits servant d'"installations complémentaires" s'est également développé rapidement. Il n'est pas difficile d'imaginer que Notta est l'un de ces produits qui ont "profité du vent". En 2022, elle a obtenu un financement de 10 millions de dollars dirigé par Hillhouse Capital, et au printemps 2023, son nombre cumulé d'utilisateurs au Japon avait déjà atteint 1 million.

Objectivement, la transcription de réunions ne semble pas être un domaine avec une barrière à l'entrée très élevée, et "il serait trop facile d'éliminer ce type de produits" est probablement la première impression de certains professionnels lorsqu'ils voient des produits similaires. Honnêtement, quand j'ai vu Notta pour la première fois, j'avais aussi des doutes similaires. Comment un outil de transcription de réunions peut-il atteindre un tel nombre de visites mensuelles, et jusqu'en mai, le nombre de visites du site Web de Notta continuait d'augmenter, et le Japon qu'ils ont choisi ne semble pas être un marché de création d'entreprise de "transcription de réunions" très populaire.

Pourquoi le Japon ?

Le choix du Japon est en fait lié à l'expérience entrepreneuriale précoce de Zhang Yan.

Zhang Yan est un entrepreneur en série qui a travaillé dans une société de publicité sur Internet (selon certaines sources, il s'agirait de Allyes Ad Network), puis chez Youku, Baidu, DiDi et iFlytek, mais son identité la plus connue reste celle de co-fondateur de Mobike. Avant de créer Notta, Zhang Yan avait lancé une marque de traducteur pour l'exportation appelée Langogo, dont le produit était initialement destiné au financement participatif sur le marché américain, mais s'est étonnamment bien vendu sur le marché japonais. C'est précisément cette expérience entrepreneuriale qui a amené Zhang Yan à porter une attention particulière au marché japonais voisin lorsqu'il s'est tourné vers l'entrepreneuriat logiciel.

À l'époque, Zhang Yan avait une prévision pour le marché japonais de la transcription linguistique à ce stade, à savoir que les produits grand public sur le marché avaient une faible précision de transcription, une mauvaise expérience utilisateur et un mauvais design d'interface utilisateur, et qu'ils auraient une chance s'ils pouvaient combler ces lacunes. Mais peu après, Zhang Yan a compris les facteurs profonds derrière la "pénurie de bons produits". Premièrement, les entreprises japonaises locales ont un fort ADN B2B. Selon une "Carte des technologies vocales (version 2020)" compilée par Epic Base, parmi les 8 entreprises locales faisant de la transcription vocale de réunions recensées cette année-là, toutes sans exception étaient principalement engagées dans les activités B2B, et seulement la moitié pouvait fournir des services aux particuliers, ce qui ressemblait plus à une activité secondaire. Deuxièmement, peu d'entreprises étrangères s'intéressaient au marché japonais, et même celles qui le faisaient n'étaient pas bien localisées. Par exemple, otter.ai a longtemps fourni des services de transcription en anglais pendant une longue période après son entrée sur le marché japonais... Dans ces circonstances, Notta a finalement saisi une précieuse fenêtre d'opportunité.

Aujourd'hui, nous voyons que ce que Notta a exploré est en fait une voie de développement du B2C au B2B, en commençant par un outil ponctuel pour accumuler des utilisateurs grand public et une réputation, puis en se tournant progressivement vers le B2B pour amplifier les revenus. C'est assez étonnant, l'industrie SaaS japonaise est connue pour son faible taux de perte de clients, avec une moyenne industrielle d'environ 1,2%, ce qui signifie d'une part une coopération stable, mais n'est en fait pas favorable aux nouveaux arrivants sur le marché. Cependant, la stratégie "bottom-up" de Notta a vraiment fonctionné, non seulement grâce à la solidité du produit lui-même, mais aussi grâce à la compréhension approfondie de l'équipe Notta en matière de croissance et de localisation.

Saisir le vide du B2C, entrer "en douceur" dans le domaine du B2B

Notta a été lancé sur l'App Store en décembre 2019, visant la fonction "aider les utilisateurs à enregistrer l'audio et les conversations". Bien que la fonction principale soit simple, l'équipe a probablement investi beaucoup dans l'expérience utilisateur. La première version de Notta que nous pouvons voir sur Diandiandatas remonte à septembre 2020, prenant en charge l'importation rapide de fichiers par les utilisateurs, la synchronisation des données multi-terminaux, la transcription en temps réel dans 104 langues, la recherche par mots-clés, l'édition en temps réel, la classification des sons, etc. Cela peut sembler ordinaire maintenant, mais nous pouvons comprendre l'amélioration de l'expérience que Notta a apportée aux utilisateurs japonais d'un autre point de vue. Au milieu de l'année, Notta a connu une augmentation soudaine des téléchargements suite à un reportage télévisé du journal Asahi Shimbun au Japon, sans aucune promotion active. Une "fortune tombée du ciel" est arrivée presque sans avertissement.

L'auteur n'a pas pu trouver la vidéo originale du reportage malgré plusieurs recherches, mais il n'est pas difficile de deviner que le reportage était dû d'une part à la solidité de Notta, et d'autre part à la libération de la demande des consommateurs. En juillet 2021, la composition des utilisateurs publiée par Notta montrait que les affaires et les nouvelles étaient respectivement les deux scénarios à haute fréquence pour les utilisateurs de Notta, avec en outre plus de 20% d'applications pour les cours et l'assistance à la communication pour les personnes malentendantes.