Il y a quelques jours, une nouvelle de financement est parvenue en Chine. Le laboratoire Exa, situé à San Francisco en Californie, a annoncé un financement de 22 millions de dollars. Ce financement a été mené par Lightspeed Venture Partners, avec la participation de la division de capital-risque de NVIDIA et de Y Combinator. L'objectif d'Exa est de créer un tout nouveau moteur de recherche spécialement conçu pour l'intelligence artificielle.
Les fondateurs d'Exa sont très jeunes, le PDG Will Bryk a 27 ans et le cofondateur Jeff Wang a 26 ans. Il est à noter qu'ils ont fondé cette entreprise avant le lancement de ChatGPT.
Exa a initialement développé un outil permettant aux modèles d'IA d'effectuer des opérations similaires à la recherche sur le web. Cela inclut la recherche d'informations sur Internet, des chatbots IA pour aider les clients à répondre aux questions, et la fourniture de données d'entraînement pour les entreprises.
Les fondateurs ont investi 1 million de dollars au début pour acheter des GPU, utilisant des bases de données vectorielles et des techniques d'embedding pour construire des modèles d'apprentissage automatique. Le modèle a été entraîné pour comprendre intuitivement les liens plutôt que des mots ou des phrases individuels.
Will Bryk explique que leur moteur de recherche diffère des moteurs de recherche ordinaires en ce qu'il ne devine pas le mot suivant, mais prédit plutôt l'URL suivante que l'utilisateur pourrait cliquer. Cette approche entraîne le moteur de recherche basé sur les liens que les gens partagent en ligne, ce qui constitue une toute nouvelle façon de rechercher.
Après l'explosion de ChatGPT, de nombreuses entreprises d'IA ont commencé à demander à Exa une version API du moteur de recherche pour l'intégrer à leurs propres modèles. Actuellement, des milliers de développeurs utilisent les produits d'Exa, et le nombre de clients ne cesse d'augmenter.
Les fondateurs d'Exa sont mécontents de l'environnement Internet actuel. Ils estiment qu'Internet était à l'origine un endroit pratique pour obtenir des informations, mais qu'il est devenu de plus en plus commercialisé et déformé en raison de la lutte pour l'attention. En particulier dans la recherche Google, l'existence de l'industrie de l'optimisation pour les moteurs de recherche (SEO) signifie que les résultats de recherche peuvent ne pas fournir les informations les plus utiles.
La façon dont Exa présente les résultats de recherche est différente des moteurs de recherche traditionnels. Il offre diverses options de filtrage telles que PDF, GitHub, entreprises, actualités, presse écrite, tweets, posts de podcast, etc. Les utilisateurs peuvent choisir différentes sources d'information selon leurs besoins.
Exa propose également des filtres de domaine et de phrase pour améliorer la précision et l'efficacité de la recherche. Cependant, par rapport à Google ou Perplexity, l'expérience utilisateur d'Exa est plus orientée vers la pensée technique et peut ne pas convenir aux utilisateurs ordinaires.
En comparaison, Perplexity est un moteur de recherche destiné aux utilisateurs ordinaires, offrant une expérience de recherche sous forme de questions-réponses. Exa est principalement conçu pour les systèmes d'IA et les développeurs, fournissant les connaissances et les données nécessaires à l'IA.
Exa utilise la technologie d'embedding pour comprendre la sémantique et peut rechercher dans diverses sources de données telles que Twitter, GitHub, Reddit, etc. Perplexity, quant à lui, utilise l'API GPT-4o et des modèles de langage tels que Claude-3, Sonar Large (LLaMa 3).
La technologie d'embedding peut convertir les informations textuelles en vecteurs numériques, permettant aux machines de "comprendre" et de distinguer différents concepts. L'API GPT-4o et Claude-3 sont des modèles de langage déjà développés, et Perplexity intègre différents modèles pour des tâches telles que la rédaction d'articles, la réponse aux questions et le chat.