Échec controversé de l'entraînement de l'IA à Oxbridge : l'IA auto-entraînée peut-elle surmonter les obstacles ?

Appliquer avec prudence les données générées par l'IA pour éviter une dégradation des performances du modèle.

À l'ère de l'IA, les données sont devenues une ressource clé. Alors que les données humaines s'épuisent progressivement, les données synthétiques sont considérées comme la voie de l'avenir, mais leur utilisation nécessite de la prudence.

Un article récent en couverture de Nature a suscité des discussions. L'étude indique que l'utilisation exclusive de contenu généré par l'IA dans l'entraînement pourrait entraîner un effondrement du modèle. Cela a déclenché un large débat dans la communauté de l'IA, beaucoup estimant que le cœur du problème réside dans la qualité des données plutôt que dans les données synthétiques elles-mêmes.

Pour éviter l'effondrement du modèle, les experts proposent les suggestions suivantes :

  1. Utiliser des données mixtes. Le PDG de Scale AI estime que les données purement synthétiques ne peuvent pas apporter de gain d'information et qu'il faut combiner des données du monde réel, la participation d'experts humains et des moteurs de logique formelle.

  2. Adopter des méthodes d'apprentissage par renforcement. Des chercheurs de Meta et d'autres institutions proposent d'utiliser une méthode de "rétroaction par classement et élagage" pour restaurer et améliorer les performances du modèle.

  3. Utiliser la supervision humaine. Les recherches montrent que le filtrage des données de haute qualité par supervision humaine est plus efficace et moins coûteux que l'annotation manuelle directe.

  4. Combiner avec des données réelles. Dans les expériences, s'appuyer uniquement sur des données générées entraîne une baisse des performances, tandis que la combinaison de données réelles et de rétroaction peut améliorer les performances.

Dans l'ensemble, les données synthétiques ont certainement du potentiel, mais elles doivent être utilisées avec prudence et combinées à d'autres méthodes pour éviter l'effondrement du modèle et améliorer les performances. La direction future pourrait être une combinaison de données mixtes et d'apprentissage par renforcement.

Adresse de l'article