Comment l’industrie du jeu contribue-t-elle au développement de l’IA ?

Pour que les systèmes d’intelligence artificielle (IA) arrivent à un point où ils peuvent résoudre les problèmes mieux et plus rapidement que les humains, les humains doivent d’abord former les machines à utiliser l’IA. L’une de ces façons de former ces machines consiste à effectuer des tests et un renforcement continus.

Jeux simplestels que Checkers, ont été utilisés pour former des systèmes d’IA par essais et erreurs et, par conséquent, ont rendu les ordinateurs plus intelligents, leur permettant de s’améliorer dans un certain nombre de domaines, pas seulement jeux sur lesquels les machines sont formées.

Grâce aux jeux, les développeurs d’IA peuvent tester et comparer la façon dont les ordinateurs et les humains résolvent les problèmes. En alimentant l’ordinateur avec les règles du jeu et en lui enseignant les stratégies que les humains utiliseraient, les chercheurs peuvent tester comment leurs systèmes d’IA correspondent à leurs homologues humains.

Ce n’est pas une nouvelle façon de tester les systèmes d’IA – certains des premiers ordinateurs dotés d’IA ont appris à jouer à des jeux tels que Checkers et ont montré aux chercheurs que les ordinateurs dotés d’IA peuvent effectuer des tâches aussi bien que les humains, mais plus rapidement.

La capacité d’accomplir des tâches plus rapidement est due à la mémoire améliorée d’un ordinateur par rapport à un humain.

Similaire  11 meilleures applications d'édition TikTok pour créer des vidéos virales

Depuis le début : enseigner à l’IA comment jouer à des jeux

En 1956, Arthur Samuel, un ingénieur en informatique d’IBM, a enseigné à un ordinateur comment jouer aux dames, montrant finalement que les machines peuvent apprendre des tâches simples et, après s’être entraînées, peuvent le faire mieux que les humains. La recherche d’IBM sur les ordinateurs a été l’un des premiers exemples réussis d’apprentissage automatique.

Faisant passer l’apprentissage automatique au niveau supérieur, IBM souhaitait tester ses ordinateurs sur un jeu plus complexe et visait à apprendre à un ordinateur à jouer aux échecs. Les tests d’ordinateurs sur ce jeu ont commencé dans les années 1950, cependant, le géant de la technologie a eu du mal à rendre son système informatique meilleur qu’un humain et ce n’est qu’en 1997 que le supercalculateur d’IBM, Deep Blue, a battu le champion du monde d’échecs, Garry Kasparov.

Le célèbre logiciel d’IBM, Watsona également été testé et évalué sur sa capacité à jouer l’émission de télévision Péril!. IBM a formé une équipe de 15 personnes et a donné un délai de trois à cinq ans pour perfectionner ce nouveau logiciel. Cette fois était essentielle car le jeu s’est avéré difficile pour Watson car le langage était un concept difficile à saisir pour les ordinateurs. En 2010, Watson gagnait avec succès contre Péril! concurrents.

Similaire  Idées de noms de podcast : 15 formules et conseils

Il n’y a pas qu’IBM qui s’est appuyé sur différents jeux pour tester son logiciel d’IA, Les développeurs d’IA d’AIphabet à son DeepMind étaient déterminés à développer un ordinateur capable de jouer au go, un jeu de plateau stratégique plus difficile que les échecs. DeepMind a enseigné à un programme informatique les mouvements utilisés par les champions et l’a fait s’entraîner à jouer contre des humains.

En 2016, le programme a proposé de nouveaux mouvements auxquels les humains n’avaient pas pensé et a finalement battu Lee Sedol, 18 fois champion du monde. Quatre ans plus tard, après des recherches approfondies sur l’apprentissage par renforcement, DeepMind a pu développer un programme capable de jouer au go, aux échecs, au shogi et à 57 jeux d’Atari – sans avoir appris une seule règle des jeux.

IA et jeux : l’importance de l’apprentissage par renforcement

L’apprentissage par renforcement est essentiel car les entreprises cherchent à utiliser l’IA pour résoudre différents problèmes commerciaux. Cet apprentissage fonctionne comme un ordinateur continue de jouer à un jeu, par essais et erreurs, il peut apprendre par lui-même et trouver des moyens de jouer à un jeu auquel les humains ne pensent pas.

Le renforcement se présente sous la forme d’un retour d’information du chercheur qui indique à l’ordinateur ce qu’il fait. Pour devenir meilleur que les humains, les ordinateurs continuent de jouer à un jeu encore et encore jusqu’à ce qu’il ne puisse plus battre son propre record.

Similaire  Dubber : surmonter les préjugés en PNL et en reconnaissance vocale

Au fil du temps, les ordinateurs peuvent apprendre une stratégie gagnante à laquelle même les meilleurs humains n’ont pas encore pensé. Malgré cela, l’apprentissage par renforcement ne remplace pas l’intelligence humaine car il ne peut pas reproduire les émotions, la créativité et le bon sens.

Les chercheurs doivent en tenir compte lorsqu’ils développent de nouveaux systèmes d’IA et s’assurer que ce type d’apprentissage n’a pas d’impact négatif sur l’ordinateur. Ensemble, l’intelligence humaine et les ordinateurs compatibles avec l’IA peuvent proposer un certain nombre de solutions pour lutter contre une variété de problèmes et, lorsqu’elles sont appliquées dans un environnement commercial, elles peuvent entraîner un certain nombre d’avantages.