IMG_3774.jpg

Capture d’écran, le 2024-06-10 à 12.53.04.png

1726687409053.png

Capture d’écran, le 2024-06-10 à 12.55.13.png

Capture d’écran, le 2024-06-10 à 12.55.26.png

Capture d’écran, le 2024-06-10 à 12.56.41.png

Capture d’écran, le 2024-06-10 à 12.55.51.png

Le transformer est un modèle de deep learning. Voici quelques points clés à ce sujet :

Architecture et fonctionnement

Le transformer est une architecture d'apprentissage profond introduite en 2017[1]. Il s'agit d'un type de réseau de neurones artificiels conçu principalement pour le traitement du langage naturel, mais qui peut également être utilisé pour d'autres types de données séquentielles comme les images ou les vidéos[1].

Innovations clés

Le transformer apporte deux innovations majeures par rapport aux modèles précédents :

  1. L'encodage positionnel : Chaque mot reçoit un numéro unique, ce qui permet au modèle de prendre en compte l'ordre des mots dans une séquence[2].
  2. L'auto-attention : Ce mécanisme permet au modèle d'évaluer l'importance relative de chaque mot par rapport aux autres mots de la séquence, permettant ainsi une meilleure compréhension du contexte[2].