CommentCaMarche
Recherche

Introduction à l'assembleur

Février 2015

Les prérequis nécessaires


Le langage assembleur est très proche du langage machine (c'est-à-dire le langage qu'utilise l'ordinateur : des informations en binaire, soit des 0 et des 1). Il dépend donc fortement du type de processeur. Ainsi il n'existe pas un langage assembleur, mais un langage assembleur par type de processeur. Il est donc nécessaire de connaître un minimum le fonctionnement d'un processeur pour pouvoir aborder cette partie. Un processeur réel a toutefois trop de registres et d'instructions pour pouvoir les étudier en détail. C'est pour cette raison que seuls les registres et les instructions d'un processeur simple (Intel 80x86 16 bits) seront étudiés dans ce dossier.

Le processeur en bref...


Un processeur est relié à la mémoire par l'intermédiaire d'une liaison appelée bus. Les données dont le processeur a besoin sont stockées dans ce que l'on appelle des registres (ils sont notés AX, BX, CX, DX, ...). Chacun a sa propre utilité  :


Nom du registreTaille
Accumulateur AX16 bits
Registre auxiliaire de base BX16 bits
Registre auxiliaire (compteur) CX16 bits
Registre auxiliaire de données DX16 bits
Pointeur d'instruction IP16 bits
Index de source SI16 bits
Index de destination DI16 bits
Registre segment de code CS16 bits
Registre segment de données DS16 bits
Registre segment de pile SS16 bits
Registre segment supplémentaire ES16 bits
Pointeur de pile SP16 bits
Pointeur de base BP16 bits



Les registres AX, BX, CX et DX sont les registres les plus utilisés pour les calculs :

  • Le registre AX sert à effectuer des calculs arithmétiques ou à envoyer un paramètre à une interruption
  • Le registre BX sert à effectuer des calculs arithmétiques ou bien des calculs sur les adresses
  • Le registre CX sert généralement comme compteur dans des boucles
  • Le registre DX sert à stocker des données destinées à des fonctions


Il s'agit là de l'utilisation de base de ces registres, mais dans la pratique ils peuvent être utilisés à d'autres fins.

Les registres AX, BX, CX et DX peuvent être utilisés par bloc d'un octet (8 bits), la lettre X de leur nom est alors remplacée par L (comme Low pour désigner les bits de poids faible) et H (pour High afin de désigner les bits de poids fort). De plus, dans les architectures x86 32 bits, ces registres ont été étendus à 32 et ont vu leur nom précédé d'un E (pour Extended, en français « étendu »).


EAX (32 bits)
  AX (16 bits)
 AH (8 bits)AL (8 bits)

Pourquoi utiliser l'assembleur ?


Pour faire exécuter une suite d'instructions au processeur, il faut lui fournir des données binaires (souvent représentées en notation hexadécimale pour plus de lisibilité, mais cela revient au même...). Or, les fonctions en notation hexadécimale sont difficiles à retenir, c'est pourquoi le langage assembleur a été mis au point. Il permet de noter les instructions avec des noms explicites suivis de paramètres.

Voici par exemple à quoi peut ressembler un programme en langage machine :
A1 01 10 03 06 01 12 A3 01 14

Il s'agit de la représentation hexadécimale d'un programme permettant d'additionner les valeurs de deux cases mémoire et de stocker le résultat dans une troisième case. Il est évident que ce type d'écriture est difficilement lisible par nous, humains.

Ainsi, puisque toutes les instructions que le processeur peut effectuer sont chacune associées à une valeur binaire, on utilise une notation symbolique sous forme textuelle qui correspond à chaque fonction, c'est ce que l'on appelle le langage assembleur. Dans l'exemple précédent la séquence A1 01 10 signifie copier le contenu de la mémoire à l'adresse 0110h dans le registre AX du processeur. Cela se note en langage assembleur :
MOV AX, [0110]

Toutes les instructions ont une notation symbolique associée (fournie par le fabricant du processeur). L'utilisation du langage assembleur consiste donc à écrire sous forme symbolique la succession d'instructions (précédées de leur adresse pour pouvoir repérer les instructions et passer facilement de l'une à l'autre). Ces instructions sont stockées dans un fichier texte (le fichier source) qui, grâce à un programme spécifique (appelé « l'assembleur ») sera traduit en langage machine.

Le programme précédent écrit en langage assembleur donnerait :


Adresse de l'instructionInstruction en langage machineInstruction en langage assembleurCommentaires sur l'instruction
0100A1 01 10 MOV AX, [0110]Copier le contenu de 0110 dans le registre AX
010303 06 01 12ADD AX, [0112]Ajouter le contenu de 0112 à AX et mettre le résultat dans AX
0107A3 01 14MOV [0114], AXStocker AX à l'adresse mémoire 0114



L'écriture en langage assembleur, bien que restant rebutante, est beaucoup plus compréhensible pour un humain, car généralement les noms sont plus faciles à retenir que les nombres.

Pour une lecture illimitée hors ligne, vous avez la possibilité de télécharger gratuitement cet article au format PDF :
Introduction-a-l-assembleur.pdf

A voir également

Réalisé sous la direction de , fondateur de CommentCaMarche.net.

Ce document intitulé «  Introduction à l'assembleur  » issu de CommentCaMarche (www.commentcamarche.net) est mis à disposition sous les termes de la licence Creative Commons. Vous pouvez copier, modifier des copies de cette page, dans les conditions fixées par la licence, tant que cette note apparaît clairement.