Un entier est représenté par la somme des puissances de la base (en binaire : 1=présente, 0=absente). Le chiffre des unités, à droite, correspond à la puissance 0.
De la même manière, on peut ajouter des chiffres à droite de l'unité, correspondant aux puissances -1 (=0.5), -2 (=0.25), -3 (=0.125), etc.
Petit rappel : base puissance -n = 1 / base puissance n
Les nombres réels ou flottants sont représentés en machine sous forme "normalisée", avec :
> 1 bit pour le signe du nombre,
> 1 exposant (sur 7 bits, ou plus selon la norme IEEE, dont le premier indique le signe de l'exposant)
> les autres bits (en général, jusqu'à 32, ou 64) représente la partie "fractionnaire" en base 2 ou 16 [ou 8 ?] selon machine. Cette
zone est "normalisée" si le premier chiffre n'est pas nul (exception : la valeur 0).
La représentation décrite au début n'est pas utilisée pour les nombres en mémoire, mais seulement dans les organes de calcul, par exemple, quand on effectue la somme de 2 nombres dont les exposants sont différents. Si, à un nombre X, on ajoute un nombre x plus petit, la "dénormalisation" de ce dernier peut conduire à une valeur nulle, d'où des erreurs de calcul, ce qui obligent à trouver des méthodes particulières pour éliminer ou réduire cette perte de précision.