Bonjour,
Première chose, il faut s'entendre sur un encodage. Une sorte de traduction. Plusieurs existent. Le plus simple est le code ASCII, qui permet d'associer un caractère à un octet. Il est limité puisqu'il ne permet de coder que 127 caractères (soit, en fait 7 bit et non 8 : le 8e reste toujours à 0), auquels on inclut des caractères spéciaux comme « retour à la ligne ».
Ce code rudimentaire a été étendu notamment pour prendre en compte les caractères accentués et d'autres symboles, ce qui a donné l'ASCII étendu, codé sur un octet plein (8 bit, donc 256 combinaisons).
Ce n'était pas encore satisfaisant d'un point de vue international ni éditorial, puisque de nombreux symboles n'étaient pas représentés (mathématiques, caractères étrangers (arabes, chinois, japonais, russes, ...), symboles typographiques spécifiques), et une nouvelle norme a donc vu le jour : l'UNICODE, qui définit des normes de codage notamment reprises par l'UTF-8 qui permet de coder un caractère sur 1 à 4 octets (de mémoire, à vérifier), soit 32 bits ou encore plus de 4 milliards de combinaisons.
Tu peux trouver plus d'informations, et notamment une table de correspondance binaire / ASCII, sur wikipedia : http://fr.wikipedia.org/wiki/ASCII#Principes
Donc, pour répondre à ta question, il y a plusieurs façons de faire, et le plus simple pour toi, à mon avis, serait de reprendre une norme existante. En suivant le code ASCII, par exemple, 0 se code 00110000, a se code 01100001 et A se code 01000001.
En espérant t'avoir aidé,
Xavier