>>> t'es où ?
Lycée Clémenceau à Nantes...
>>> A propos du surapprentissage :
Comme tu me l'as dit, j'ai essayé de voir au niveau du surapprentissage pour tenter de diminuer sérieusement le coût des calculs, et de garder la propriété généralisatrice des réseau de neurone.
J'ai donc effectué les mesures suivantes : pour des paramètres fixés (paramètres qui me donnent une convergence assez rapide), j'ai fait varier la taille de ma base d'apprentissage (de 10 à 3500 exemples), et j'ai calculé à chaque fois :
- l'efficacité sur la base de test qui ne sert pas à l'apprentissage (1797 exemples)
- l'efficacité sur l'ensemble des exemples dont je dispose (app+test=5626 exemples) (les exemples de la base d'apprentissage servent à la fois à l'apprentissage et au test)
Voici les résultats :
- Nombre d'erreurs sur la base de test :
http://site.voila.fr/updt/tipe/image1.jpg
- Pourcentage d'erreur sur la base de test :
http://site.voila.fr/updt/tipe/image2.jpg
- Nombre d'erreurs pour les 2 bases :
http://site.voila.fr/updt/tipe/image4.jpg
- Pourcentage d'erreur pour les 2 bases :
http://site.voila.fr/updt/tipe/image3.jpg
On remarque bien qu'à un moment les courbes ne décroissent plus trop rapidement (à partir de 1500 exemples environ) et elles évoluent vers un minimum : 80 erreurs environ (toutes bases comprises).
Avec 1500 exemples il y a 100 erreurs sur la base de test et 200 sur les 2.
(Avec les meilleurs paramètres initiaux que j'ai trouvé pour l'instant, j'arrive à 60 erreurs).
Est-ce que cette différence est significative ?
Et au vu des résultats que j'obtiens devrais-je donc, comme tu me le conseillais, me contenter de moins d'exemples ?
Merci, et @+,
Matthieu
NB : quelques résultats :
- Nombre de modifications du réseau en fonction de a (avec 30 neurones cachées et un coeff d'app de 1) :
http://site.voila.fr/updt/tipe/modif_a_30_1.jpg
- Nombre d'erreurs sur la base de test en fonction de a (avec 70 neurones cachées et un coeff d'app de 1) :
http://site.voila.fr/updt/tipe/erreur_a_70_1.jpg
- Nombre de modif en fonction du nbr de neurones cachées (avec a=0.05 et un coeff d'app de 1) :
http://site.voila.fr/updt/tipe/modif_nbr_005_1.jpg
- Nombre d'erreurs en fct du nbr de neurones cachées (avec a=0.05 et un coeff d'app de 1) :
http://site.voila.fr/updt/tipe/erreur_nbr_005_1.jpg
Si jamais vous avez le logiciel de calcul formel Maple que j'utilise pour tracer les courbes et les surfaces, je pourrais mettre aussi en téléchargement ces fichiers (on voit bien mieux avec les surfaces 3D...)