Récuperer contenu page internet et s'y connecter

Fermé
GiantG - 31 mai 2019 à 16:11
GiantG Messages postés 8 Date d'inscription jeudi 11 août 2016 Statut Membre Dernière intervention 7 juillet 2019 - 7 juil. 2019 à 13:04
Bonjour à tous,
à mes heures perdues (il y'en a beaucoup...) je code en python un petit bot messenger, avec diverses fonctionnalitées.
Le principal motif est qu'il puisse servir à notre promo (1ere année de Prépa)
Par exemple je lui ai rentré le programme de khol de l'année, et lorsqu'on lui demande "mes khol" (en lui envoyant un message sur messenger de fb), il reconnait le nom de celui qui demande, et donne directement les jours/heure/salle/matières de khol de la semaine (=super pratique)

Mais j'aimerais lui rajouter une fonction, de sorte à ce qu'en demandant le travail à faire, il renvoi directement une liste de tous les devoirs ajoutés par les professeurs, qu'ils notent sur google classroom

J'ai déjà beaucoup trifouillé les modules urllib et beautifulsoup (sur une page youtube par exemple j'arrive à récuperer le titre, le nb d'abonnés tout ça)

Mais la le problème est tout autre puisque le simple lien du cours google classroom ne suffit plas, il faut également ouvrir une session utilisateur (avec mon compte étudiant) chose que je ne sais absolument pas faire (autrement, la page que je récupère dans mon programme python est celle de connexion à un compte google)...

Je manie assez bien python, mais pour ce qui est du HTTP ou Javascript (je ne saurais dire quel language est utilisé pour classroom) je suis une vraie bille...
Merci d'avance !
A voir également:

2 réponses

GiantG Messages postés 8 Date d'inscription jeudi 11 août 2016 Statut Membre Dernière intervention 7 juillet 2019 1
Modifié le 27 juin 2019 à 14:02
up
Svp une réponse serait la bienvenue, j'ai passé mon bot sur une raspberry, après avoir beaucoup bataillé sur la compatibilité des modules/version de python
J'aimerai vraiment énormément pouvoir récuperer le contenu d'un cours google classroom...
Merci d'avance
0
Utilisateur anonyme
Modifié le 1 juil. 2019 à 22:13
Salut,

si tu dois passer un formulaire connexion pour récupérer le contenu, tu peux utiliser Phantomjs ou CasperJS. En python, il est possible d'orchestrer ces navigateurs Javascript avec Selenium.

https://www.selenium.dev/
https://phantomjs.org/
http://casperjs.org/
https://realpython.com/headless-selenium-testing-with-python-and-phantomjs/
https://pythonspot.com/selenium-phantomjs/
... et plein d'autres ressources sur Google

Je pense que tu peux aussi urllib, mais si le site utilise un jeton csrf, se sera plus compliqué:

https://openclassrooms.com/forum/sujet/python-se-connecter-sur-un-site-86918
https://www.developpez.net/forums/d160848/autres-langages/python/reseau-web/urllib-connexion-login-pass/

Bonne chance
0
GiantG Messages postés 8 Date d'inscription jeudi 11 août 2016 Statut Membre Dernière intervention 7 juillet 2019 1
7 juil. 2019 à 13:04
Merci beaucoup, je vais essayer tout ça !
ça risque de me prendre un moment mais je devrais m'en sortir,
merci !
0