Récuperer contenu page internet et s'y connecter

Signaler
-
GiantG
Messages postés
9
Date d'inscription
jeudi 11 août 2016
Statut
Membre
Dernière intervention
7 juillet 2019
-
Bonjour à tous,
à mes heures perdues (il y'en a beaucoup...) je code en python un petit bot messenger, avec diverses fonctionnalitées.
Le principal motif est qu'il puisse servir à notre promo (1ere année de Prépa)
Par exemple je lui ai rentré le programme de khol de l'année, et lorsqu'on lui demande "mes khol" (en lui envoyant un message sur messenger de fb), il reconnait le nom de celui qui demande, et donne directement les jours/heure/salle/matières de khol de la semaine (=super pratique)

Mais j'aimerais lui rajouter une fonction, de sorte à ce qu'en demandant le travail à faire, il renvoi directement une liste de tous les devoirs ajoutés par les professeurs, qu'ils notent sur google classroom

J'ai déjà beaucoup trifouillé les modules urllib et beautifulsoup (sur une page youtube par exemple j'arrive à récuperer le titre, le nb d'abonnés tout ça)

Mais la le problème est tout autre puisque le simple lien du cours google classroom ne suffit plas, il faut également ouvrir une session utilisateur (avec mon compte étudiant) chose que je ne sais absolument pas faire (autrement, la page que je récupère dans mon programme python est celle de connexion à un compte google)...

Je manie assez bien python, mais pour ce qui est du HTTP ou Javascript (je ne saurais dire quel language est utilisé pour classroom) je suis une vraie bille...
Merci d'avance !

2 réponses

Messages postés
9
Date d'inscription
jeudi 11 août 2016
Statut
Membre
Dernière intervention
7 juillet 2019
1
up
Svp une réponse serait la bienvenue, j'ai passé mon bot sur une raspberry, après avoir beaucoup bataillé sur la compatibilité des modules/version de python
J'aimerai vraiment énormément pouvoir récuperer le contenu d'un cours google classroom...
Merci d'avance
Messages postés
18
Date d'inscription
samedi 2 juin 2018
Statut
Membre
Dernière intervention
9 novembre 2019

Salut,

si tu dois passer un formulaire connexion pour récupérer le contenu, tu peux utiliser Phantomjs ou CasperJS. En python, il est possible d'orchestrer ces navigateurs Javascript avec Selenium.

https://www.seleniumhq.org/
http://phantomjs.org/
http://casperjs.org/
https://realpython.com/headless-selenium-testing-with-python-and-phantomjs/
https://pythonspot.com/selenium-phantomjs/
... et plein d'autres ressources sur Google

Je pense que tu peux aussi urllib, mais si le site utilise un jeton csrf, se sera plus compliqué:

https://openclassrooms.com/forum/sujet/python-se-connecter-sur-un-site-86918
https://www.developpez.net/forums/d160848/autres-langages/python-zope/reseau-web/urllib-connexion-login-pass/

Bonne chance
GiantG
Messages postés
9
Date d'inscription
jeudi 11 août 2016
Statut
Membre
Dernière intervention
7 juillet 2019
1
Merci beaucoup, je vais essayer tout ça !
ça risque de me prendre un moment mais je devrais m'en sortir,
merci !