Récupérer URL

Fermé
zahroura zahra Messages postés 13 Date d'inscription jeudi 20 février 2014 Statut Membre Dernière intervention 5 mars 2014 - 3 mars 2014 à 10:25
 incodr - 3 mars 2014 à 11:46
ssalut
Svp
comment récupérer l'url d'un site distant dans un code source html
et merci d'avance

5 réponses

Bonjour,

Merci pour l'éclaircissement.

Alors je n'ai jamais effectué cela mais théoriquement, ce que vous cherchez devrait correspondre à cela selon le code html:


<head>
<base href="http://formasoft.com.tn/" />
<meta http-equiv="content-type" content="text/html; charset=utf-8 <meta name="robots" content="index, follow" />

$doc = new DOMDocument(); 
@$doc->loadHTML($file_contents);
$nodes = $doc->getElementsByTagName('title');
echo "Title: $title". '<br/><br/>';
$href = $doc->getElementsByTagName('base')->getAttribute('href');
echo "Lien: $href".'<br /><br />';

Tenez moi informé.

Cordialement.
1
Bonjour,

Pourriez-vous détailler, ce n'est pas très clair ?

Cordialement.
0
zahroura zahra Messages postés 13 Date d'inscription jeudi 20 février 2014 Statut Membre Dernière intervention 5 mars 2014
Modifié par zahroura zahra le 3/03/2014 à 11:15
je prend un site quelconque et je récupère son code HTML et je ne sais pas comment récupérer l'url de ce site
par exemple si je récupère le titre j'utilise ce code:


$doc = new DOMDocument();
@$doc->loadHTML($file_contents);
$nodes = $doc->getElementsByTagName('title');
echo "Title: $title". '<br/><br/>';

mais pur le contenue de l'url je ne sais pas comment

par exemple pour le site ' http://www.google.com'

affiche https://www.google.com/?gws_rd=ssl
0
zahroura zahra Messages postés 13 Date d'inscription jeudi 20 février 2014 Statut Membre Dernière intervention 5 mars 2014
Modifié par zahroura zahra le 3/03/2014 à 11:31
merci mais ca dans le cas de ce code mais dans un autre site avec un autre code source je ne trouve l'url dans une autre balise qu'est ce que je faire? et merci
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Zahroura zahra,

Si vous lisez dans un code HTML et que vous cherchez le lien de la page courante, je ne saurai quelle balise vous conseiller dans laquelle lire l'attribut "href" car il n'est pas toujours indiqué (d'après mes connaissances)...
Si vous souhaitez récupérer tous les liens du code HTML, c'est très simple il suffit de parser tous les "href" du code et de garder la valeur, si vous souhaitez bel et bien obtenir le lien de la page courante depuis son code HTML, il serait envisageable de créer un algorythme qui récupère tous les attributs "href" et qui renvoie la valeur la plus trouvée. On pourrait penser que cette valeur correspond au lien du site, il faudrait alors garder la première partie par exemple sur cette page, on trouve plein de liens "http://www.commentcamarche.net/xxxxxxxx/xxxxxxxxx", il faudrait donc garder "https://www.commentcamarche.net/", mais ce ne sera pas 100 % sûr que le lien correspond à la page courante.

Ai-je répondu exactement à votre question ?

Cordialement.
0