Problèmes affichage tableaux [Résolu]

Messages postés
5
Date d'inscription
mardi 26 novembre 2019
Statut
Membre
Dernière intervention
27 novembre 2019
-
Bonjour,

J'ai voulue créer un crawler, qui récupèrent des URL internes
Du coup j'ai créez une fonction pour crawl une URL qui prend L'URL et puis la pattern a chercher
sauf au moment que je return mon tableaux j'ai un problèmes il y a 3 tableaux vide et 1 qui comprends mes URL internes hors moi je veut que le tableaux avec les URL

Mon code

<?php

function crawl($URL,$pattern)
{
 

 $ch = curl_init($URL);

  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  curl_setopt($ch, CURLOPT_HEADER, 0);
  curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); 
  curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);

    $DATA = curl_exec($ch);

    curl_close($ch);

    preg_match_all($pattern,$DATA,$LINK);

    return ($LINK);
}

// Appelle de la fonction crawl avec une URL est une partten spécifié 
$link = crawl('http://testphp.vulnweb.com/','%href="\.?\.?\/?[\w]+([\w]|\.|-|)[\w]+/?[\w]+([\w]|\.|-|)[\w]+\.(php|html|htm)??[\w]{0,130}+=?[\w]{0,130}\&?[\w]{0,130}\=?[\w]{0,130}\&?[\w]{0,130}\=?[\w]{0,130}\&?[\w]{0,130}=?[\w]{0,130}\&?[\w]{0,130}\=?[\w]{0,130}"%');





echo "<pre>";
print_r($link);
echo "</pre>";


Mon tableaux lors de l'affichage
Array
(
[0] => Array
(
[0] => href="style.css"
[1] => href="index.php"
[2] => href="categories.php"
[3] => href="artists.php"
[4] => href="disclaimer.php"
[5] => href="cart.php"
[6] => href="guestbook.php"
[7] => href="AJAX/index.php"
[8] => href="categories.php"
[9] => href="artists.php"
[10] => href="cart.php"
[11] => href="login.php"
[12] => href="userinfo.php"
[13] => href="guestbook.php"
[14] => href="AJAX/index.php"
[15] => href="privacy.php"
)

[1] => Array
(
[0] =>
[1] =>
[2] =>
[3] =>
[4] =>
[5] =>
[6] =>
[7] =>
[8] =>
[9] =>
[10] =>
[11] =>
[12] =>
[13] =>
[14] =>
[15] =>
)

[2] => Array
(
[0] =>
[1] =>
[2] =>
[3] =>
[4] =>
[5] =>
[6] =>
[7] =>
[8] =>
[9] =>
[10] =>
[11] =>
[12] =>
[13] =>
[14] =>
[15] =>
)

[3] => Array
(
[0] =>
[1] =>
[2] =>
[3] =>
[4] =>
[5] =>
[6] =>
[7] =>
[8] =>
[9] =>
[10] =>
[11] =>
[12] =>
[13] =>
[14] =>
[15] =>
)

)
Afficher la suite 

1 réponse

Messages postés
9062
Date d'inscription
lundi 9 juin 2008
Statut
Contributeur
Dernière intervention
7 décembre 2019
464
0
Merci
bonjour, pourquoi as-tu inclus des parenthèses capturantes dans le "pattern"?
([\w]|\.|-|)
([\w]|\.|-|)
(php|html|htm)
Unnamed777
Messages postés
5
Date d'inscription
mardi 26 novembre 2019
Statut
Membre
Dernière intervention
27 novembre 2019
-
Salut, du coup problèmes résolue pour le tableaux, sinon pour ([\w]|\.|-|), c'est pour les nom des liens internes comme par exemple home-view.php ou home\view.php
Commenter la réponse de yg_be