Auteur | Message |
---|---|
erwinol
| Inscrit le : 09/05/2005 |
# Le 16/03/2011 à 20:17 Bonjour à tous ! wget -S --spider http://www.domaine.fr/page.html Mais il ne me renvoie que l'entête HTTP classique. Alors que mon extension Firefox m'en sort plusieurs pages avec notamment les images, les fichiers js et beaucoup d'autres choses. Comment obtenir ces informations dynamiquement ? Est-ce possible ? |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 16/03/2011 à 20:54 A priori, il n'y a pas de méthode simple dans la mesure où il s'agit de requêtes faites par Firefox. |
PyRoFlo
| Florent Inscrit le : 09/05/2005 |
# Le 16/03/2011 à 20:56 cURL ? |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 16/03/2011 à 21:06 Merci pour ta réponse. |
PyRoFlo
| Florent Inscrit le : 09/05/2005 |
# Le 17/03/2011 à 02:55 A propos de Simple HTML Dom je voulais dire que grâce à cette libraire tu pouvais récupérer les URL des fichiers externes contenus dans ta page HTML cible. |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 17/03/2011 à 08:38 Le problème c'est que l'élément n'est pas dans la source, il est généré dynamiquement en javascript. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 17/03/2011 à 09:13 euh... là, ça ne me semble pas évident. Solutions à la con, en vrac : |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 17/03/2011 à 09:50 Ok c'est mort quoi ^^ |
allogarage
| Nicolas Inscrit le : 14/10/2008 |
# Le 17/03/2011 à 09:51 Bonjour, Guide comparatif des garages automobiles | Guide comparatif des garages moto | Annuaire auto moto |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 17/03/2011 à 10:13 J'ai analysé le code du script comme un allumé pour trouver la faille et je n'ai même pas pensé à aller voir dans /captcha/show alors qu'il est clairement indiqué dans le JS ^^ |
kigenaou
| Paul Inscrit le : 09/05/2005 |
# Le 21/03/2011 à 15:20 tu cherche à faire quoi, désolé, je ne comprends pas bien le but de ta requete ... |
fbparis
| Francois Inscrit le : 13/12/2009 |
# Le 23/03/2011 à 06:38 Je ne vois pas où est la difficulté.. Tu fais d'abord ta requête de base pour récupérer le source de la page, tu enregistres les headers. Ensuite pour récupérer les autres headers (images, scripts externes etc) il faut d'abord récupérer dans le source tous ces éléments, via une regex par exemple, et faire autant de requêtes que nécessaire (c'est ce que font tes extensions si en plus tu désactives complètement le cache de firefox). |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 23/03/2011 à 07:59 Le soucis ici visiblement était de chopper des URL générées à la volée en JS... ce qui impose d'avoir un interpréteur JS dans le "robot". |
erwinol
| Erwin Inscrit le : 09/05/2005 |
# Le 23/03/2011 à 08:45 fbparis : Tu ne vois pas où est la difficulté car tu n'as pas essayé de résoudre le problème. Ta solution ne marche bien évidemment pas. Il aurait fallu que j'accède à la "source générée", ce qui nécessite un interpréteur JS. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 23/03/2011 à 09:18 je vois pas de quoi tu parles |
allogarage
| Nicolas Inscrit le : 14/10/2008 |
# Le 23/03/2011 à 09:49 eh eh pour une fois que je sers à quelque chose Guide comparatif des garages automobiles | Guide comparatif des garages moto | Annuaire auto moto |
Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.
© MHN - Tous droits réservés | CNIL N°844440 | 23/11/2024 18:00:22 | Généré en 6.66ms | Contacts | Mentions légales |