Auteur | Message |
---|---|
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 12/07/2007 à 14:00 j'up pour faire un petit point sur le passage des bots sur le lien caché dans un bloc en display:none (le petit test que je fais depuis 10 jours sur toutes les pages de partoch).
Voici le nombre d'accès (compté une fois par session) des bots sur ce lien après 10 jours de relevés : bots | nb accès au lien caché | nb accès au site ShopWiki 14 14 exabot 7 7 yahoo 22 22 SiteSucker 1 1 msn 4 16 cazoodle 8 8 panscient.com 1 1 google 3 18 ia_archiver 2 2 Alors que Google et MSN font partit des moteurs qui scannent le plus mon site ils sont pourtant ceux qui ont le moins suivi ce lien. Yahoo par contre se fiche royalement du display:none, il suit le lien à chacune de ses visites Donc soit les bots de google et msn controlent les liens déjà indexés avant de scanner le site et ne repassent pas où ils sont déjà passés, soit le display:none freine leur indexation. Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
bhamp0
| Benjamin Inscrit le : 09/05/2005 |
# Le 12/07/2007 à 15:31 Google et MSN doivent utiliser le fait que ta page, au final, n'a pas de contenu ... donc ils y reviennent peu ("aucun intérêt ta page !"), mais ils y sont allés. Quand on voit c'qu'on voit, et qu'on entend c'qu'on entend, on a raison d'penser c'qu'on pense ! |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 10:40 Petit up car j'ai remis le nez dans les ip/user_agent du div caché cité plus haut. Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 27/05/2008 à 11:01 Perso, je me suis fait une petit liste de user agent a ne pas compter, je peux vous les filer si vous voulez. JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 11:13 Preneur Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
devtribu
| Olivier Inscrit le : 16/06/2005 |
# Le 27/05/2008 à 11:14 Ca m'interesse aussi Février 2019, mon futur livre Tout JavaScript chez Dunod https://amzn.to/2PoLd0f |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 11:22 peut être des particuliers qui veulent monter un site à moindre cout en pompant le tiens ^^ Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 27/05/2008 à 11:27 http://www.vacanceo.com/misc/bots.txt JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 11:54 Merci ! Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
Bool
| Olivier Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 12:02 t'as oublié httrack |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 12:25 Ah oui, merci Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
Zalex14
| Alexandre Inscrit le : 09/05/2005 |
# Le 27/05/2008 à 12:55 Dans les robots on peux aussi ajouter ASPseek (bot open source que je vois quelques fois dans mes logs) Mieux vaut s'attendre au prévisible que d'être surpris par l'inattendu. |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 09/12/2008 à 15:01 Mise a jour : http://www.vacanceo.com/misc/bots.txt JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
Rano
| Jean Inscrit le : 13/04/2005 |
# Le 09/12/2008 à 15:16 Sinon y a ça hein http://browsers.garykeith.com/downloads.asp |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 13/01/2011 à 00:28 Yop. JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
Akarys
| Thierry Inscrit le : 19/01/2008 |
# Le 13/01/2011 à 02:11
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) A bannir ??? Et sinon concrètement que fais-tu ? Tu compares le User-Agent de chaque demande de page à ta liste ? au niveau Apache ? au niveau Php ? puis envoi d'un 301 ? 404 ? 444 ? Un truc qui manque dans les règles de gestion des robots - je trouve - c'est une relation claire et simple entre le User-Agent envoyé via une requête (ta liste) et le User-agent à utiliser dans robots.txt (que quand même pas mal de robots respectent). C'est la galère à trouver pour certains... |
Julgates
| Julien Inscrit le : 09/03/2005 |
# Le 13/01/2011 à 08:51 A bannir des stats (display, clics, indicateurs internes, etc) ! Shopping Time Network - Founder / CTO |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 13/01/2011 à 11:28 Oups pardon, c'est une liste de robots a bannir des stats JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
krucial
| Jean Christophe Inscrit le : 09/03/2005 |
# Le 05/11/2013 à 13:25 J'ai mis à jour le fichier (300 robots a bannir des stats) : JC - Mes sites | Affiliation devis travaux | Cotes voitures anciennes |
belami
| XXX Inscrit le : 27/11/2009 |
# Le 05/11/2013 à 14:45
krucial a dit : J'ai mis à jour le fichier (300 robots a bannir des stats) : http://www.forumconstruire.com/logs/bots.txt J'ai aussi un petit fichier qui peut être ajouté a la suite de browscap.ini : http://www.forumconstruire.com/logs/browscap_fc.in... merci XXXX |
Vous ne pouvez pas participer au forum, car votre inscription n'a pas été validée. Pour vous faire valider en tant que Membre, cliquez ici.
© MHN - Tous droits réservés | CNIL N°844440 | 23/11/2024 13:41:39 | Généré en 15.69ms | Contacts | Mentions légales |