Block google en yahoo 'bots' ?

Onderwerpen die nergens anders thuis horen en toch eerder technisch van aard zijn? Post ze hier!
Plaats reactie
Gebruikersavatar
selder
Moderator
Moderator
Berichten: 6305
Lid geworden op: 29 jun 2005, 20:25
Locatie: Tienen
Uitgedeelde bedankjes: 99 keer
Bedankt: 727 keer

In m'n access log van m'n website zie ik (teveel naar m'n goesting) van deze lijnen passeren:

Code: Selecteer alles

207.46.98.144 - - [01/Sep/2005:03:59:16 +0200] "GET /v/Computers/ HTTP/1.0" 200 11257 "-" "msnbot/1.0 (+http://search.msn.com/msnbot.htm)"
68.142.249.32 - - [01/Sep/2005:04:03:30 +0200] "GET /main.php/v/Computers/Selder/DSC00496.jpg.html HTTP/1.0" 200 11101 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
Nochtans heb ik een correcte robots.txt in de root van m'n htdocs (dus bij index.php) met volgende inhoud:

Code: Selecteer alles

User-Agent: *
Disallow: /
Waarom komen die idiote bots nog op m'n website??!
Ghost S1 • 8086K @5.2Ghz • Asus ROG Ryuo 240mm • Asus ROG STRIX Z390-I • Corsair Vengeance LPX 2x16GB 3200Mhz • Asus RTX2080Ti Turbo • Samsung 970 EVO 2TB • Asus ROG Swift PG258Q 240Hz • Logitech G Pro keyboard/mouse/headset
airzimmy
Erelid
Erelid
Berichten: 1047
Lid geworden op: 19 sep 2002, 14:01
Contacteer:

bwa, zo dramatisch is dat toch niet?
Sensei Zeon
Administrator
Administrator
Berichten: 4143
Lid geworden op: 15 sep 2002, 09:08
Locatie: Belgium, Haacht
Contacteer:

Het lijken mij wel yahoo en msn bot, niet google :)
Your Sensei sends his greetz, SeNsEi Ze0n

Afbeelding
wem
Premium Member
Premium Member
Berichten: 666
Lid geworden op: 24 mei 2004, 14:48

zeker dat de searchbots je robots.txt bestandje kunnen vinden?

Voor de zekerheid, er bestaan validators voor je robots.txt-bestandje

Bij mij werkt het allessinds wel ...
Gebruikersavatar
selder
Moderator
Moderator
Berichten: 6305
Lid geworden op: 29 jun 2005, 20:25
Locatie: Tienen
Uitgedeelde bedankjes: 99 keer
Bedankt: 727 keer

Ja, ik heb maar 2 voorbeelden gegeven, maar er staan er nog anderen in ...

En nee dramatisch is dat niet, maar ge moet u toch met iets bezig houden op uw werk zeker? Iets anders dan uw werk bedoel ik dan :d

Maar 'k heb 't al gevonden, het is idd omdat ik een paar subdomeinen heb, en daarin stond nog geen robots.txt bestandje ...
Ghost S1 • 8086K @5.2Ghz • Asus ROG Ryuo 240mm • Asus ROG STRIX Z390-I • Corsair Vengeance LPX 2x16GB 3200Mhz • Asus RTX2080Ti Turbo • Samsung 970 EVO 2TB • Asus ROG Swift PG258Q 240Hz • Logitech G Pro keyboard/mouse/headset
Plaats reactie

Terug naar “Allerlei”