logo risorsegratis.org
EmediateAd

risorse gratis nel web

torna a home + speciale motori di ricerca
risorse gratis nel web
Home
Software gratis
Servizi internet
Musica gratis
Lavoro
Risorse webmaster
Telefonia gratis
Giochi gratis
Cinema e TV
Cultura
Sport
Utilità
Video
Speciale sui motori di ricerca
Sale giochi gratis
Tools utili
Canali
 
servizi
Segnala una risorsa gratuita
Aggiungi un sito alla directory di Risorsegratis.org
Contatti
 
Prenota un volo
Prodotti apple
Spazio web a soli 20,66 €!  

250 biglietti da visita gratis!
Interessi bancari al 4,25%!  
Inserisci un annuncio gratis!
15 minuti gratis di telefonate
Sconti telefonate
   
EmediateAd 
 
EmediateAd 
 
 
Agg. 30/7/08
Guida al posizionamento nei motori di ricerca: Il file robots.txt
giochi gratis tv gratis emule gratis
Lezione 8. Il file robots.txt

Il file robots.txt serve per indicare agli spider dei motori di ricerca se analizzare o saltare un determinato file o addirittura un'intera directory. Se ad esempio volessimo che non venissero indicizzate le immagini del nostro archivio presenti nella directory image non faremmo altro che dirgli di saltare tale directory. Ricordiamoci che, come per il meta tag ROBOTS, questa è una richiesta e non è detto che lo spider la consideri.

Ma come va realizzato il file robots.txt?
Basta aprire un qualsiasi editor di testo e creare un nuovo file chiamato 'robots.txt'.
Il file è composto dall'istruzione 'User-agent:' che indica il nome dello spider seguita dall'istruzione 'Disallow:' che dice allo spider dove non passare.
Se vogliamo evitare il passaggio solo allo spider di Google scriveremo 'User-agent: googlebot'; in questa maniera eviteremmo il passaggio solo dello spider di Google per la pagina o la directory che indicheremmo. Se volessimo evitare il passaggio a tutti gli spider di qualsiasi motore di ricerca scriveremmo 'User-agent: *'.
Per indicare allo spider o agli spider di non analizzare la pagina 'pippo.html' scriveremmo 'Disallow: pippo.html' mentre se volessimo che gli spider saltassero la directory image scriveremmo 'Disallow: /image/'.
Ecco alcuni esempi:

User-agent: Googlebot
Disallow: pippo.html
in questo caso viene chiesto solo allo spider di Google di saltare il file pippo.html

User-agent: *
Disallow: /image/
in questo caso viene chiesto a tutti gli spider di saltare la cartella image

Ma dove va posizionato il file robots.txt?
Il file robots.txt deve essere uno solo e deve essere messo nella cartella principale.

Indice della guida al posizionamento dei motori di ricerca
Lezione 1. Introduzione
Lezione 2. Descrizione dei motori di ricerca
Lezione 3. Spider e analisi siti web
Lezione 4. Frame, cosa non fare
Lezione 5. Il titolo della pagina web
Lezione 6. I meta tag
Lezione 7. Le keywords
Lezione 8. Il file robots.txt
Lezione 9. I link e la navigabilità del sito web
Lezione 10. I contenuti di un sito web
Lezione 11. Le cose maggiormente da evitare
Lezione 12. Promozione siti web
Lezione 13. Come rimanere ai primi posti nei motori di ricerca
Fonte: >> Guida realizzata da Renzo Merelli - www.softwaremerelli.it
*Per espressa volontà dell'autore, la guida non può essere modificata o diffusa senza previo consenso dell'autore*
In evidenza: Iscriviti al corso GRATIS di Web Marketing! 
 
sala giochi gratis
 
3 libri a 1,50 €!
 
emule gratis
Scarica eMule gratis!
giochi gratis
Scarica 1500 giochi gratis InternetGameBox
tv gratis
Scarica Webmediaplayer e guarda gratis migliaia di canali Tv e radio!
Google
 
Web www.risorsegratis.org
Per i webmaster I giochi di risorsegratis.org sul tuo sito!
Risorsegratis.org non è collegato ai siti recensiti e non è responsabile per i loro contenuti.