logo risorsegratis.org

risorse gratis nel web

torna a home + speciale motori di ricerca
risorse gratis nel web
Home
Software gratis PC
Software gratis MAC
Servizi internet
Musica gratis
Lavoro
Risorse webmaster
Telefonia gratis
Giochi gratis
Cinema e TV
Cultura
Sport
Utilità
Video
Speciale sui motori di ricerca
Sale giochi gratis
Tools utili
Canali
Notizie di attualità
Sconti, offerte e concorsi a premi
Cms open source
Linux
 
servizi
Segnala una risorsa gratuita
Aggiungi un sito alla directory di Risorsegratis.org
Contatti
 
Prenota un volo
Cartuccia gratis per una stampante
Spazio web a soli 20,66 €!  

250 biglietti da visita gratis!
Una suoneria gratis!
Inserisci un annuncio gratis!
Assicurazione a prezzi bassi!
   
inserisci un annuncio gratis segnala una risorsa gratuita
 
 
Agg. 2/2/12
Guida al posizionamento nei motori di ricerca: Il file robots.txt
crea sito web gratis Crea un sito gratis Inserisci il tuo cv casual dating
 
Lezione 8. Il file robots.txt

Il file robots.txt serve per indicare agli spider dei motori di ricerca se analizzare o saltare un determinato file o addirittura un'intera directory. Se ad esempio volessimo che non venissero indicizzate le immagini del nostro archivio presenti nella directory image non faremmo altro che dirgli di saltare tale directory. Ricordiamoci che, come per il meta tag ROBOTS, questa è una richiesta e non è detto che lo spider la consideri.

Ma come va realizzato il file robots.txt?
Basta aprire un qualsiasi editor di testo e creare un nuovo file chiamato 'robots.txt'.
Il file è composto dall'istruzione 'User-agent:' che indica il nome dello spider seguita dall'istruzione 'Disallow:' che dice allo spider dove non passare.
Se vogliamo evitare il passaggio solo allo spider di Google scriveremo 'User-agent: googlebot'; in questa maniera eviteremmo il passaggio solo dello spider di Google per la pagina o la directory che indicheremmo. Se volessimo evitare il passaggio a tutti gli spider di qualsiasi motore di ricerca scriveremmo 'User-agent: *'.
Per indicare allo spider o agli spider di non analizzare la pagina 'pippo.html' scriveremmo 'Disallow: pippo.html' mentre se volessimo che gli spider saltassero la directory image scriveremmo 'Disallow: /image/'.
Ecco alcuni esempi:

User-agent: Googlebot
Disallow: pippo.html
in questo caso viene chiesto solo allo spider di Google di saltare il file pippo.html

User-agent: *
Disallow: /image/
in questo caso viene chiesto a tutti gli spider di saltare la cartella image

Ma dove va posizionato il file robots.txt?
Il file robots.txt deve essere uno solo e deve essere messo nella cartella principale.

Indice della guida al posizionamento dei motori di ricerca
Lezione 1. Introduzione
Lezione 2. Descrizione dei motori di ricerca
Lezione 3. Spider e analisi siti web
Lezione 4. Frame, cosa non fare
Lezione 5. Il titolo della pagina web
Lezione 6. I meta tag
Lezione 7. Le keywords
Lezione 8. Il file robots.txt
Lezione 9. I link e la navigabilità del sito web
Lezione 10. I contenuti di un sito web
Lezione 11. Le cose maggiormente da evitare
Lezione 12. Promozione siti web
Lezione 13. Come rimanere ai primi posti nei motori di ricerca
Fonte: >> Guida realizzata da Renzo Merelli - www.softwaremerelli.it
*Per espressa volontà dell'autore, la guida non può essere modificata o diffusa senza previo consenso dell'autore*
In evidenza: Segnala i tuoi articoli ad oltre 100 siti di editoria sociale e social bookmarking con Article Marketing Turbo Clicca qui
 
occasioni
crea sito gratis
 
 
 
crea sito web gratis Crea un sito gratis casual dating
Incontri spontanei e senza impegno
sconti e offerte Sconti e offerte in promozione
Per i webmaster I giochi di risorsegratis.org sul tuo sito! Segnala una risorsa gratuita!
Privacy

Risorsegratis.org non è collegato ai siti recensiti e non è responsabile per i loro contenuti.