Una
breve premessa
I
motori di ricerca
Com'è noto i motori di ricerca nascono per far sì che ciascun navigatore trovi
immediatamente ciò che sta cercando con il maggior numero di occorrenze possibili.
Semplificando al massimo sono come delle enormi banche-dati che, sulla base delle
parole o delle frasi inserire nel campo di ricerca, restituiscono le pagine che più si
avvicinano alle chiavi inserite, seguendo criteri non sempre univoci. In realtà ogni
motore ha una sua formula particolare di indicizzazione per cui un sito primo su Google in
base alla ricerca effettuata molto difficilmente risulterà primo anche in altri motori
come Altavista o Shinyseek. In queste banche-dati sono indicizzate miliardi di pagine web
e poiché il navigatore medio statisticamente non va oltre i siti presenti nelle prime
cinque pagine trovate dal motore, ecco l'esigenza di aver un buon posizionamento.
Le
chiavi di ricerca
Un navigatore, quando effettua una ricerca, inserisce delle parole logiche e quindi se
cerca la biografia di un particolare autore digiterà la frase biografia di xxxxxxxx.
Per questo motivo sono importanti le cosidette parole chiave che verranno
inserite nelle pagine di un sito. Queste parole chiave fanno in modo che, quando
un motore di ricerca scandaglia la sua banca-dati alla ricerca dei siti che hanno quel
tipo di parola chiave, questi ultimi appaiano tra i risultati della ricerca.
I
risultati della ricerca
Come detto i motori di ricerca sono siti che indicizzano un numero elevatissimo di
pagine web per cui una parola troppo comune, come gratis, restituirà milioni di siti.
Associando alla prima parola un sostantivo, ad esempio clipart gratis, il campo di ricerca
sarà più limitato ed il risultato più soddisfacente. Specificando ancora meglio con una
frase, tipo clipart gratis in italiano, il risultato sarà ancor più circoscritto. E' da
precisare che il motore mostrerà per primi i siti che conterranno parole chiave o avranno
nel loro titolo o nel loro contenuto clipart gratis e in italiano, ma fornirà anche i
risultati delle sottostringhe clipart gratis, clipart in italiano, clipart, gratis,
italiano.
Per circoscrivere al massimo la ricerca si può provare ad inserire la frase tra
virgolette "clipart gratis in italiano": in questo modo il motore restituirà
come risultato solo i siti che avranno nel loro titolo, nel loro contenuto, nelle loro
parole chiave questa frase nell'ordine esatto delle parole e quindi un sito che contenga o
nel titolo o nel contenuto o nelle parole chiave la frase "clipart in italiano
gratis" non apparirà tra i risultati della ricerca.
Come
fanno i motori ad indicizzare le pagine
Tramite gli spiders che sono programmi che scandagliano in modo automatico e
sistematico il web alla ricerca delle pagine. Ogni spider lavora in maniera differente ed
estrapola i dati in maniera diversa da motore a motore: c'è quello che privilegia il
titolo e le prime parole di ciascuna pagina, c'è quello che tiene in considerazione il
titolo, i links presenti ed i links esterni che puntano a quella pagina, ecc. Ma tutti gli
spiders tengono in considerazione i MetaTag. Analizziamo quali sono i criteri più diffusi
che utilizzano i motori di ricerca per indicizzare i siti e cioè l'ordinamento in
base alla rilevanza (relevance ranking) che è una complessa e variabile formula
rigorosamente segreta e differente per ciascun motore dei seguenti elementi:
- la frequenza dei termini utilizzati per la ricerca all'interno della pagina;
- la densità, cioè il rapporto tra la parola ricercata ed il totale delle parole
contenute nella pagina;
- l'originalità della parola cioè il rapporto tra le parole contenute nella pagina e
quelle contenute nella loro banca-dati;
- la mancata presenza di alcuni termini molto comuni che vengono volutamente ignorati.
Parole come "web", "Internet", "software" sono classiche
"stop words" ed è inutile inserirle a meno che non siano combinate con altre
più rare;
- la contemporanea presenza nella pagina di parte o di tutte le parole o addirittura
dell'esatta frase digitata nel campo di ricerca;
- l'ordine in cui sono state immesse le parole nel campo di ricerca rispetto a quelle
presenti in ciascuna pagina;
- la posizione delle parole nella pagina, in particolare le prime 200 parole contenute
nella pagina (tag body) e soprattutto ciò che è presente nell'intestazione (tag head),
in particolare il titolo, le parole chiave e la descrizione;
- la popolarità, cioè il numero di link esterni che puntano a quella pagina;
- l'aggiornamento della pagina.
Le
allergie degli spiders
Pur se i motori sono sempre più evoluti e a saperli utilizzare bene si riesce a
trovare in rete anche l'impossibile, gli spiders che vengono da loro impiegati sono
allergici a tutto ciò che non è linguaggio HTML. Sono bravissimi a trovare un link nella
forma <a href="http://www.miosito.com"></a>, ma se trovano un link
in JavaScript, o contenuto in un'applet, o in linguaggio Flash o davanti alle pagine
dinamiche in ASP, CGI, ecc. si bloccano. Ad eccezione delle pagine tradizionali in HTML
statico, gli spiders non si sono evoluti verso altre forme di linguaggio. Gli spiders sono
allergici inoltre ai siti strutturati in frames: è più facile che indicizzino le singole
pagine costituenti il frameset che la pagina contenitore. Verso la fine del manuale
sveleremo dei trucchetti per far sì che, anche qualora vengano indicizzate le singole
pagine costituenti il frameset, chiunque clicchi su quel link apra il nostro sito in
frames.
Cosa
sono i MetaTag
I MetaTag sono delle istruzioni, non visualizzabili dal programma di navigazione, ma
ben visibili agli spiders dei motori di ricerca che quando analizzano una pagina non la
guardano dal lato in cui siamo abituati a vederla noi navigatori, ma dalla parte del
linguaggio di programmazione.
Essendo posti nell'intestazione del documento tra i tag <head> e </head> sono
addirittura la prima cosa che trovano. Con queste istruzioni, non solo comunichiamo il
titolo della pagina, ma anche i contenuti, la descrizione del sito, il genere di argomento
che trattiamo nel nostro sito, in quale lingua o in quali lingue è scritto, ogni quanto
viene aggiornato, se vogliamo che la pagina sia indicizzata oppure no, se vogliamo che lo
spiders segua i links e analizzi anche le altre pagine linkate e le indicizzi e molte
altre cose ancora che andremo ad approfondire in questo manuale. Creare ed inserire i
MetaTag è cosa delicata e la scelta di un contenuto rispetto ad un altro spesso incide in
maniera decisiva sulla catalogazione delle nostre pagine web. Per inserire i MetaTag
occorre lavorare sul linguaggio di programmazione ed è quindi necessario avere un minimo
di conoscenza del linguaggio HTML.
Dove
vanno inseriti i MetaTag
Direttamente nel linguaggio HTML tra i tag <head> e </head> come nella
figura sottostante: |