Si può cercare un sito web o una pagina su un argomento specifico usando un motore di ricerca o una Web directory.
Per accedere a un servizio di ricerca basta accedere alla pagina Web corrispondente.
Entrambi i servizi restituiscono una pagina contenente un elenco di collegamenti alle pagine di interesse; per esaminare una pagina basta seguire il relativo collegamento.
I motori di ricerca permettono di indicare in un modulo una o più parole chiave (eventualmente usando operatori booleani), in combinazione con altri criteri di ricerca (per esempio cercando le parole chiave solo nei titoli o nei collegamenti ipertestuali, o restringendo la ricerca a pagine create in un certo periodo o che appartengono a un certo sito) e di ottenere un elenco di collegamenti a pagine più o meno attinenti.
I motori di ricerca eseguono la ricerca in un database che associa ad ogni parola chiave un elenco di indirizzi di pagine, costruito in modo automatico da programmi (chiamati con nomi come spider, crawler, worm) che visitano appositamente il Web.
Poiché l’associazione delle pagine alle parole chiave è fatta automaticamente, i motori di ricerca possono restituire collegamenti a pagine non rilevanti. Per ottenere buoni risultati bisogna scegliere bene i termini e le caratteristiche della ricerca, anche se i motori di ricerca lavorano in modo intelligente, pesando i risultati per esempio in base al numero di occorrenze dei termini o alla presenza dei termini in punti significativi come titoli o link.
I programmi spider usano algoritmi per visitare i nodi di un grafo (il Web è un grafo che ha come nodi le pagine e come archi i collegamenti ipertestuali); la difficoltà è costituita dal fatto che il grafo cambia continuamente e che è enorme.
Le Web directory sono indici sistematici, cioè liste di risorse organizzate in modo gerarchico: vi sono argomenti generali suddivisi in sottoargomenti e così via fino ad arrivare, all’ultimo passo, ad un elenco di collegamenti a pagine relative a un certo argomento, con una breve descrizione; la classificazione delle risorse è fatta da persone che decidono in quale categoria inserire una certa pagina; una pagina può essere inserita anche in più di una categoria.
In pratica le Web directory si possono paragonare al sommario di un libro, i motori di ricerca all’indice.
Conviene usare una Web directory per cercare informazioni generali o avere una panoramica sulle informazioni relative a un certo argomento e un motore di ricerca per trovare informazioni specifiche.
Web directory e motori di ricerca possono restituire solo i collegamenti a pagine che conoscono; non esiste un elenco completo di tutte le pagine Web; è possibile quindi che pagine che sarebbero attinenti non vengano segnalate e che usando strumenti diversi si ottengano risultati diversi.
Per fare in modo che la propria pagina compaia in una Web directory o sia visitata da un motore di ricerca è possibile segnalare esplicitamente l’esistenza della propria pagina.
Alcuni motori di ricerca offrono anche servizi di Web directory.
Consigli per effettuare una ricerca con un motore di ricerca:
-
essere molto dettagliati: usare il maggior numero di parole, non generiche ma il più possibile specifiche, eventualmente combinate con operatori booleani; in generale usando un elenco di parole si ottengono tutte le pagine che contengono almeno una delle parole; per prime vengono presentate le pagine che contengono tutte le parole;
-
esaminare i metodi specifici offerti dal motore di ricerca per raffinare la ricerca: alcuni motori offrono caratteri speciali o criteri avanzati di ricerca particolari; di solito si può usare l’operatore and per specificare che tutti i termini devono essere presenti, l’or per indicare che i termini sono in alternativa, il not per indicare che un termine non deve essere presente ed escludere così un gruppo di pagine, le virgolette per indicare che venga considerata l’intera frase e non i singoli termini;
-
ripetere la ricerca con diversi motori.
Ogni motore di ricerca esegue le ricerche in un database di pagine, diverso da quello degli altri motori. Inoltre i motori di ricerca usano tecniche di ricerca simili ma non identiche. I risultati che si ottengono possono quindi essere molto diversi.
Portali
Un portale è un sito che facilita la ricerca di informazioni sul Web.
Di solito contiene link a risorse, offre un motore di ricerca e può offrire vari tipi di servizi.
Esistono portali generalisti o orizzontali che offrono un motore di ricerca, notizie di attualità, servizi come l’accesso a Internet, spazio Web, account di posta, newsgroup, chat ecc., e portali tematici o verticali orientati a contenuti specifici, che organizzano collegamenti ad altri siti sull’argomento e forniscono servizi specifici.
Uso del motore di ricerca Google
Uno dei motori di ricerca più famosi è Google.
Nei termini di ricerca non c’è distinzione tra maiuscole e minuscole.
Vengono cercate solo le parole esatte digitate; non si possono usare i caratteri jolly per indicare solo le radici delle parole.
Si possono digitare più termini; vengono restituiti prima i risultati che contengono tutti i termini (AND automatico), poi quelli che contengono solo alcuni dei termini. Si può restringere la ricerca aggiungendo ulteriori termini. Per indicare parole in alternativa si può usare l’operatore OR.
L’operatore – prima di un termine permette di escludere le pagine che contengono il termine (corrisponde all’operatore NOT). Le virgolette richiedono che le parole racchiuse siano sempre presenti insieme; questo tipo di ricerca è adatto per esempio per nomi o titoli. L’operatore + permette di richiedere che un termine comune (stop word) o una singola lettera o cifra sia considerato per la ricerca e non escluso come avviene normalmente, anche tra virgolette (per esempio “os/ +2”).
Operatori speciali:
-
site:url paroleChiave
restringe la ricerca a pagine del sito o dominio specificato; -
link:url
restituisce tutte le pagine che contengono un collegamento all’URL indicato; -
define:termine
cerca la definizione di un termine o il significato di un acronimo; restituisce una pagina con l’elenco delle definizioni trovate e i collegamenti alle pagine che li contengono.
Si possono usare operatori speciali per limitare la ricerca a specifiche aree del documento:
-
intitle:parola
restituisce le pagine in cui la parola chiave è presente nel titolo; -
inurl:parola
restituisce le pagine in cui la parola chiave è presente in un collegamento ipertestuale; -
allintitle:paroleChiave
restituisce le pagine in cui tutte le parole chiave sono presenti nel titolo; -
allinurl:paroleChiave
restituisce le pagine in cui la parola chiave è presente in un collegamento ipertestuale.
intitle:cane gatto
cerca cane nel titolo e gatto normalmente.
Si può scegliere se effettuare la ricerca in tutto il Web o solo nei siti italiani (pagine in italiano o provenienti da Italia).
La pagina con i risultati della ricerca inizia con la riga delle statistiche che indica il numero di risultati trovati e il tempo impiegato per la ricerca.
Per ogni risultato viene mostrato il titolo, un testo estratto dalla pagina con i termini di ricerca evidenziati e l’indirizzo della pagina.
Le pagine in lingua straniera possono essere tradotte automaticamente in italiano facendo clic su un collegamento (Traduci questa pagina) (la traduzione automatica naturalmente ha dei limiti, ma si può capire il senso della pagina).
Il comando Copia cache conduce a una copia della pagina come appariva nel momento in cui è stata indicizzata (utile per siti che cambiano spesso il contenuto o quando l’URL della pagina non funziona).
Il comando Simili permette di ottenere altre pagine correlate a quella trovata (con lo stesso livello di generalità, per esempio per la pagina di un prodotto trova pagine di altri prodotti analoghi).
I risultati possono contenere anche indirizzi di pagine che non sono ancora state indicizzate dal motore di ricerca e che vengono individuate perché altre pagine già indicizzate contenevano collegamenti a queste, con il termine cercato presente nel testo associato al collegamento. Nel caso di pagine non ancora indicizzate possono mancare alcuni elementi nei risultati della ricerca (come la copia cache, ma anche il titolo).
PageRank
Il posizionamento di una pagina nei risultati della ricerca dipende dalla pertinenza del contenuto della pagina e delle pagine correlate con i termini e i criteri della ricerca effettuata e dal PageRank della pagina.
Il PageRank (letteralmente rango) di una pagina Web indica il grado di rilevanza, o di popolarità della pagina; in pratica dipende dal numero dei collegamenti alla pagina presenti in altri siti.
Ricerca avanzata
La pagina per la ricerca avanzata di Google presenta un modulo che permette di specificare i termini che devono essere presenti in and, nella stessa frase, in or, o che al contrario non devono essere presenti; permette inoltre di effettuare ricerche sulle pagine in base alla lingua in cui sono scritte, al formato del file in cui sono memorizzate, al periodo di tempo entro cui sono state aggiornate, al sito o al dominio a cui appartengono, ai diritti di utilizzo e al filtro SafeSearch.
È anche possibile cercare pagine simili a una certa pagina, o pagine che contengono collegamenti a un URL specificato.
Ricerca di immagini
Scegliendo il collegamento Immagini nella finestra di Google si possono effettuare ricerche per parole chiave e filtrare le immagini in base a dimensione, colori, tipo, data e diritti di utilizzo (Attenzione: Le immagini possono essere protette da copyright.
Web Directory
Un esempio di Web directory è DMOZ.
Ci sono categorie principali in grassetto e alcune sottocategorie in carattere più piccolo.
Selezionando una categoria si ottengono pagine sempre più dettagliate, che contengono collegamenti a sottocategorie e/o a pagine appartenenti alla categoria.