La ricerca delle informazioni

1 Dicembre 2011: Istituto Catullo Belluno – Terza area – Informatica

Ho bisogno di alcune informazioni utili per la mia professione di operatrice in un asilo, animatrice in un centro estivo, …

  • Un bambino ha delle macchie rosse sul viso, si tratta di una malattia infettiva?
  • Ho bisogno di un nuovo gioco di gruppo.
  • Devo preparare una merenda.

Dove cerco le informazioni?

Se ho tempo…

  • Prendo in prestito un libro in biblioteca
  • Compro un libro
  • Mi abbono a una rivista specializzata

Se ho fretta

  1. Chiedo un consiglio a colleghi/e
  2. Consulto i libri e gli altri materiali di studio in mio possesso
  3. Cerco in Internet…

In Internet dove?

Se ho tempo…

  • Newsletter – Mi iscrivo a una newsletter e ricevo periodicamente una e-mail da un esperto con tutte le novità sull’argomento
  • Feed RSS – Utilizzo il servizio
  • Forum, Newsgroup, Gruppo di discussione, … – Mi iscrivo e poi consulto periodicamente il luogo virtuale di discussione.

Se ho fretta

  1. Consulto un sito specializzato
  2. Consulto un sito generalista, ma attinente
  3. Utilizzo un motore di ricerca…

Il motore di ricerca

Alcuni siti (Wikipedia:Motore_di_ricercaBingGoogle)

  • forniscono un servizio gratuito
  • di ricerca delle risorse presenti nel web
  • a partire da poche parole chiave.

Quale scegliere?

La competizione tra motori di ricerca è molto selettiva…

  • Quasi tutti i motori di ricerca del passato sono stati chiusi: Altavista, Arianna, Ask, Virgilio, …
  • Alcuni siti offrono il motore di ricerca ma in realtà utilizzano il servizio fornito da Bing o Google.
  • Alcuni motori di ricerca sono in realtà metamotori: elaborano i risultati ottenuti da altri motori di ricerca.

Come funziona?

Le parole inserite nella casella di ricerca diventano l’input di un programma che consulta un archivio e produce in output un elenco ordinato di siti web.

Come tutto funziona, nei particolari, è un segreto industriale ma…

  1. Un software specializzato (bot, crawler, spider, robot) scandaglia continuamente il web
    • comincia con siti inseriti manualmente oppure segnalati dagli utenti
    • decide se catalogare o scartare i contenuti
    • segue i link che incontra nelle pagine e ricomincia
  2. I dati raccolti diventano copie cache e dati per l’archivio
  3. Ogni pagina catalogata riceve un certo punteggio che dipende da
    • nome del dominio
    • titolo della pagina
    • numero di parole significative presenti
    • numero di pagine che contengono un collegamento a essa
    • numero di visitatori
    • data di creazione o aggiornamento
  4. Il punteggio della pagina determina la posizione alla quale apparirà nei risultati
  5. La posizione dipende anche dalle sponsorizzazioni???