Un motore di ricerca ci consente di organizzare le informazioni e trovare le informazioni sul World Wide Web. Un motore di ricerca è un programma per computer che ci aiuta a inviare una query che compone una parola o una frase che descrive le informazioni uniche che stiamo cercando di localizzare sul web. Il motore di ricerca quindi trova nel suo database il tentativo di abbinare la query. Raggruppa e restituisce un elenco di URL contenenti presentazioni corrispondenti alla nostra query. Questo elenco è ordinato o classificato in base alle migliori corrispondenze che appaiono in alto. Un motore di ricerca generale recupera le informazioni da un database che contiene informazioni in un';ampia varietà di argomenti.
Come funziona la ricerca
Un motore di ricerca ottiene le sue informazioni utilizzando un raccoglitore, un programma che attraversa il WEB e raccoglie informazioni sui documenti Web. Molte persone potrebbero non trovare i motori di ricerca facili da usare, in quanto potrebbero aspettarsi una lista ristretta di URL che può semplificare la loro ricerca. Per restringere questa ricerca usiamo una tecnica nota come web crawler. Un web crawler (noto anche come web spider o web robot) è un programma o script automatico che esplora il World Wide Web in modo metodico e automatico. Altri nomi utilizzati meno frequentemente per i web crawler sono le formiche, gli indicizzatori automatici, i bot e i worm.
Questo processo è chiamato web crawling o spidering. Molti siti, in particolare motori di ricerca, utilizzano lo spidering come mezzo per fornire informazioni aggiornate. I crawler Web vengono principalmente utilizzati per creare una copia di tutte le pagine visitate per l';elaborazione successiva da parte di un motore di ricerca che indicizzerà le pagine scaricate per fornire ricerche rapide. I crawler possono anche essere utilizzati per automatizzare le attività di manutenzione su un sito Web, come il controllo dei collegamenti o la convalida del codice HTML. Inoltre, i crawler possono essere utilizzati per ottenere tipi specifici di informazioni dalle pagine Web, come la raccolta di indirizzi e-mail (di solito per lo spam). Il recente aumento del numero di pagine generate dai linguaggi di scripting lato server ha anche creato difficoltà in quella infinita combinazione di parametri HTTP GET esiste, solo una piccola selezione di cui effettivamente restituirà risultati unici.
Per riassumere, la classifica delle pagine web dipende da molti fattori. Le parole chiave corrispondenti più vicine del sito Web, i siti più visitati e più popolari. Esaminano ciò che viene inviato, viene elaborato cercando le parole chiave, memorizzato nel meta tag della pagina web. Qualunque sia la migliore corrispondenza possibile, viene raccolta e restituita all';utente. Come funziona il motore di ricerca di Google Cominciamo con un motore più piccolo: InfoSeek. Indicano solo circa 200 parole della tua pagina web, quindi è importante assicurarsi di avere meta tag sul tuo sito e che le cose più importanti siano elencate per prime. Le informazioni che inserisci nei tuoi meta tag verranno utilizzate per visualizzare una descrizione del tuo sito e la maggior parte dei meta tag può contenere circa 200 caratteri di testo. Il meta tag delle parole chiave, tuttavia, può contenere fino a 1.000 caratteri.
Queste semplici regole sono importanti da tenere a mente per tutti i motori di ricerca. Più importante è l';informazione, più vicino deve essere all';inizio dei meta tag o anche all';inizio del contenuto del tuo sito. Molti motori di ricerca non toccheranno nemmeno i tuoi meta tag, quindi è importante che tu abbia le stesse informazioni nel tuo corpo che hai nei tuoi meta tag (anche se ovviamente non puoi semplicemente inserire liste ed elenchi di parole chiave in quanto ciò sarebbe dannoso per il contenuto del tuo sito).
Il motore di ricerca di AltaVista invierà Scooter, il suo spider, per controllare il tuo intero sito. Lo scooter può impiegare fino a tre mesi per spiderare e indicizzare completamente il tuo sito? il ragno medio richiede solo 6-8 settimane. Lo scooter normalmente spider tra le due e le dieci pagine del tuo sito ogni settimana. Ciò significa che quanto più a lungo dura il tuo sito web, tanto più sarà indicizzato, come nell';esempio di come i motori di ricerca implementano la Teoria di Darwin nella loro ideologia.
Excite era una potente centrale di ricerca, ma ora è stata abbandonata come provider di ricerca AOL e Netscape, quindi è meno importante di una volta. L';algoritmo utilizzato per determinare la pertinenza delle parole chiave è molto complicato: indicizza le tue pagine e tenta di riepilogarle selezionando solo le frasi più pertinenti. Aspettatevi di rivedere le vostre pagine all';incirca una volta ogni due settimane. Tieni presente, tuttavia, che i meta tag non hanno alcun significato di Excite quando si tratta di classifiche, anche se utilizzerà i tag di descrizione purché le parole siano pertinenti alle tue pagine? soddisfare.
Passiamo a Lycos. Lycos ha completamente integrato l';Open Directory Project (ODP) nelle sue pagine di risultati tradizionali, e usa anche i risultati di ricerca di AllTheWeb. Lycos esegue anche click-through al loro sito affiliato HotBot. Lycos è uno dei motori di ricerca più difficili da comprendere, poiché le pagine di presentazione dicono una cosa, ma poi indicizzano il tuo sito in un modo completamente diverso. Come regola generale, il tuo sito verrà indicizzato in Lycos a tempo debito finché sarai indicizzato in ODP e AllTheWeb.
Anche se WebCrawler è di proprietà di Excite, ha ancora il proprio motore di ricerca e indicizzatore. Se ti capita di essere elencato con WebCrawler, dovresti provare a rimanere elencato con loro, poiché non è il motore di ricerca più facile da elencare. I suoi standard :hit-and-miss: combinati con i metodi di indicizzazione sporadici rendono il processo di presentazione difficile, anche se non impossibile.
Il più grande giocatore è, ovviamente, Google, che usa un sistema di classificazione delle pagine come base centrale del loro indice. Una volta era quasi impossibile manipolare questo sistema di classificazione delle pagine per aumentare le classifiche, ma la gente ha capito subito che più collegamenti potevano generare sul proprio sito sul resto della rete, migliore era la classificazione di Google. Non si ritiene che Google utilizzi classificazioni sensibili al contesto. Le informazioni sensibili al contesto vengono utilizzate su Yahoo, Looksmart e ODP, tuttavia, e Google spider regolarmente tali siti quando reindicizza il proprio database.
MSN è un altro motore di ricerca importante. La santa trinità dei motori di ricerca al momento è Google, Yahoo !, e MSN. Questi tre motori di ricerca si combinano per fornire la maggior parte del traffico che riceverai dai motori di ricerca. MSN sarà in genere il primo motore di ricerca a indicizzare il tuo sito e quasi sicuramente sarà in grado di elencare la maggior parte delle pagine più velocemente.
Sebbene nessuno possa dirti esattamente quando sarai indicizzato su qualsiasi motore di ricerca, è meglio controllare almeno una volta alla settimana. Qualunque cosa tu faccia, però, non inviare nuovamente il tuo sito più spesso di ogni due mesi o giù di lì? potresti non essere indicizzato affatto se lo fai.