sabato 16 maggio 2009

Google




Google (in inglese /ˈguːg(ə)l/ [ˈguːgɫ̩], adattamento italiano /ˈgugol/) è un motore di ricerca per Internet che non si limita a catalogare il World Wide Web, ma si occupa anche di immagini, foto, newsgroup, notizie, mappe, video, oltre a mantenere una copia cache di tutte le pagine che conosce.

Con un indice che comprende più di otto miliardi di pagine Web, è riconosciuto come il più grande e affidabile tra i motori di ricerca, occupandosi attraverso il suo sito di oltre il 70% di tutte le ricerche effettuate su internet.

La popolarità di Google è talmente grande che nella lingua inglese è nato il verbo "to google" col significato di "fare una ricerca sul web". Allo stesso modo in tedesco è nato il verbo "googeln"; con lo stesso significato, e in Italia il verbo "googlare" (pron: guglare) o googolare (pron: gugolare).

L'azienda [modifica]
Larry Page e Sergey Brin, allora studenti dell'Università di Stanford, dopo aver sviluppato la teoria secondo cui un motore di ricerca basato sull'analisi matematica delle relazioni tra siti web avrebbe prodotto risultati migliori rispetto alle tecniche empiriche usate precedentemente, fondarono l'azienda il 27 settembre 1998. Convinti che le pagine citate con un maggior numero di link fossero le più importanti e meritevoli (Teoria delle Reti), decisero di approfondire la loro teoria all'interno dei loro studi e posero le basi per il loro motore di ricerca.

L'algoritmo PageRank, che è la base del motore di ricerca, è stato costruito ispirandosi all'algoritmo Hyper Search ideato da Massimo Marchiori, un matematico italiano. (http://dbpubs.stanford.edu:8090/pub/1998-8)

L'azienda, che ha il proprio quartier generale a Mountain View in California, nel cosiddetto Googleplex, è al momento gestita con capitali privati, i maggiori detentori di quote sono Kleiner Perkins Caufield & Byers and Sequoia Capital. Nell'ottobre 2003, discutendo una possibile offerta pubblica iniziale la società fu contattata da Microsoft a proposito di un possibile accordo o di una fusione; Google rifiutò l'offerta.

Nel gennaio 2004 è stata annunciata l'assunzione di Morgan Stanley e Goldman Sachs Group per organizzare l'offerta pubblica iniziale, che ha raggiunto il primo giorno circa i 2 miliardi di dollari americani (19,6 milioni di azioni a circa 100 dollari l'una); la quotazione ha iniziato subito a salire, raggiungendo a novembre 2004 i 200 dollari per azione. A novembre 2007 l'azione oscilla intorno ai 700 dollari. Il 23 gennaio 2008 Google perde circa il 10% in Borsa a Wall Street, e quindi brucia 16,3 miliardi di dollari. La perdita è dovuta alle indicazioni non proprio positive degli analisti Ubs,secondo cui il tasso di crescita del titolo dovrebbe segnare nel quarto trimestre un brusco rallentamento rispetto al precedente trimestre.

Il 9 marzo 2006, Google ha acquistato dalla compagnia Upstartle Writely un word processor utilizzabile tramite Browser, che permette il salvataggio dei file prodotti in formati assai diffusi, permettendo una facile interoperabilità con vari Software di produttività personale. Infine, il 9 ottobre 2006, Google ha rilevato il portale per video amatoriali YouTube, vero fenomeno di massa tra i giovani per la facilità di condivisione di video amatoriali con circa 20 milioni di visitatori al mese, per l'astronomica cifra di 1,65 miliardi di dollari.


Etimologia [modifica]
La parola "Google" deriva da googol, termine coniato da Milton Sirotta (nipote all'epoca minorenne del matematico statunitense Edward Kasner) nel 1938, per riferirsi al numero rappresentato da 1 seguito da 100 zeri. L'uso della parola fatto da Google riflette la volontà della società di organizzare l'immensa quantità di informazioni disponibili sul Web. Il termine viene inoltre associato con un gioco di parole all'inglese goggles, binocolo, appunto perché il motore permette di "guardare da vicino" la rete. La parola Google richiama inoltre una fantomatica formula magica; riguardo alla derivazione della formula esistono tesi opposte e contrastanti, ma la più comune la attribuisce ad una popolazione africana che la usava come buon auspicio per la caccia.


PageRank [modifica]
Per approfondire, vedi la voce PageRank.

Il PageRank è un voto su una scala da 0 a 10 che Google attribuisce a una pagina web in base al suo grado di pertinenza e ai suoi contenuti. Il PageRank è calcolato sulla base di diversi criteri: visite giornaliere, collegamenti alla pagina da altre pagine web, l'estensione del dominio, il PageRank dell'homepage, e altro.


AdWords [modifica]
AdWords è il servizio che Google offre agli inserzionisti per inserire il proprio sito all'interno dei risultati di ricerca, nella tabella "collegamenti sponsorizzati". Il servizio non è gratuito, ha un costo per click, stabilito in precedenza dall'inserzionista, che viene scalato dal budget a disposizione ogni volta che un utente clicca sull'annuncio (pay-per-click). È possibile personalizzare ulteriormente la propria campagna pubblicitaria: si può inserire un limite al budget giornaliero, selezionare le aree geografiche dove far comparire l'annuncio, scegliere le parole chiave per la visualizzazione dell'annuncio.


AdSense [modifica]
Per approfondire, vedi la voce AdSense.

AdSense è il servizio di Google che permette agli affiliati di guadagnare inserendo della pubblicità nel proprio sito. L'utente cede a Google uno spazio nella propria home page (solitamente una striscia orizzontale in basso o verticale). L'algoritmo di AdSense scansiona il contenuto delle pagine web degli utenti affiliati. Poi Google inserisce nella sezione i propri annunci pubblicitari in base alle parole chiave trovate. È fondamentale la correlazione semantica tra contenuti della pagina web e annunci: questi ultimi devono essere pertinenti al sito che li ospita. La remunerazione è basata principalmente sul sistema del pay per click: Google paga qualche centesimo di dollaro ogni volta che un utente clicca sull'annuncio AdSense.



I server [modifica]
Google utilizza un parco macchine con più di 450.000 computer GNU/Linux per rispondere alle ricerche e catalogare il web.

Grazie a questa enorme potenza di calcolo, Google è in grado di effettuare una ricerca su milioni di pagine Web in alcuni millisecondi, di indicizzare un elevato numero di contenuti ogni giorno, di fare molti mirror e istanze dello stesso processo informatico su più server.

Per quest'ultimo, il fatto che Google sia uno dei siti più visitati del Web, e il numero contemporaneo di richieste che arrivano da più utenti, non rallentano l'efficienza di queste ricerche. Google dispone di molti server sui quali gira un elevato numero di ricerche contemporaneamente.

La catalogazione è fatta da un programma (googlebot) che richiede periodicamente nuove copie delle pagine web che conosce. I link in queste pagine vengono esaminati per scoprire nuove pagine e aggiungerle nel database, il cui indice, insieme alla cache, occupa milioni di terabyte.


Ottimizzazione [modifica]
Per approfondire, vedi la voce Ottimizzazione dei motori di ricerca.

Da quando Google è diventato uno dei motori di ricerca più popolari, molti webmaster hanno cominciato a seguire e cercare di spiegare i cambiamenti nel posizionamento (rank) del loro sito.

Una nuova categoria professionale è nata per assistere i webmaster e le aziende nel migliorare la posizione dei loro siti nei risultati delle ricerche su Google, così come su altri motori di ricerca. Questi consulenti si occupano di un'attività chiamata "ottimizzazione per i motori di ricerca" (dall'acronimo statunitense SEO: Search Engine Optimization) che si propone di creare pagine e siti che rispettino le regole (i "gusti") dei motori di ricerca riuscendo a migliorare la propria posizione nei risultati delle ricerche.

Sul web si possono trovare discussioni su forum o siti che fanno riferimento a fenomeni come la Google dance. Si riferisce a un fenomeno, ora non più presente, che si verificava in un periodo di pochi giorni (circa ogni mese) in cui Google aggiornava il suo database e di conseguenza i risultati delle ricerche. Fra una dance e l'altra i risultati rimanevano inalterati. Il termine dance si riferiva al fatto che per alcuni giorni i risultati delle ricerche variavano (danzavano quindi) continuamente prima di assestarsi. Nell'estate del 2003 Google ha cambiato le sue abitudini di catalogazione limitando gli effetti della "danza": ora i risultati delle ricerche variano in modo dinamico e continuativo senza nessuno stravolgimento periodico.

Una delle sfide più importanti di Google, ora che il motore è diventato popolare tra gli utenti del web, è impedire che soggetti spregiudicati riescano a forzare le debolezze dell'algoritmo per sovvertire i risultati delle ricerche a loro vantaggio. Molti consulenti di ottimizzazione scarsamente professionali hanno utilizzato tecniche artificiose e dannose per influire sul posizionamento dei siti di alcuni loro clienti. Google è riuscito a limitare molti di questi tentativi raffinando il proprio algoritmo per individuare i siti che realizzano abusi e limitarne la rilevanza nei risultati (o addirittura rimuovere questi siti dai suoi archivi). Un corretto posizionamento fra i risultati di Google può portare a ritorni economici elevati, soprattutto per i siti di e-commerce. La scelta di un consulente serio è spesso strategica per la sopravvivenza o il successo di un sito. Per questi motivi, Google ha pubblicato un insieme di linee guida per aiutare i proprietari di siti a capire come individuare i consulenti professionali e come evitare truffe e raggiri da parte di operatori scorretti[2]


Google e la legge [modifica]
Google è stato criticato per via dei cookie a lungo termine che posiziona sul computer degli utenti; in ogni caso la maggior parte dei servizi di Google possono essere usati anche con i cookie disabilitati.

Un numero di organizzazioni hanno usato le leggi sul DMCA (Digital Millennium Copyright Act) per chiedere a Google di rimuovere link a materiale su altri siti sul quale esse rivendicavano diritti di copyright. Google risponde a queste richieste rimuovendo il link e includendone uno alla richiesta nei risultati della ricerca. Ci sono anche state critiche sul fatto che la cache di Google violi il copyright, in ogni caso il caching è una normale parte delle funzioni del web e il protocollo HTTP mette a disposizione meccanismi (che Google rispetta) per disabilitarlo.

Nel 2002 si diffuse la notizia[3] che in Cina l'accesso a Google era stato vietato (il governo ha il controllo della rete e può impedire il collegamento verso alcuni siti). Un sito mirror (in tutti i sensi, compreso il testo da sinistra verso destra; mirror letteralmente significa "specchio") chiamato "elgooG" si rivelò efficace nell'aggirare il divieto. Tempo dopo, il divieto cessò e fu detto che non era stato istituito per impedire le ricerche, ma l'accesso alla cache (che permetteva di aggirare altri divieti imposti dal governo). Esiste anche un mirror dinamico di Google che funziona come proxy server[4]. È interessante notare che un servizio di caching viene realizzato anche da Internet Archive, al quale però non fu vietato l'accesso.

Diversamente da Yahoo!, Google non è anche una directory; tutte le pagine di Google sono indicizzate in maniera automatica da un algoritmo statistico che valuta la pertinenza del sito con le parole chiave indicate, quale parole assegnargli, il numero di accessi e altri parametri come indicatori di qualità del sito.

Tuttavia, Google conserva una copia (cache) di tutte le pagine indicizzate e la cancella dai suoi server solo su esplicita richiesta del titolare del sito/provider Internet.

Il tentativo dichiarato da Google è di costruire un World Wide Web, di premiare i siti di qualità dando maggiore risalto nei primi risultati delle varie ricerche, di servire agli utenti per avere risposte soddisfacenti alle loro ricerche. Molti motori di ricerca svolgono anche una funzione commerciale; varie aziende pagano un ranking fra i primi 10 risultati come una spesa pubblicitaria.


Google e la censura [modifica]
Il servizio Google News cinese, di recente introduzione, sarebbe modellato sulle necessità di censura del paese orientale. Alcune news appartenenti a siti censurati dal governo di Pechino non verrebbero pubblicate accedendo al portale da una connessione cinese.

Il tutto è emerso grazie alle segnalazioni giunte da un volontario di DynaWeb (proxy che permette agli utenti cinesi un accesso anonimo in grado di svincolarsi dalla potente censura governativa): in base alla località delle ricerche i risultati restituiti sono differenti, ed in particolare sembrano essere tagliate fuori particolari testate.

Con tanto di screenshot viene dunque dimostrato come testate quali http://www.epochtimes.com.au/ o http://www7.chinesenewsnet.com/ non sono rintracciabili tra i risultati quando la ricerca avviene all'interno del territorio cinese.

Secondo quanto riferito da P2Pnet.net, il sito che ha fatto emergere la storia, Google attribuisce ad «una varietà di motivi» la scelta di negare il link ad alcune testate, e tra tali motivi viene citata la fattiva impraticabilità dell'accesso al sito da talune località.

Il primo portavoce delle accuse contro il "Matrix" cinese è Bill Xia, CEO del DIT (Dynamic Internet Technology, il gruppo del servizio DynaWeb), il quale spinge direttamente sulla matrice ideologica i motivi del tutto. L'ipotesi di Xia sembra confermata da alcuni documenti interni pubblicati dal San Francisco Chronicle secondo i quali l'attività nel paese orientale sarebbe vincolata da leggi che arrivano anche a prevedere appositi filtri web per siti dai contenuti illegali.

Ancor più allarmante della notizia di una possibile censura delle notizie, è l'abilitazione nei normali risultati di ricerca del Google cinese del filtro "Safesearch" in modo permanente. Tale filtro ha la funzione di proteggere i minori dal materiale pornografico presente sul web. Se si effettuano però alcune particolari ricerche sul Google cinese, si viene avvertiti che il filtro "SafeSearch" è attivo. La cosa singolare è che le voci in questione sono ad esempio "Dalai Lama", "Falun Gong", assieme alle parole "libertà", "democrazia" e simili.

Altrettanto impressionante la censura relativa al movimento spirituale pacifista "Falun Gong". Il Google occidentale non risparmia le immagini della durezza della repressione del governo cinese ai danni di questa setta che chiede diritti civili e libertà religiosa per il popolo cinese. Sempre come da esempio seguente, il Google orientale restituisce ben altri risultati, riportando siti e commenti alla setta perfettamente allineati alla propaganda di regime.