lunedì 20 giugno 2011

Prevedere l'affluenza del Referendum? Non proprio impossibile se si usano i dati di Google Insights

Vi invitiamo a diventare nostri fan su facebook, cliccando qui

Giovedì 9 e Venerdì 10 giugno, dopo aver messo a nanna mio figlio, mi sono riposato con il mio passatempo preferito..... Google Insights appunto!....e spinto dall'ispirazione mi sono messo a confrontare le ricerche per cosi dire "positive" dei referendum usando i seguenti termini di ricerca

non voto +referendum non voto+referendum inutile+referendum astensione+ referendum dannoso

con quelle "negative",
voto referendum +referendum utile

usando i dati dal 2004. Ecco a voi cosa viene fuori:

http://www.google.com/insights/search/?hl=it#q=non%20voto%20%2Breferendum%20non%20voto%2Breferendum%20inutile%2Breferendum%20astensione%2B%20referendum%20dannoso%2Cvoto%20referendum%20%2Breferendum%20utile&geo=IT&cmpt=q 



Se avete un account Google potete vedere anche i numeri: quello che ho notato e' che nel 2005 con un affluenza del 25.5%, il rapporto fra ricerche negative e positive era poco sopra 1, a Giugno 2006 con un'affluenza del 53.6 il rapporto era intorno a 0.2, a giugno 2009 con un'affluenza del 23.8% il rapporto era di nuovo intorno a 1.

Spinto dalla curiosità mi sono messo a lavorare con i numeri sia settimanali che mensili e ho provato un po di funzioni nonlineari di diverso tipo. Usando gli ultimi dati disponibili di Giugno 2011 e tre diversi tipi di funzioni non lineari, ho ricavato una previsione con un intervallo di confidenza del 95%:

Modello nonlineare 1: 46.5 - 50 - 53.5

Modello nonlineare 2 (con dati mensili): 46.9 - 50.2 - 53.9

Modello nonlineare 3 : 43 - 49 - 55


dove il primo valore e' il lower bound, il secondo la previsione, il terzo l'upper bound. Tutto questo praticamente facendolo e commentandolo in tempo reale su Sondaggibidimedia.com Venerdi' 10 Giugno .

Passato il referendum, sono tornato ad analizzare quei dati con piu' calma raffinando un pelino i modelli e considerando sia dati giornalieri che settimanali . Ecco cosa ho ottenuto:

- Modello dati giornalieri (il precedente modello 1 con alcune piccole modifiche):


FORECASTING SAMPLES
DAILY FORECAST
7-day average
03/06/2011
56.43


04/06/2011
39.90


05/06/2011
53.74


06/06/2011
91.36


07/06/2011
68.97


08/06/2011
62.70


09/06/2011
44.25
59.62
10/06/2011
41.98
57.56
11/06/2011
50.16
59.03


- Modello dati settimanali (modifica del precedente modello 2 inizialmente con dati mensili):


WEEKLY FORECASTING SAMPLES FORECASTS
2011-05-29 - 2011-06-04
57.95
2011-06-05 - 2011-06-11
51.10




Infine, per chi ne vuole saperne di piu', se usiamo la classificazione sul possibile utilizzo dei dati di Google Trends/Insights fatta qui (a cui rimandiamo per maggiori informazioni), i referendum italiani rientrano sicuramente nel caso 2) , cioe' "Usare i dati GTI, ricalibrandoli usando passate elezioni (eventualmente usando funzioni nonlineari)". Alla prossima.

Gigi Bi





Comments
Related Posts Plugin for WordPress, Blogger...