


Un alternativa e' rappresentata dai cosiddetti modelli a "cambiamento di regime" (i.e "Markov Switching models"), che risolvono il problema di dover decidere quando siamo in un regime (notizie positive) e quando in un altro (notizie negative), in quanto il cambiamento di regime e' stimato direttamente dai dati. Il maggiore rischio con questo tipo di modello e' rappresentato dal cosiddetto "over-fitting": la stima empirica, cercando di minimizzare la differenza fra valori osservati e valori stimati, finisce per accomodare ogni tipo di shock, con il risultato che il modello sembra funzionare benissimo dentro al campione di dati utilizzato per la stima, ma se viene utilizzato per fare previsioni fuori dal campione, fornisce dei risultati alquanto scadenti.
Per questo motivo, e' spesso meglio seguire il famoso detto di Keynes, cioe', "preferisco avere all' incirca ragione che precisamente torto" (It is better to be roughly right than precisely wrong. In realta' l'aforisma originale fu di Carveth Read, 1898). Un modo semplice per risolvere in buona parte questo problema, e' quello di considerare il volume di ricerca per i singoli partiti senza includere i leader . Questo permette di ridurre notevolmente la volatilita' dei dati e isolare meglio il trend di fondo:
E' evidente la fine del trend decrescente del pd (e in parte anche del pdl), e la crescita di Fli e Sel.
Gigi_B
Qui gli altri due articoli di Gigi_B sullo stesso tema:
http://sondaggiproiezioni.blogspot.com/2010/11/google-trends-introduzione.html
http://sondaggiproiezioni.blogspot.com/2010/11/google-trendsinsights-partiti.html
67 commentiConsideriamo prima i partiti messi insieme, al fine di avere un’idea della loro dimensione se confrontati fra di loro (Google Trends ammette un massimo di 5 confronti):
Mentre considerando i trend singolarmente per vedere meglio l’andamento del singolo partito , otteniamo il seguente risultato (Attenzione: i dati sull’asse delle ordinate sono valori STANDARDIZZATI di Google Trends, e non comparabili fra loro differentemente dai grafici sopra, in quanto sono dati per la singola serie):
Riassumendo brevemente l’andamento delle tendenze attuali, aggiornato al 15 novembre:
PDL: in leggera discesa, ma ormai in via di stabilizzazione
PD: discesa fermata, in leggera ripresa da due settimane a questa parte
LEGA: crescita fermatasi, in via di stabilizzazione
FLI: stabile, in crescita
IDV: stabile nelle ultime due settimane
UDC: stabile nelle ultime due settimane
SEL: stabile in leggera crescita (molto volatile)
M5S: stabile (la caduta sembra stabilizzarsi)
MPA: stabile, in crescita nell'ultima settimana
FDS: stabile
API: in crescita da due settimane a questa parte
Verdi + socialisti+SVP: stabile
La destra: stabile (la precedente crescita avvenuta agli inizi di novembre si e' interrotta)
FT+FN: stabile
Infine, un commento per gli addetti ai lavori: e’ chiaro che e’ possibile trasformare questi valori in pseudo-sondaggi, ma richiede un lavoro tutt’altro che banale. In primo luogo e forse l’aspetto cruciale da considerare, e’ sicuramente come trattare gli eventi che non hanno un effetto positivo sulla compagine politica ma aumentano il volume di ricerca, e/o gli eventi che aumentano i volumi di ricerca di un politico/partito solo temporaneamente e non strettamente di natura politica (ad esempio, problemi di salute, familiari, ecc). Uno potrebbe fare un lavoro da certosino ed eliminare uno ad uno, tutti questi eventi “una-tantum”: una soluzione del genere puo’ andare bene se si considerano intervalli temporali limitati. Un’altra soluzione (ma che potrebbe essere anche complementare) potrebbe essere quella di utilizzare tecniche di regressione “robuste” , ad esempio la regressione per quantili e tutte le regressioni di tipo non parametrico che escludono gli outliers. Personalmente, ho fatto alcune prove al riguardo e devo dire che sono promettenti, ma attualmente sono pieno di lavoro e il tempo libero latita per cui per il momento lascia la questione ai posteri.
Inoltre, i termini di ricerca vanno selezioni con cura per evitare di includere cose che non c’entrano niente: consideriamo ad esempio il termine “API”, che uno potrebbe voler considerare per valutare l’andamento del partito “Alleanza per L’Italia”. Tuttavia, questao e’ sbagliato in quanto include cose diverse e attualmente molto piu ricercate, come l’Anonima Petroli Italiana o l’ Application Programming Interface e molte altre ancora (si veda su Wikipedia tutti i significati della parola API).
Martedì un ulteriore post per approfondire alcuni aspetti di Google Trends
Gigi_B
Google Trends e’ uno strumento reso disponibile da Google per visualizzare il volume di ricerca di un particolare termine (o gruppi di termini) , in varie regioni del mondo, fino a livello di singola citta’. Inutile dire l’aiuto prezioso che uno tale strumento puo’ fornire in diversi ambiti, dal marketing all’economia, alle strategie di sviluppo di una singola impresa nel suo mercato.
Per saperne di piu’ invitiamo i lettori a leggere la seguente letteratura:
“Predicting the Present with Google Trends”:
http://googleresearch.blogspot.com/2009/04/predicting-present-with-google-trends.html
La pagina di Wikipedia
http://en.wikipedia.org/wiki/Google_Trends
“Predicting Initial Claims for Unemployment Benefits”:
“On the predictability of Search Trends”
http://googleresearch.blogspot.com/2009/08/on-predictability-of-search-trends.html
Nell’ambito politico, Google Trends ha ottime prospettive di sviluppo nell’ambito dei sondaggi d’opinione . Per dare un idea delle possibilita’ di questo strumento, guardiamo l’andamento su Google Trends dei termini “Renata Polverini” e “Emma Bonino”, nella citta’ di Roma, nei due mesi precedenti alle elezioni Regionali 2010 che si tennero il 28 e 29 Marzo.
Oppure l’andamento dei partiti politici inglesi nelle elezioni generali tenutesi il 6 Maggio 2010:
E’ evidente che Google Trends puo’ fornire un aiuto prezioso per seguire l’andamento delle opinioni dell’elettorato praticamente in real time, tenuto conto che i dati dei volumi di ricerca vengono resi noti con un ritardo di alcuni giorni (solitamente 2 o 3 giorni) .
Detto questo, vanno pero’ considerate alcune importanti avvertenze:
59 commenti