lunedì 22 novembre 2010

Google Trends/Insights - approfondimento

Modellare i dati di Google Trends in caso di notizia negativa puo' richiedere analisi statistico -econometriche molto complesse : per esempio, oltre all'utilizzo di metodi di regressione robusta, puo' essere considerato anche l'utilizzo di variabili "dummy", atte a catturare un effetto temporaneo. Tuttavia, va detto che e' necessario scegliere l'intervallo temporale dove applicarle: questo non e' affatto immediato, in quanto i fatti di cronaca con effetti negativi in Italia possono durare settimane se non mesi (si pensi al caso "Noemi" o alla "casa di Montecarlo"). Scegliere un intervallo troppo lungo o troppo corpo, puo' inficiare notevolmente l'analisi statistica.

Un alternativa e' rappresentata dai cosiddetti modelli a "cambiamento di regime" (i.e "Markov Switching models"), che risolvono il problema di dover decidere quando siamo in un regime (notizie positive) e quando in un altro (notizie negative), in quanto il cambiamento di regime e' stimato direttamente dai dati. Il maggiore rischio con questo tipo di modello e' rappresentato dal cosiddetto "over-fitting": la stima empirica, cercando di minimizzare la differenza fra valori osservati e valori stimati, finisce per accomodare ogni tipo di shock, con il risultato che il modello sembra funzionare benissimo dentro al campione di dati utilizzato per la stima, ma se viene utilizzato per fare previsioni fuori dal campione, fornisce dei risultati alquanto scadenti.

Per questo motivo, e' spesso meglio seguire il famoso detto di Keynes, cioe', "preferisco avere all' incirca ragione che precisamente torto" (It is better to be roughly right than precisely wrong. In realta' l'aforisma originale fu di Carveth Read, 1898). Un modo semplice per risolvere in buona parte questo problema, e' quello di considerare il volume di ricerca per i singoli partiti senza includere i leader . Questo permette di ridurre notevolmente la volatilita' dei dati e isolare meglio il trend di fondo:



E' evidente la fine del trend decrescente del pd (e in parte anche del pdl), e la crescita di Fli e Sel.

Gigi_B

Qui gli altri due articoli di Gigi_B sullo stesso tema:

http://sondaggiproiezioni.blogspot.com/2010/11/google-trends-introduzione.html

http://sondaggiproiezioni.blogspot.com/2010/11/google-trendsinsights-partiti.html

67 commenti
Related Posts Plugin for WordPress, Blogger...