La raccolta dati da Indagini e da Social Media, stato dell’arte

In Public Opinion Quarterly (POQ) qualche mese fa è stato pubblicato il Task Force Report di AAPOR sui Big Data per le ricerche.

bigdata

 

Questo report cerca di mettere un po' di ordine metodologico su questo termine alla moda, proponendosi di definirne il campo semantico (big data come found data vs survey data come designed data), il paradigma scientifico, le implicazioni dal punto di vista della struttura del dato e, infine, che risorse siano necessarie dal punto di vista operativo (hardware, software e risorse umane). Cerca inoltre di tratteggiare uno schema di Total Survey Error Framework per i big data. Il report si conclude con alcuni cenni su come integrare i dati provenienti dai big data con le indagini (survey).

L'impressione generale è quella di un work in progress basato su un numero ridotto di sperimentazioni, dettagliato sulle risorse necessarie per gestire Big Data ma poco approfondito sia sull'utilizzo e integrazione di questi dati che sulla verifica degli stessi a partire da altre fonti.

Successivamente a questo articolo, sempre su POQ, è apparso un nuovo lavoro su una particolare tipologia di Big Data, vale a dire i social media. L'articolo "Social Media Analyses for Social Measurement" di Michael F. Schober parte dal ragionamento, diffuso nella comunità scientifica, che le informazioni provenienti dai social media potrebbero addirittura sostituire i dati provenienti dalla ricerca.

La differenza fra le informazioni provenienti da questi due strumenti sono dovute e tre aspetti fondamentali:

a. il diverso modo in cui i partecipanti (dei social e delle indagini) intendono il loro ruolo; 
b. il tipo di informazioni che si raccolgono e che inferenze possono essere fatte; 
c. questioni etiche e pratiche.

Tre tabelle presenti nell'articolo illustrano bene questi 3 aspetti.

Gli autori inoltre affermano che:

a. Quando i risultati tra i due strumenti coincidono lo fanno attraverso meccanismi molto diversi; 
b. I metodi per passare dai contenuti dei Social Network ai dati quantitativi sono quasi tutti basati su analisi lessicali; 
c. Quando i dati fra survey e Social Network differiscono non siamo in grado di trovare un metodo per individuare il motivo di questo fallimento.

Le schematizzazioni di questo articolo ci permettono di procedere andando a sottoporre i vari punti enunciati nelle tabelle 1 e 2 a sperimentazione.

Vedremo come nei prossimi mesi la comunità scientifica condurrà le sperimentazioni sulle differenti stime generate dai dati provenienti dalle Survey e dai Social Media e se riusciranno a dare anche delle indicazioni operative per mettere a frutto la gigantesca mole di dati generata dagli utenti.

Buon lavoro

Esperimento sul panel

CAWI verso CATI

Alcuni nostri clienti

Visitatori

Abbiamo 19 visitatori e nessun utente online

Newsletter

Iscriviti

Iscriviti alla nostra newsletter sulla metodologia delle indagini

Revolution Now

Copyright Demetra opinioni.net s.r.l. sotto Free Documentation License
Sito realizzato con Joomla