Archivos mensuales: septiembre 2015

Introducción a R para Marketinanos

* ¿Qué es R?

R es una herramienta diseñada para el análisis estadístico y gráfico dirigido mayormente a profesionales del campo de la investigación, analistas de datos y estadísticos entre otros. A través de sus diferentes paquetes personalizados, R nos proporciona amplias posibilidades para tratar, analizar y explorar datos. Por mencionar algunos ejemplos, R nos permite crear y visualizar modelos de regresión lineales/no lineales, crear mapas de visualización de datos, analizar correlación entre variables, etc.

Para sacar el mayor provecho de todo lo que nos puede proporcionar R, es necesario aprender su lenguaje. Una vez lo dominemos, seremos capaces de extender y definir nuestras propias funciones para sacarle el mayor rendimiento a nuestros datos.

El software de R está disponible para varios sistemas operativos, entre ellos, Windows, Linux, Mac. En este manual de iniciación a R nos centraremos en la instalación y interacción desde Windows, pero proporcionaremos links y documentación para todos aquellos que tengan otro tipo de sistema operativo.

 * ¿Por qué R y no un programa estadístico?

 R es un software libre. Permite a los usuarios la libertad de usar, modificar y redistribuir el software a su parecer. El mayor beneficio de un software libre es que si existe una comunidad amplia y activa, las posibilidades de mejorar el software son infinitas.

http://www.r-project.org/

R nos permite crear y modelar funciones a nuestro parecer. El software nos permite guardar nuestros scripts para volver a usarlos cuando los necesitemos. Con esto ganamos agilidad en el momento de procesar nuestros datos.
Asimismo R no sólo nos permite obtener tablas donde exponer nuestros resultados, sino que también es una herramienta ideal para visualizar datos de manera sencilla gracias a los paquetes especializados de gráficas, histogramas o mapas

Hypercubes graph with R
Hypercubes graph with R

 

Uno de mayores beneficios de R es su amplia comunidad de usuarios, que a través de varias páginas y blogs, comparten sus conocimientos y trabajan para mejorar y optimizar el proceso de análisis. Si te surge alguna duda siempre puedes acudir a ellos:

http://www.r-bloggers.com/

http://stackoverflow.com/tags/r

http://www.crantastic.org/

 

Por último, tendrías que considerar R si lo que quieres es una herramienta versátil que te permita manipular tus datos con facilidad y presentarlos de manera atractiva. Con R podrás procesar y analizar big data de manera extensiva creando tus propias funciones para tener una visión más específica de tus datos. Además, gracias a los paquetes de R, podemos utilizarlo para diferentes tipos de investigación. Desde cuestionarios cuantitativos, hasta mapas de calor o datos cualitativos de nuestras cuentas de Facebook o Twitter. Finalmente, remarcar que R es completamente gratis y además tiene todo el apoyo de grandes organizaciones como Google, Twitter o Facebook entre otros.

* ¿ Qué partido podemos sacarle a R?

Desde el punto de vista de un marketiniano, R nos puede ser de mucha ayuda para investigaciones tanto offline como online. A continuación daremos un breve ejemplo de los múltiples escenarios donde poder sacar partido a R. Detallaremos más ejemplos prácticos en el próximo apartado.

Offline:

Cuestionarios cuantitativos a consumidores; Con ello podemos testear modelos de atribución con varias variables. Éstos se pueden analizar con el paquete “survey” de R. En este paquete encontraremos variables como la media, modelos de regresión, varianzas de Taylor, diferentes tipos de ratios, modelos loglineares etc.

Online:

Text Mining en plataformas como Twitter o Facebook; Desde las diferentes API podemos obtener data de nuestras plataformas en tiempo real.

Si quisiéramos comparar nuestras publicaciones de Twitter para ver cuál ha sido la que más nos ha ayudado a conseguir nuestro objetivo, podríamos analizar la cantidad de retweets, la cantidad de followers que interactuaron, la procedencia de éstos followers y hasta la cantidad de palabras positivas y negativas que hubieron al respecto.

Graph with R about clusters of friends on Facebook
Graph with R about clusters of friends on Facebook

Con Facebook, podríamos sacar datos de la procedencia de nuestros “amigos” y la edad, para averiguar quien es nuestro público objetivo, qué segmento nos da a más “me gusta” o comparte nuestras publicaciones.

La cantidad de información que nos proporcionan fuentes como Twitter, Google Analytics, Facebook… nos permite abrir nuestros horizontes para conocer a nuestros consumidores, crear estrategias y hacer previsiones futuras. Lo mejor es que todo se puede tratar desde un mismo software, R, y ésto nos permite ahorrar mucho tiempo y dinero.

Descargar los programas (R y RStudio) y paquetes adecuados

Primeramente nos tendremos que ir a http://cran.rstudio.com/  y descargar la última versión de R (Si tienes otro sistema operativo, accede al mismo link y allí encontrarás las diferentes versiones de R). A continuación, aceptamos la licencia y iniciamos la instalación. Una vez instalado R, podremos instalar R Studio (Interface de R que nos permitirá usar R de manera más sencilla). http://www.rstudio.com/products/rstudio/download/. A continuación tenéis dos links que os ayudarán a instalar y conocer el funcionamiento de R y R Studio:

https://www.youtube.com/watch?v=cX532N_XLIs (Para instalar R)

https://vimeo.com/97166163 (Conoce la Interface de R Studio)

En cuanto a los paquetes, es recomendable descargarse swirl. Swirl es un curso que nos ayudará a conocer el funcionamiento de R mediante una serie de ejercicios diseñados para iniciarnos en el mundo de R. Aplicaremos el siguiente comando en la pantalla inferior izquierda de R studio

install.packages(“swirl”)

Y a continuación, cargaremos la librería de Swirl en nuestro directorio con el siguiente comando:

library(swirl)

¿Y ahora qué hacemos?

Anteriormente os hemos hecho descargar Swirl. Este curso es esencial para iniciarse en el mundo de R si partes de un conocimiento bajo o nulo sobre programación.

https://github.com/swirldev/swirl_courses#swirl-courses

También existen varios cursos online gratuitos sobre iniciación a R donde se os proporcionarán ejercicios prácticos pero sobretodo se os enseñará la importancia de la comunidad de usuarios de R, donde podréis preguntar vuestras dudas y tener acceso a gran cantidad de material didáctico.

https://github.com/swirldev/swirl_courses#swirl-courses (Curso online de programación en R)

https://www.coursera.org/course/datascitoolbox (Curso online de iniciación al análisis de datos por Facebook)

https://www.udacity.com/course/data-analysis-with-r–ud651 (Curso online ejemplos prácticos de análisis de datos con R por Facebook)

http://tryr.codeschool.com/ (Ejercicios con las funciones básicas de R)

https://www.youtube.com/playlist?list=PLOU2XLYxmsIK9qQfztXeybpHvru-TrqAP (Introducción de R por Google Developers)

*Casos prácticos con R

Aquí tenéis una serie de casos prácticos que os darán una visión más amplia de lo que se puede hacer con R. El primer ejemplo, utiliza como fuente los datos de una cuenta de Google Analytics para averiguar cúal de las campañas de marketing activas es la que proporciona un mayor beneficio a largo plazo.

Google Analytics:

https://developers.google.com/analytics/solutions/r-google-analytics

El segundo ejemplo utiliza la API de Twitter para averiguar qué tipo de palabras se asocian a los comentarios que contiene una determinada cuenta de Twitter

Twitter API:

http://www.rdatamining.com/docs/text-mining-with-r-of-twitter-data-analysis

El último ejemplo utiliza la API de Facebook para averiguar el comportamiento de nuestros “amigos” en Facebook. Éste ejemplo en concreto nos presenta el cambio de comportamiento, respecto al uso de Facebook, que tiene un usuario cuando pasa de un estado sentimental a otro

Facebook API:

http://www.r-bloggers.com/because-its-friday-love-in-the-land-of-facebook/