miércoles, 29 de mayo de 2013

Representación gráfica

Los estadísticos frecuentemente pueden llevarnos a situaciones equívocas. Aparentemente, el resultado es semejante, pero puede ocultar realidades distintas. Las representaciones gráficas de los datos son una alternativa muy aconsejable (necesaria) al simple resultado numérico.

El cuarteto de Anscombe (1973), es un ejemplo clásico que podemos ver resumido en la siguiente tabla de excel 2013:
Un comentario un poco más detallado de este paradigma lo podemos ver en el siguiente enlace:


Referencia.
Anscombe, F. (1973). Graphs in Statistical Analysis The American Statistician, 27 (1), 17-21. DOI:10.2307/2682899

viernes, 17 de mayo de 2013

Minería de Datos: IBM SPSS Modeler


IBM® SPSS® Modeler es una herramienta básica destinada a encontrar relaciones útiles entre grandes conjuntos de datos, encajando en la aproximación conocida como Minería de Datos.

Frente a los métodos estadísticos tradicionales, el nuevo paradigma imperante, basado en la Inteligencia Artificial, se caracteriza por no ser necesario saber lo que se está buscando al comenzar la investigación (serendipia). Se exploran los datos, mediante el ajuste de diferentes modelos y relaciones, hasta que la máquina encuentre la información que resulte útil en el campo tratado.

Integración de SPSS y R


Es de todos bien sabido la integración existente entre el programa comercial IBM SPSS, y las herramientas libres de la comunidad conocido como R.
En este enlace recogemos un ejemplo claro y sencillo de la filosofía que se va extendiendo poco a poco entre los investigadores. Muy recomendable para aquellos usuarios que se acercan por primera vez a la fusión de las herramientas informáticas en Proceso de Datos en la Nube.

http://datamininginsights.co.uk/2013/05/04/using-r-spss-statistics-to-add-custom-visualizations-to-modeler/