domingo, 13 de noviembre de 2016

Procedimiento de correlaciones heterogéneas en SPSS 24

En ciertas situaciones la naturaleza de las variables no permite el uso de la correlación de Pearson, o sus algoritmos asociados. Para este tipo de situaciones el SPSS 24 (IBM Corp., 2016) contempla módulos integrados en R como el que vamos a describir en esta entrada brevemente.

Este procedimiento extendido de las correlaciones heterogéneas requiere, además del modulo IBM SPSS Statistics, los complementos de integración para R como para Python.

miércoles, 6 de julio de 2016

Procedimiento DETECTANOMALY en SPSS 24

El proceso de análisis de datos que describimos "Detectanomaly", se puede encontrar en distintas versiones del SPSS, en nuestro caso corresponde con la versión 24. Este procedimiento permite identificar los valores "anómalos", buscando para ellos los casos atípicos basados sobre las desviaciones de casos similares y de las razones para tales desviaciones. 

Este recurso, se puede verificar tanto sobre variables originales o mediante la creación de nuevas variables (transformación de las existentes en la base de datos). Y una vez que hayan identificado los casos inusuales, se puede examinar más a fondo estos casos y determinar si se deben incluir en nuestros análisis. Para este caso hemos usado la base de datos correspondiente a las elecciones al parlamento español, celebradas en junio de 2016, con objeto de averiguar si existen patrones anómalos interesantes en el comportamiento del voto (Parsons, 1998; Tung, 2016).

viernes, 11 de marzo de 2016

Grado de significación (p). Revisión ASA

Desde hace tiempo, se ha venido señalando que los valores de p son, en el mejor de los casos, un estadístico con bajo valor informativo sobre la investigación realizada, y muchas veces engañoso. Y sobre todo a raíz de artículo de E.Vul (2009), este concepto del grado de significación (pruebas p), ha sido objeto de críticas generalizadas. Se han intentado corregir sus resultados más contradictorios, como podemos observar en distintas librerías implementadas por ejemplo en R (Herrero et al., 2011), e incluso eliminarlo (Newcombe, 2013), pero la gran aceptación que tiene en el campo de las publicaciones científicas ha resistido hasta ahora todos los intentos.

sábado, 9 de enero de 2016

La replicación de los estudios en Psicología:Uso del programa R

En el proceso de obtención del conocimiento científico, son importantes los mecanismos que replican los experimentos en el campo de la Psicología. El fundamento es que otros investigadores deben de poder ser capaces de repetir los resultados de los estudios publicados. 

Dentro de esta filosofía encontramos el proyecto de B.Nosek (Open Science Collaboration, 2015), destinado a facilitar la replicación de los resultados de 100 estudios publicados en revistas de Psicología, repitiéndose los estudios tal como se describen en los documentos seleccionados, y analizando los datos recogidos. Con el fin de maximizar la reproductibilidad y precisión, los análisis de todos los estudios duplicados fueron repetidos por otros analistas independientes del primer equipo de ejecución, usando para ello el lenguaje de programación R, con un formato estandarizado. 

lunes, 4 de enero de 2016

Control del sistema en Windows 10: Opciones avanzadas

Cuando se desea controlar un ordenador de forma precisa, bajo el sistema operativo Windows 10, accediendo a los ajustes de personalización, ocultos normalmente al usuario normal, una forma rápida y sencilla es tecleando el siguiente procedimiento:

*Se crea una nueva carpeta y como nombre tecleamos el código: 
ID.{ED7BA470-8E54-465E-825C-99712043E01C} 

El resultado es que automáticamente accedemos a una carpeta que modifica el icono por defecto, y añade la etiqueta que hemos prefijado de nuestra identidad (ID), que frecuentemente suele aparecer en Internet como "Modo dios" o "GodMode", pero admite cualquier etiqueta que prefiera el usuario. 
Al final con un sola pulsación de ratón, obtenemos un acceso sencillo a toda una serie de opciones avanzadas de configuración, agrupadas en una pantalla.

domingo, 31 de mayo de 2015

Modelado geoespacial en SPSS 23

Los sistemas de información geográfica (SIG), compuestos de una base de datos espacialmente referenciada y de un conjunto de instrucciones (procedimientos) que nos ayudan a manejarla (Burrough y McDonnell, 1998), son un elemento básico en la construcción de modelos psicosociales operados a la luz de la Metodología Mixta. Este modelado geoespacial puede utilizar datos de mapas que contienen información respecto a las áreas geográficas y datos demográficos u otros elementos descriptivos como, por ejemplo, informes de población relativos a las tasas de desempleo.

El programa SPSS 23, en su módulo base, incorpora ahora un asistente de modelado geoespacial, bastante sencillo de utilizar. Está incorporado en las opciones de análisis:


miércoles, 15 de abril de 2015

Publicar resultados "negativos" en el campo científico

En el campo científico, el paradigma dominante, impide que gran parte de los resultados experimentales nunca sean públicos. Esto ocurre frecuentemente cuando las hipótesis que se manejan no terminan corroboradas por el análisis de los datos. 

Un ejemplo sencillo podría ser el ensayo de una técnica nueva de aprendizaje escolar que se cree que ayuda a los niños a mejorar su rendimiento en matemáticas. Si los resultados del experimento muestran que no hay ninguna diferencia significativa entre el grupo control y el grupo con la nueva técnica de aprendizaje, entonces el resultado terminará como un informe inédito, archivado junto a otros informes en los almacenes universitarios o incluso destruido con objeto de no ocupar espacio.


miércoles, 25 de marzo de 2015

El estadístico Masa en Análisis de Correspondencias

El Análisis de Correspondencias(AC), es un procedimiento que permite describir de forma geométrica las relaciones entre variables de diversa naturaleza. Dentro de este procedimiento nos encontramos entre los primeros resultados el concepto estadístico de Masa, que simplemente es la frecuencia relativa de los totales filas y columnas en la tabla de datos analizada.
Se utiliza tanto para ponderar los perfiles de los puntos, como en la interpretación de la importancia de un punto (influencia) en el análisis desarrollado (los modelos deben seguir a los datos, y no al revés; Benzécri, 1976).  De esta forma, al considerar los puntos con una masa proporcional se evita privilegiar las categorías con frecuencias bajas o nulas.

sábado, 28 de febrero de 2015

Odds Ratio en R

En Metodología, frecuentemente usamos algoritmos para considerar una exposición (por ejemplo , absentismo escolar) y determinar su relación al comportamiento problemático (por ejemplo , la delincuencia juvenil) . Son útiles a la hora de expresar una cantidad (magnitud) del riesgo de comportamiento problemático para las personas que son expuestas a determinados agentes.

Supongamos un ejemplo con los datos siguientes: 
Tabla de Absentismo escolarxComportamientos-delictivos 
                        Delincuentes    No delincuentes 
Si-absentismo     2 (a)                8 (b) 
No-absentismo 10 (c)            990 (d) 

El riesgo se expresa en modelos de probabilidad, de una exposición dada causando un comportamiento. Es decir, la probabilidad de comportamiento problemático en los expuestos con respecto a la probabilidad de comportamiento problemático en los que no han sido expuestos. A esto, se conoce como el riesgo relativo (RR).
RR(delincuente en el grupo con absentismo/delincuente en el grupo no absentista)=(2/10)/(10/990)=19,8 

lunes, 5 de enero de 2015

Generador cuántico de números aleatorios

En Proceso de Datos es frecuente encontrarnos con la necesidad de simular el azar. Esto, clásicamente lo hemos resuelto con la generación de números pseudoaleatorios, basados en algoritmos (software).

No obstante, si deseamos tener una mayor precisión sobre la generación del azar, deberíamos resolverlo por sistemas de hardware. Estos dispositivos (TRNG, True Random Number Generator), generan números realmente aleatorios de naturaleza cuántica, basados en el campo electromagnético (Symul et al., 2011).

Si se desea familiarizar con este tipo de generadores recomendamos el siguiente enlace: 
http://qrng.anu.edu.au/index.php

Donde es posible verificar online el funcionamiento, por ejemplo, en la generación de números binarios:
http://qrng.anu.edu.au/RainBin.php
Y también hexadecimales:
http://qrng.anu.edu.au/RainHex.php

Ha superado los tests estándares del NIST (National Institute of Standards and Technology) y los de la batería de Diehard.

Referencias.
Symul,T.; Assad,S.M. and P. K. Lam,P.K. (2011). Appl. Phys. Lett. 98, 231103. http://dx.doi.org/10.1063/1.3597793 (access 5-1-2015).