FB Sampling: An Example - Combining Probabilistic Shape-from-Shading & Statistical Facial Shape

Características

Las

primeras técnicas inferenciales fueron las paramétricas que hacen suposiciones a los parámetros de la población que se obtuvieron, es decir, dan suposiciones acerca de la población de donde se extrajo la muestra. Obtienen diferencias entre medias.

La estadística paramétrica, hace un buen número de suposiciones acerca de la naturaleza de la población de la que se obtuvieron los puntajes. Se llama Paramétrica puesto que los valores de la población son “parámetros”.

Los supuestos son: a) Distribución normal.

b) Homocedasticidad de varianza. c) Nivel de medición intervalar. d) Selección y asignación aleatoria.

Las pruebas paramétricas fijan su atención en la diferencia entre las medias de dos o más conjuntos de puntajes. Esta se interesa en dos cosas:

a) Estimación de parámetros. b) Pruebas de hipótesis.

Pruebas paramétricas.

Prueba de coeficiente de correlación de producto-momento de Pearson

Introducción

En la vida diaria hemos escuchado muchas cosas, que aunque no han sido comprobadas científicamente, suceden en forma imprevista, por ejemplo, se dice "que a mayor velocidad de un carro, menor consumo de gasolina"; o que si "un adolescente tiene los pies grandes es porque va a ser muy alto", también hemos visto que las personas satisfechas en su relación de pareja son más comunicativas. Al hacer esta serie de afirmaciones sin un fundamento se expresa la suposición de que existe alguna correlación entre las variables.

La correlación indica o representa la relación entre dos variables. De entre los ejemplos planteados aquí, el último plantea como variables, a la satisfacción con la relación y la comunicación. Si quisiéramos comprobar la relación existente entre estas dos variables tomaríamos en forma aleatoria a una muestra de personas que actualmente tuvieran una relación de pareja. Posteriormente les preguntaríamos ¿qué tan satisfechos se encuentran con su relación? (en una escala del 1 al 10) y ¿qué tanto se comunican con su pareja? (en una escala del 1 al 10). Si encontramos que puntajes altos en satisfacción se relacionan con puntajes altos en comunicación, podemos decir que la observación fue acertada.

Si nosotros podemos hablar de que existe una relación entre estas variables, por ende podemos predecir una a partir de otra. Esto es, se puede decir que las personas con un valor de 10 en satisfacción es más probable que tengan un valor de 10 en comunicación.

Definición

Este coeficiente como su nombre lo indica nos da un índice (valor) que habla del nivel de relación que tienen dos variables.

Sofía Rivera Aragón Mirna García Méndez 140

Para representar este coeficiente se usa la letra "r".

El coeficiente de correlación producto-momento de Peargon tiene varios usos:

Conocer el grado de relación que existe entre dos variables o atributos. Por ejemplo cuando hablamos de la relación entre el grado de violencia y el grado de satisfacción marital.

Indica la dirección de la asociación. Es decir, a través del signo que obtiene el valor de la correlación se puede decir si a mayor violencia, menor satisfacción marital o viceversa a mayor violencia mayor satisfacción marital.

Obtener la significancia de la asociación. En este caso nos menciona además si lo que obtuvimos cae en la zona de aceptación o en la zona de rechazo. Es decir si nuestra hipótesis se comprueba o no.

Requisitos

Como se sabe, este coeficiente al pertenecer a la estadística inferencial paramétrica presenta varios requisitos los cuales ya fueron descritos an- teriormente, entre ellos:

a) Que los puntajes sean lineales (es decir se agrupen en una recta). Ya sea en forma directamente proporcional o inversamente proporcional.

b) Que haya homocedasticidad de varianza (se agrupan en una elipse). Es decir que los datos se distribuyan alrededor de esa línea recta.

c) Que las variables tengan un nivel de medición intervalar. Por ejemplo: edad, escolaridad en años, temperatura.

d) Que haya una selección y asignación aleatoria de los participantes. Interpretación

El coeficiente de correlación producto-momento de Pearson se interpreta de acuerdo a tres puntos:

1. Fuerza. 2. Dirección. 3. Significancia.

i. Fuerza: Esta indica el grado de relación que hay entre dos variables. De acuerdo con el valor obtenido, que sólo puede ir de 0 a 1 pasando por valores positivos y negativos (-1 a +1). La fuerza la da el valor de la correlación y este puede ser interpretado de la siguiente forma:

Valor Interpretación de la correlación

0 a .30 Baja

.31 a .79 Media

.90 a 1 Alta

Siempre el cero indica ausencia de relación y el 1 una correlación perfecta.

Sofía Rivera Aragón 142 Mirna García Méndez

2. Dirección: Indica hacia qué lado de la curva se encuentra nuestra correlación. La dirección la da el signo. Los signos se interpretan de la siguiente forma:

Signo Interpretación

+ (positivo) Directamente Proporcional

- (negativo) Inversamente Proporcional

3. Significancia: Finalmente este rubro indica cuál es la probabilidad de aceptar o rechazar una hipótesis alterna. De acuerdo a ello se debe plantear una regla de decisión:

Si rc≥ r0 entonces la correlación es significativa.

Donde rc es el valor obtenido en la fórmula y r0 es el valor obtenido en una tabla de significancia de los valores de r.

Antes de conocer el grado o fuerza de la relación debemos saber cómo se comportan las puntuaciones. Para ver ese tipo de distribución se usa un dispersigrama.

Un dispersigrama es una representación gráfica de la forma en que se distribuyen los datos. Siempre una de las variables se grafica en el eje de las "y" (ordenadas) y otra en el eje de las "x" (abcisas). Siempre se coloca la variable predictora en el eje de las "x" y la predicha en el eje de las "y". O en su defecto la variable dependiente en el eje de las "x" y la variable independiente en el eje de las “y” (véase gráfica 18).

Ejemplo de dispersigrama:

Variables (ambas escalas fueron evaluadas con puntuaciones del 1 al 10): Satisfacción con la relación

Comunicación marital

Puntaje de satisfacción Puntaje de comunicación 10 9 8 10 8 9 7 6 10 9 9 8 6 7 5 4 4 4 8 7

Los puntajes obtenidos son:

El dispersigrama quedaría como lo muestra la gráfica 18, recordando que no importa cuál de las variables queda en el eje de las "y" y cuál en el de las "x", ya que la correlación no implica causalidad.

GRÁFICA 18

DISPERSIGRAMA DE COMUNICACIÓN Y SATISFACCIÓN

Fórmula

La fórmula que se aplica para obtener este coeficiente es:

Sofía Rivera Aragón Mirna García Méndez 144

Estadística paramétrica 145 donde:

r = Coeficiente de Pearson.

N = Número total de pares en x y y. x = Puntaje crudo de la variable x. y = Puntaje crudo de la variable y.

XY = Multiplicar el puntaje de x por el de y. Elevar al cuadrado los puntajes. = Sumar el producto de x y y.

= Sumar las puntuaciones y elevar la suma al cuadrado. Regla de decisión para obtener la significancia

Para obtener la significancia, se calculan en primer lugar los grados de libertad. a) gl = N - 2 N

= Número de pares en x y y.

Se busca en la tabla de valores críticos de r, los grados de libertad y la probabilidad (α).

En la tabla E del apéndice se encuentra la r0 (valor de la correlación observada) que permite rechazar y aceptar las hipótesis estadísticas.

b) Posteriormente se aplica la regla de decisión que es:

Es decir que como la r de la fórmula es más grande que la de las tablas entonces se acepta la hipótesis alterna.

Ejercicio

Un investigador desea conocer si existe relación entre la puntuación que se obtuvo en una escala de agresión y la puntuación que se obtuvo en una escala de frustración en estudiantes universitarios. El investigador plantea que a mayor agresión, mayor frustración.

Los datos obtenidos se presentan a continuación siguiendo el procedimiento del coeficiente de correlación producto-momento de Pearson.

Procedimiento:

a) Se establece el nivel de confianza al cual se desea trabajar, por ejemplo en este estudio se desea obtener un nivel de confianza del 95 por ciento. Por lo tanto se trabajará con un error del .05.

b) Se plantean las hipótesis derivadas de la investigación, por ejemplo, las hipótesis con las que se trabajará son de dos colas (sin dirección).

Ho. No existe relación entre la agresión y la frustración en estudiantes universitarios.

H1. Sí existe relación entre la agresión y la frustración en estudiantes universitarios.

c) Se obtienen los cuadrados de cada puntuación y se suman (∑X2 _y_∑y2_{) y} la suma del producto de las puntuaciones de "x" y "y" (∑XY)

TABLA DE DATOS OBTENIDOS PARA LA CORRELACIÓN

X Agresión FrustraciónY X 2 _Y2 _xy 12 12 144 144 144 10 8 100 64 80 6 6 36 36 36 16 11 256 121 176 8 10 64 100 80 9 8 81 64 72 12 11 144 121 132 ∑x =73 ∑y =66 ∑Xs₌₈₂₅ ∑_{y* = 650} ∑_{XY =720}

Sofía Rivera Aragón Mirna García Méndez 146

d) Una vez calculadas las diferentes columnas se sustituye en la fórmula de Pearson:

Por último, se compara con la tabla (valores críticos de r) para ver si la correlación es significativa, aplicando la regla de decisión. El proceso a seguir, incluye los pasos que a continuación se detallan.

1. Se calculan los grados de libertad: gl = 7-2 = 5

Sofía Rivera Aragón 148 Mirna García Méndez

En el apéndice, se busca en la tabla E de valores críticos de r, los grados de libertad y la N.

N = Número de pares en x y y.

2. Se sustituye en la regla de decisión: rc≥ ro



H1 se acepta. .754 ≥ .754



H1 se acepta.

En este caso el valor calculado es igual al de la tabla E del apéndice por lo tanto se acepta la hipótesis alterna.

H1. Sí existe relación entre la agresión y la frustración en estudiantes universitarios.

3. Finalmente se interpreta el valor obtenido.

r = .754 es una correlación media, directamente proporcional y significativa. Es decir a mayor agresión mayor frustración en estudiantes universitarios. Ejercicio SPSS

Con la finalidad de conocer cómo los factores de la escala de estilos de negociación y los factores de satisfacción marital se relacionan (Rivera y Díaz- Loving, 2002) se aplicó el coeficiente de correlación producto-momento de Pearson.

Se plantearon las siguientes hipótesis:

H0. No existe relación entre la satisfacción marital y los estilos de ne- gociación ante el conflicto en parejas.

H1. Sí existe relación entre la satisfacción marital y los estilos de negociación ante el conflicto en parejas.

Posteriormente, una vez capturados los datos se siguieron los pasos que a continuación se encuentran:

Paso 1. Se coloca el cursor en Analyze y se da clic en el botón izquierdo del mouse.8

Paso 2. Al hacer clic en Analyze, aparece un menú en el que se coloca el cursor en Correlate, se da clic y aparece otro menú, se coloca el cursor en Bivariate y se da clic.

8 En lo subsiguiente, al indicar que se da clic, se asumirá que es con el botón izquierdo del mouse y que el cursor está colocado en la operación a realizar.

Paso 3. Al hacer clic en Bivariate, se abre un menú que contiene las variables de la investigación.

Paso 4. Las variables de estilos de negociación y satisfacción se marcan con el cursor, se da clic en el icono que está entre las variables de estudio y la siguiente ventana. Se pasan las variables seleccionadas a la ventana vacía para ser analizadas.

Sofía Rivera Aragón 150 Mirna García Méndez

Una vez seleccionada la prueba estadística, se da clic en OK y se muestra el resultado de la correlación de Pearson.9

La tabla 26 muestra los resultados de la correlación de Pearson que son los que indican el valor de la prueba, el nivel de significancia y el número de participantes considerados para el análisis. Estos datos deberán ser interpretados por el investigador, y de esta forma, responder a las preguntas e hipótesis de investigación.

TABLA 26

RESULTADOS DE SPSS DE LA CORRELACIÓN DE PEARSON

Correlations

Acuerdo Acomoda Conten Evitaci

Satasf Pearson Correlation ,628** ,452** -,245** ,235**

Sig. (2-tailed) ,000 ,000 ,000 ,000

N 291 298 291 291

Satrel Pearson Correlation ,618** ,333** -, 184** ,122*

Sig. (2-tailed) ,000 ,000 ,001 ,033

N 304 310 301 302

Insrel Pearson Correlation -,513** -,178* ,250** -,044

Sig. (2-tailed) ,000 ,002 ,000 ,449

N 300 308 298 301

Incapr Pearson Correlation -,493** -,209** ,302** -,104

Sig. (2-tailed) ,000 ,000 ,000 ,070

N 306 314 304 305

Insfam Pearson Correlation -,258** -.088 ,281** -, 120*

Sig. (2-tailed) ,000 ,121 ,000 ,037

N 302 311 300 302

Satcat Pearson Correlation ,620** ,444** -,208** , 194**

Sig. (2-tailed) ,000 ,000 ,000 ,001

N 291 295 289 289

Sinapre Pearson Correlation ,582** ,322** -,201** ,179**

Sig. (2-tailed) ,000 ,000 ,000 ,002

N 304 312 302 303

Inscre Pearson Correlation -,082 ,075 ,187** -,006

Sig. (2-tailed) ,175 ,208 ,002 ,925

N 275 280 273 271

Inaf Pearson Correlation -,425** -, 1 23* ,257** -,141*

Sig. (2-tailed) ,000 ,032 ,000 ,016

N 296 304 295 294

Sorfun Pearson Correlation ,625** ,377** -, 145* ,150*

Sig. (2-tailed) ,000 ,000 ,013 ,010

N 296 303 294 295

Sfisex Pearson Correlation ,582** ,331** -, 166* ,138*

Sig. (2-tailed) ,000 ,000 ,004 ,017

N 300 306 297 299

* Correlation is significant at the 0.05 level (2-tailed). ** Correlation is significant at the 0.01 level (2-tailed).

Estadística paramétrica 151 9_{Con fines didácticos se muestran los resultados de la correlación de Pearson, tal como los}

Reporte de Investigación de la correlación producto-momento de Pearson

Una de las formas de presentar la información obtenida en el SPSS,en un reporte de investigación basado en el estudio sobre estilos o formas de negociar un conflicto en la pareja y la satisfacción que perciben en su relación (Rivera, Díaz-Loving, Cruz y Vidal, 2004) es presentada a continuación:

En la tabla 27 se observa en general para los hombres que estilos positivos de negociar el conflicto incrementan la satisfacción y que estilos negativos la decrementan. Así se encuentra que el estilo de acuerdo-colaboración es el que presenta las correlaciones más altas, seguido del de Acomodación. En ambos casos se encuentra mayor satisfacción en la relación, en las áreas afectiva, de comunicación, familia, atracción física, sexual, intimidad, trato hacia los hijos, organización y funcionamiento, y participación y distribución de las tareas en el hogar. Al igual que los dos anteriores, la evitación presenta correlaciones positivas con varios factores de satisfacción, como son: afecto, comunicación- apoyo, atracción física, intimidad, organización y funcionamiento, y satisfacción sexual. Finalmente en cuanto al estilo competitivo, se observa que entre más alto es el puntaje en éste más insatisfacción percibe el hombre en todas las áreas (véase tabla 27).

t de student

Introducción

Comúnmente hacemos generalizaciones con respecto a diferentes grupos de la población. Por ejemplo, se dice que las mujeres son más emocionales que los hombres, o que los hombres son más fuertes físicamente que las mujeres. También se habla de que el idioma español es más difícil que otros idiomas. Los carros rojos sufren más accidentes que los carros blancos. Los hombres tienen un pensamiento más abstracto que las mujeres. Como se ve podemos hacer un sinfín de comparaciones y de conjeturas. Así estamos

Sofía Rivera Aragón 152 Mirna García Méndez

afirmando que la media de una muestra es más grande, más fuerte y/o más difícil que la otra. No obstante debemos comprobar si realmente se dan estas diferencias. Este apartado se dedicará a conocer una de las pruebas que puede examinar si las diferencias propuestas son significativas.

La distribución t es también llamada la teoría estadística de la muestra pequeña (Young y Veldman, 1983). En la distribución t se estima la media verdadera Ẍ a través de la media de la muestra (μ).

Definición

La t de student es una prueba de hipótesis que observa las diferencias entre dos grupos.

Esta prueba tiene varios usos:

• Encontrar diferencias entre las medias de dos grupos. • Obtener la discriminación de reactivos por grupos extremos. En este apartado sólo hablaremos del primer uso.

Requisitos

La prueba t tiene varios requisitos o supuestos, entre ellos: a) Que los puntajes se distribuyan normalmente.

b) Que haya homocedasticidad de varianza. Es decir que la distancia entre la media y un puntaje crudo sea muy similar de una muestra a otra.

Sofía Rivera Aragón 154 Mirna García Méndez

a) Muestras independientes, se refiere a la comparación entre dos muestras tomadas de la misma población o de poblaciones diferentes. Por ejemplo: 1. Muestras independientes de la misma población: hombres y mujeres de una universidad pública.

2. Muestras independientes de poblaciones diferentes: hombres y mujeres de una universidad pública y una universidad privada.

b) Muestras correlacionadas, se refiere a la comparación de una misma muestra durante dos mediciones, dos aplicaciones, etcétera.

c) Que las variables tengan un nivel de medición intervalar. Por ejemplo: puntaje de inteligencia, calificación obtenida en la escala de satisfacción laboral.

d) Que haya una selección y asignación aleatoria de los participantes.

Clasificación de la prueba t

Por ejemplo:

Medir a una muestra antes y después de un curso sobre matemáticas para ver si se incrementa o decrementa el rendimiento escolar obtenido en la materia. Cálculo de t para muestras

independientes con N Iguales

Esta prueba t se aplica cuando se tienen dos muestras diferentes tomadas de la misma población o de poblaciones diferentes, pero en ambas muestras el tamaño es igual. Por ejemplo:

Variable dependiente: Locus de Control. Variable de clasificación: Sexo.

En este caso, cada una de las categorías de sexo debe tener el mismo número de participantes; por ejemplo: 100 hombres y 100 mujeres.

Para calcular esta prueba se aplica el siguiente procedimiento: a) Plantear las hipótesis estadísticas.

b) Plantear la probabilidad en la cual se comprobarán dichas hipótesis.

Sofía Rivera Aragón Mirna García Méndez

156

c) Calcular las medias para cada grupo

La fórmula para calcular la media para cada grupo es:

donde:

∑X = Sumar las puntuaciones obtenidas de la variable dependiente por separado en cada grupo.

Estadística paramétrica 157 d) Calcular la desviación estándar de cada muestra (σ1y σ2)

La fórmula para calcular la desviación estándar para cada grupo es:

donde:

σx1 = Error estándar de la media para cada grupo, g) Sustituir en la fórmula de t.

donde:

σ = Desviación estándar para cada grupo, N y 1= Constantes.

f) Encontrar el error estándar de la diferencia (σdiff).

La fórmula para el cálculo del error estándar para cada grupo es: e)Encontrar el error estándar de cada media

Sumar los cuadrados de las puntuaciones de cada una de las donde:

Elevar la media de cada grupo al cuadrado. Número de participantes por grupo. N =

En la tabla F del apéndice, se encuentra la tQ (valor de la t de student observada) que permite rechazar y aceptar las hipótesis estadísticas.

3. Posteriormente se aplica la regla de decisión que es: tc ≥ t0



H1 se acepta.

Es decir que como la t de la fórmula es más grande que la de la tabla F entonces se acepta la hipótesis alterna.

Ejercicio

Un investigador desea conocer si el grado de autoritarismo difiere entre maestros de escuelas particulares incorporadas y escuelas públicas. Para ello aplica la escala de Vigano (1986) y encuentra los siguientes datos:

Sofía Rivera Aragón Mirna García Méndez 158

h) Para obtener la significancia, se calculan en primer lugar los grados de libertad.

4. gl = NI + N2 - 2

donde

NI = Número de participantes en el grupo 1. N2 = Número de participantes en el grupo 2. 1 = Constante.

5. Se busca en la tabla de valores críticos de t los grados de libertad y la probabilidad (α).

Para calcular los datos del estudio con la t de student se siguen estos pasos: a) Se plantean las hipótesis estadísticas:

Ho. No existen diferencias estadísticamente significativas en el grado de autoritarismo entre maestros de escuelas particulares y maestros de escuelas públicas.

H1. Sí existen diferencias estadísticamente significativas en el grado de autoritarismo entre maestros de escuelas particulares y maestros de escuelas públicas.

b) Plantear la probabilidad en la cual se comprobarán dichas hipótesis: α = .05.

Maestros de escuela particular Maestros de escuela pública

X1 X12 X2 X22 140 19,600 90 8,100 110 12,100 95 9,025 128 16,384 65 4,225 110 12,100 70 4,900 100 10,000 45 2,025 95 9,025 35 1,225 44 1,936 22 484 36 1,296 60 360 21 441 18 324 ∑X1 = 784 ∑X12 =102482 ∑x2 = 500 ∑x22= 30668 Estadística paramétrica159

Calcular las medias para cada grupo

Sofía Rivera Aragón Mirna García Méndez 160

d) Encontrar el error estándar de cada media (σx1 y σx2):

e) Encontrar el error estándar de la diferencia (σdiff):

f) Sustituir en la fórmula de t:

g) Para obtener la significancia, se calculan en primer lugar los grados de libertad.

1. gl = 9 + 9 - 2 = 16

2. Se busca en la tabla F de valores críticos de t los grados de libertad y la probabilidad (a).

En la tabla F del apéndice, se encuentra la t0 (valor de la t de student observada) que permite rechazar o aceptar las hipótesis estadísticas.

3. Posteriormente se aplica la regla de decisión que es: tc≥ ta H1 se acepta.

Es decir que como la t de la fórmula es más pequeña que la de la tabla F entonces se acepta la hipótesis nula. Es decir, no existen diferencias estadísticamente significativas en el grado de autoritarismo entre maestros de escuelas particulares incorporadas y escuelas públicas.

Cálculo de t para muestras

independientes con N desiguales

Esta prueba t se aplica cuando se tienen dos muestras diferentes tomadas de la misma población o de poblaciones diferentes, pero cada muestra tiene un tamaño diferente. Es decir el número de participantes del grupo 1 difiere del

In document Combining Probabilistic Shape-from-Shading & Statistical Facial Shape Models (Page 51-56)