4.3 MODERNITY, BUT HOW?
4.3.1 Different Relations
para seleccionar la analítica.
Temas relacionados
• Vincular analíticas y documentos
• Configurar una analítica de gráfico de burbujas • Configurar una analítica de gráfico circular • Configurar una analítica de gráfico radial
Opciones de gráfico en las analíticas de exploración de datos
Estos pasos se refieren a las analíticas de exploración de datos, entre las que se incluyen: • Histograma de frecuencias • Ajuste de curva • Gráfico de desfase • Probabilidad normal • Suavizamiento
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderOpciones de gráfico
Descripción Opción
Seleccione esta opción si desea que el nombre de la métrica aparezca como el título del gráfico.
Usar nombre de métri- ca
Seleccione esta opción si desea utilizar un título dife- rente al nombre de la métrica.
Visualizar texto
Solicitar una métrica en las analíticas que utilizan universos de métricas
En el panel de edición de la analítica, la opción Solicitar una métrica en la lista "Seleccionar datos que mostrar" permite configurar la petición que aparecerá cuando se abre la analítica. Esta petición permite seleccionar cualquier métrica en el universo y, de manera predeterminada, incluye la última métrica seleccionada con la petición. También puede introducir el texto de petición. Por ejemplo, si desea configurar una petición en un universo de líneas de productos, puede crear una petición que pregunte "¿Qué línea de productos desea ver?"
La opción Solicitar una métrica está disponible para las analíticas Gráfico circular, de indicador y de exploración de datos.
Temas relacionados
• Configurar una analítica de gráfico circular
• Configurar la analítica de indicador con una métrica, un objetivo o una
consulta de universo
• Configurar una analítica de histograma de frecuencias, de ajuste de curva,
de gráfico de desfase, de gráfico de probabilidad normal o de suavizamiento
Histograma de frecuencias
Las organizaciones pueden utilizar los histogramas en varias áreas del negocio. Por ejemplo, los departamentos de recursos humanos pueden analizar la distribución de las edades y salarios de los empleados, los analistas de marketing pueden observar el número de clientes por ejercicio y valor vital, y los analistas de calidad de una empresa de producción de Usar las analíticas para el análisis
coches pueden estudiar la variabilidad de la distancia de frenado de un nuevo modelo.
Una analítica Histograma de frecuencias muestra los valores agregados (recuentos de puntos de datos) en el eje vertical sobre los intervalos de datos en el eje horizontal. No tiene en cuenta la secuencia de puntos de datos, por lo que se puede utilizar para datos secuenciales como secuenciales, por ejemplo el salario del empleado o la edad del cliente. Funciona bien como parte de un cuadrante analítico que revela aspectos diferentes de una secuencia de medidas que muestran rápidamente las funciones principales de un conjunto de datos.
El Histograma de frecuencias es interactivo, por lo que puede modificar el número de barras que aparecerán en el gráfico.
Parámetros personalizados en una analítica de Histograma de frecuencias
Mientras configura una analítica de Histograma de frecuencias, debe definir los parámetros personalizados en el panel de edición de la analítica.
Descripción Parámetro
Active Manual para especificar el número de ba- rras.
Manual
Especifique el número de barras que desea que aparezcan en el Histograma de frecuencias. Con- sulte la siguiente sección para ayudarle a decidir el número de barras que debe llevar el histograma.
Número de barras de histograma
Decidir el número de barras que debe mostrar el histograma La tabla siguiente muestra la forma más adecuada de representar la distribución de un conjunto de datos como barras.
Número de barras Tamaño del conjunto de datos
De 5 a 7 Menos de 50
De 6 a 10 De 50 a 99
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderNúmero de barras Tamaño del conjunto de datos
De 7 a 12 De 100 a 250
Histogramas: estudio de caso de fabricación
Se eligen setenta coches al azar en la línea de ensamblaje de una planta de producción de automóviles para llevar a cabo un proceso de control de calidad. Se registra la distancia de frenado de cada coche a partir de una velocidad de 35 millas/h hasta pararse el coche completamente. La siguiente tabla recoge las distancias de frenado, en pies, que se obtuvieron durante el control de calidad: 56 50 66 42 21 54 39 58 63 75 41 40 59 62 61 48 65 60 51 43 32 54 38 36 73 60 46 27 45 55 54 76 35 36 60 47 52 42 47 46 54 71 58 69 40 39 49 55 62
Usar las analíticas para el análisis
57 32 62 55 56 78 52 62 67 64 58 36 84 45 49 53 42 37 73 36 51
Se definen siete intervalos de igual tamaño que cubren todos los puntos de datos desde el 21 al 84; después, los 70 puntos de datos se asignan a sus intervalos respectivos y se cuentan para cada intervalo de la siguiente manera: 7 6 5 4 3 2 1 Número de intervalo (80- 89) (70- 79) (60- 69) (50-59) (40- 49) (30- 39) (20-29) Límites de intervalo: 1 6 14 20 16 11 2 Número de datos por intervalo:
La representación gráfica de los recuentos por intervalo de un gráfico de barras devuelve el siguiente histograma:
70 N
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard Builder10,000 Ancho de intervalo 12,000 Mínimo 84,000 Máximo 52,300 Media 12,980 Sigma
El histograma muestra una forma casi simétrica. Si se elige un ancho de intervalo de 5 en lugar de 10, se obtiene un gráfico con más barras y una forma diferente. 70 N 5,000 Ancho de intervalo 12,000 Mínimo 84,000 Máximo 52,300 Media
Usar las analíticas para el análisis
12,980 Sigma
Tenga en cuenta que las estadísticas descriptivas (N, Mínimo, Máximo, Media y Sigma) permanecen iguales entre el histograma de 10 barras y el histograma de 5 barras. Se debe a que se crean a partir de los mismos puntos de datos individuales; sólo es diferente la imagen de resumen que ofrece el gráfico debido al cambio de intervalos.
El siguiente histograma utiliza intervalos de 15.
70 N 15,000 Ancho de intervalo 21,000 Mínimo 84,000 Máximo 52,300 Media 12,980 Sigma
A partir de estos ejemplos podemos comprobar que es importante elegir el ancho adecuado del intervalo para representar de manera más adecuada la distribución de un conjunto de datos.
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderPara evaluar la simetría de un conjunto de datos, se recomienda utilizar, además del histograma, un gráfico del tipo Gráfico de probabilidad normal, que se considera más sólido. Al contrario que el histograma que sólo muestra recuentos agregados, el Gráfico de probabilidad normal enseña los puntos de datos individuales. 70 N 15,000 Ancho de intervalo 21,000 Mínimo 84,000 Máximo 52,300 Media 53,500 Mediana 0,0814 Asimetría 12,980 Desviación estándar -0,2683 Aplanamiento de coeficiente 0,9938 R2
El gráfico se ha diseñado para que, si los datos siguen una distribución normal, los puntos aparezca dibujando un patrón lineal; se puede incluir una línea roja en los datos para ayudar a evaluar la normalidad.
Usar las analíticas para el análisis
Ajuste de curva
Puede utilizar la siguiente analítica de curva para analizar tendencias: • Curvas de tendencia simple
• Curvas en S
Mientras visualiza la analítica terminada, puede cambiar los parámetros personalizados del menú interactivo de la analítica.
Mínimos cuadrados
La analítica de Ajuste de curva utiliza el método de mínimos cuadrados para estimar la tendencia y las curvas en S que mejor se ajustan a los valores métricos en el tiempo.
Todas las curvas se convierten en una función lineal del tipo Y = a + b T.
Curvas en S
Las curvas en S tiene lugar normalmente en ventas acumulativas de productos trazados a través del tiempo. El ajuste de una curva en S a los primeros meses o años de los datos permite a una empresa estimar el nivel máximo de ventas del producto. Permite también al usuario estimar el tiempo que tardarán en estabilizarse las ventas.
Se recomiendan las siguientes variaciones de curva en S: • Logística
La curva logística se utiliza a menudo para describir el crecimiento de las ventas de un nuevo producto: un periodo inicial de aprendizaje, en el que las ventas son bajas, con un rápido incremento a medida que las ventas se extienden entre la población, y después un periodo de ralentización a medida que la nueva demanda para el producto alcanza el punto de saturación. La curva logística también se denomina la curva Pearl.
• Gompertz
La curva Gompertz es una curva de crecimiento similar a la curva logística, aunque a diferencia de ésta, no es simétrica.
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderTemas relacionados
• ¿Qué es la curva Gompertz? • ¿Qué es la curva logística?
Curvas de tendencia simple
Puede utilizar las siguientes curvas de tendencia simple para Ajuste de curva:
• Lineal
Esta curva muestra los datos métricos con una línea recta; apropiada para los datos que cambian cada período en las misma cantidad. • Exponencial
La curva Exponencial intenta ajustar la serie de tiempo en una curva descendente o creciente; funciona con datos que se incrementan o reducen en la misma tasa para cada período.
• Potencia, Logarítmica, Hipérbola
Las curvas de Potencia, Logarítmica e Hipérbola son similares a la curva exponencial, salvo que la tasa de crecimiento o deceleración sigue un patrón diferente.
Parámetros personalizados en una analítica de Ajuste de curva
Mientras configura una analítica de Ajuste de curva, debe definir los parámetros personalizados en el panel de edición de la analítica. Usar las analíticas para el análisis
Descripción Parámetro
Puede elegir entre los siguientes:
• Para crear una curva sencilla de tendencia, uti- lice: • Lineal • Exponencial • Potencia • Logarítmica • Hipérbola
• Para crear una curva con forma de S, utilice:
• Gompertz • Logística Curva
Use este parámetro para extrapolar valores de métricas en periodos futuros. Especifique el número de periodos que desea predecir según la curva ajustada.
Periodos de previsión
Utilice este parámetro para aplicar el ajuste sola- mente a los valores más recientes y no a todos los puntos de datos.
Utilizar últimos periodos
Active Límite para definir un límite superior en la curva.
Límite (Logística y Gom- pertz)
Temas relacionados • Curvas en S
• Curvas de tendencia simple • ¿Qué es la curva Gompertz? • ¿Qué es una hipérbola? • ¿Qué es la curva logística? • ¿Qué es un curva exponencial? • ¿Qué es la curva de potencia? • ¿Qué es la curva logarítmica?
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderGráfico de desfase
Mediante la analítica Gráfico de desfase puede revelar modelos en datos secuenciales (por ejemplo, en una serie de tiempo) que es posible que se hayan omitido al observar un gráfico de líneas.
Esta analítica es un diagrama de dispersión que toma como entrada una sola serie de medidas y genera como salida las siguientes series: • Yt: valor de tiempo t
• Yt-l: valor de tiempo t menos desfase
El valor Yt-l se traza en el eje horizontal, mientras que Yt se traza en el eje vertical. De manera predeterminada, el gráfico se muestra con el desfase = 1. El usuario puede incrementarlo en un valor de 1 a cualquier número entero que sea inferior al número total de valores brutos.
Un gráfico de desfase que muestra los resultados en la forma de un óvalo es típico de los datos sinusoidales, que no se pueden ver en un gráfico de líneas donde los puntos ascienden y descienden de manera constante.
Gráfico de probabilidad normal
El gráfico de probabilidad normal es un diagrama de dispersión en el que, si el conjunto de datos está distribuido de manera normal, los puntos de datos siguen una línea recta. Al encargarse de medidas secuenciales, no conserva la secuencia de los datos.
Nota:
La secuencia de tiempo de los puntos de datos se ignora por completo en el proceso de elaboración de un gráfico de probabilidad normal.
El eje y del gráfico representa los valores brutos de la medida y el eje x muestra los valores z basados en estadística de clasificación. Para obtener los valores del eje x, calcule la estadística de clasificación a partir de números de rango, utilizando uno de los diferentes métodos:
• Clasificación de punto medio = (rango -0,5)/n
• Tipo I de clasificación mediana = (rango -0,3)/(n+ 0,4) • Tipo II de clasificación mediana = (rango -3/8)/(n+ 1/4) Usar las analíticas para el análisis
Donde n representa el número total de valores en el conjunto de datos.
Suavizamiento
Se trata de una técnica de visualización que amplía la tendencia subyacente o los ciclos de sus datos. En alguna serie de tiempo, la variación estacional es tan fuerte que ocultará las tendencias y los ciclos que le permiten comprender la métrica que se va a respetar.
Un suavizador actúa como un filtro que elimina la variación estacional o valores poco comunes y consigue que las fluctuaciones a largo plazo de las series destaquen de manera más clara. Se encuentran disponibles las siguientes técnicas estándar para el suavizado de datos de series de tiempo: • Promedio móvil centrado
• Media móvil ponderada • Suavizador resistente
• Suavizador de regresión local
Promedio móvil centrado
La analítica Promedio móvil centrado permite suavizar una secuencia de medidas para calcular el valor promedio de un indicador en un intervalo móvil.
Seleccione el número de puntos para ver el efecto de suavizado inmediato en los datos de un gráfico de líneas. Cuanto más grande es la ventana, más suavizada está la línea de suavizado.
Suavizador de regresión local
El suavizador de regresión local es similar a la técnica de promedio móvil ponderado salvo que en lugar de calcular el promedio de los puntos de datos incluidos en el intervalo móvil, ajusta una línea de regresión a los datos basados en el método de mínimos cuadrados ponderados.
Temas relacionados
• Suavizador de promedio móvil
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderSuavizador resistente
El suavizador resistente aplica varias medianas de proceso a los datos, por lo tanto la línea suavizada no se contamina de valores extremos (también conocidos como valores atípicos).
Suavizador de promedio móvil
Puede crear los siguientes tipos de medias móviles ponderadas en la analítica Suavizamiento:
• Promedio móvil 2 x 4 • Promedio móvil Spencer • Promedio móvil Henderson
Para obtener información sobre promedios móviles, consulte la
documentación sobre promedios móviles en los términos de la exploración de datos.
Términos de exploración de datos
¿Qué es un curva exponencial?
Una relación exponencial entre las variables X e Y indica que los datos de Y cambian en el mismo porcentaje cuando se produce un cambio absoluto de X.
La ecuación de la curva exponencial es: Y = a exp(bX)
donde a y b son constantes.
¿Qué es la curva Gompertz?
La curva Gompertz es una curva de crecimiento con forma de S similar a la curva logística, excepto en que no es simétrica.
La ecuación de la curva Gompertz es: Y = L exp(-b exp(-k X) )
donde L es el límite y b y k son constantes. Usar las analíticas para el análisis
¿Qué es una hipérbola?
Una relación hiperbólica entre las variables X e Y indica que los datos de Y cambian en la misma cantidad absoluta cuando se produce un cambio absoluto dado de la X recíproca. La ecuación de la hipérbola es: Y = a + (b/x)
¿Qué es la curva logarítmica?
Una relación logarítmica entre las variables X e Y indica que los datos de Y cambian en la misma cantidad absoluta cuando se produce un cambio de porcentaje dado de X. La ecuación de la curva logarítmica es:
Y = a + b ln(X)
donde a y b son constantes y ln es el logaritmo natural.
¿Qué es la curva logística?
La curva logística también se denomina la curva Pearl y es una curva de crecimiento simétrico con forma de S.
La curva logística se utiliza a menudo para describir el crecimiento de las ventas de un nuevo producto: un período inicial de aprendizaje, en el que las ventas son bajas, con un rápido incremento a medida que las ventas se extienden entre la población, y, después, un período de ralentización, a medida que la nueva demanda para el producto alcanza el punto de saturación.
La ecuación de la curva logística es: Y = L / ( 1 + a exp(-b X) ) donde L es el límite y a y b son constantes.
Explicación de las media móviles
¿Qué es una media móvil?
En el análisis de datos se utiliza la media móvil para calcular el valor promedio de un indicador a lo largo de un periodo de tiempo. En algunas series temporales, la variación estacional es tan fuerte que oculta las tendencias y los ciclos, que son muy importantes para la comprensión de los procesos observados.
3
Usar las analíticas para el análisis Analíticas que se pueden crear en Dashboard BuilderLa media móvil se puede utilizar como un método de alisamiento que elimina la estacionalidad y hace que las fluctuaciones a largo plazo de las series destaquen más claramente. También se puede utilizar para realizar pronósticos.
Transformaciones de promedio móvil
Uso Transformación
Si su serie de tiempo es mensual, utilice el PM 2x12 para eliminar el carácter estacional.
PM 2x12
Si se requiere "filtrar el carácter estacional" con mayor intensidad, utilice PM 2x24 o PM 2x36 para la serie mensual.
PM 2x24, PM 2x36
También denominado media móvil doble, este media móvil se calcula sobre una serie de datos que repre- senta el resultado de una media móvil.
PM 3x3, PM 3x9, PM 3x5
Media móvil expo- nencial ponderado
Una transformación de media móvil. El PM de Hender- son es otro método de promedio móvil ponderado, centrado y simétrico. Los promedios de 5 y 7 puntos se utilizan para las series trimestrales. Los promedios de 9, 14 y 23 puntos se utilizan para las series men- suales.
Nota:
Todos los métodos de media móvil se externalizan en un archivo (Stats.ini) que se puede personalizar.
PM Henderson 9 pt, 13 pt y 23 pt
Media móvil ponde- rado linealmente Usar las analíticas para el análisis
Uso Transformación
Media móvil centra- do ponderado lineal- mente
Este método de media móvil de mismos meses utiliza un intervalo fijo, pero con puntos de datos que no son continuos. Es útil sobre datos estacionales para alisar- los o para hacer previsiones.
PM mismos meses
El promedio móvil ponderado de Spencer es una forma de calcular un promedio móvil que compensará una tendencia cúbica de los datos. Consiste en dos prome- dios, uno para períodos de 15 y el otro para períodos de 21. Los pesos de Spencer están centrados y son simétricos.
PM Spencer 15 pt y 21 pt
Temas relacionados
• Media móvil exponencial ponderado • Media móvil ponderado linealmente
• Media móvil centrado ponderado linealmente
Media móvil exponencial ponderado
Una transformación de media móvil. Una transformación de período móvil exponencialmente ponderado encuentra el número de puntos requeridos