Tipos de datos Estadísticos: Discretos, continuos, categóricos y ordinales

Tipos de datos Estadísticos

- Tipos de datos
- Tipos de datos SQL
- Tipos de datos Estadísticos
- Pruebas estadísticas: ¿Cuándo usar cuál?
- Hipótesis estadísticas

Al trabajar con estadísticas, es importante reconocer los diferentes tipos de datos: numéricos (discretos y continuos), categóricos y ordinales.

Los datos son las piezas de información reales que recopila a través de su estudio. Por ejemplo, si le preguntas a cinco de tus amigos cuántas mascotas tienen, pueden darte los siguientes datos: 0, 2, 1, 4, 18.

No todos los datos son números, digamos que también registras el sexo de cada uno de tus amigos, obteniendo los siguientes datos: masculino, masculino, femenino, masculino, femenino.

La mayoría de los datos caen en uno de dos grupos: numéricos o categóricos.

Pero aún es importante tener al menos una comprensión básica de los diferentes tipos de datos y los tipos de preguntas que puede usar para responder.

A continuación se explica cómo podemos recopilar estos diferentes tipos de datos, y para qué tipo de análisis podríamos usarlo.

Los dos principales tipos de datos: cualitativos y cuantitativos

En el nivel más alto, existen dos tipos de datos: cuantitativo y cualitativo.

La información cuantitativa trata de números y cosas que puede medir objetivamente: dimensiones como altura, ancho y longitud. Temperatura y humedad. Precios. Área y volumen

Los datos cualitativos tratan con características y descripciones que no se pueden medir fácilmente, pero que se pueden observar subjetivamente, como los olores, los sabores, las texturas, el atractivo y el color.

En términos generales, cuando mides algo y le das un valor numérico, creas datos cuantitativos. Cuando clasifica o juzga algo, crea datos cualitativos. Hasta aquí todo bien. Pero este es solo el nivel más alto de datos: también hay diferentes tipos de datos cuantitativos y cualitativos.

Tipos cuantitativos: datos continuos y datos discretos

Hay dos tipos de datos cuantitativos, que también se conocen como datos numéricos: continuo y discreto. Como regla general, los recuentos son discretos y las mediciones son continuas.

Los datos discretos son un conteo que no se puede hacer más preciso. Por lo general, implica números enteros. Por ejemplo, el número de niños (o adultos, o mascotas) en su familia es información discreta, porque está contando entidades enteras e indivisibles: no puede tener 2.5 hijos o 1.3 mascotas.

Los datos continuos, por otro lado, podrían dividirse y reducirse a niveles cada vez más finos. Por ejemplo, puede medir la altura de sus hijos en escalas progresivamente más precisas (metros, centímetros, milímetros y más), por lo que la altura es un dato continuo.

Si cuento el número de manís individuales en una caja, ese número es una pieza de datos discretos.

Si utilizo una balanza para medir el peso de cada maní, o el peso de toda la caja, eso es información continua.

Los datos continuos se pueden usar en muchos tipos diferentes de pruebas de hipótesis. Por ejemplo, para evaluar la precisión del peso impreso en la caja de manís, podríamos medir 30 cajas y realizar una prueba t de 1 muestra.

Algunos análisis usan datos cuantitativos continuos y discretos al mismo tiempo.

Por ejemplo, podríamos realizar un análisis de regresión para ver si el peso de los manís (datos continuos) está correlacionado con el número de manís en el interior (datos discretos).

Tipos Cualitativos: Datos Binomiales, Datos Nominales y Datos Ordinales

Cuando se clasifica o categoriza algo, se crea datos cualitativos o de atributos. Hay tres tipos principales de datos cualitativos.

Los datos binarios colocan las cosas en una de dos categorías mutuamente excluyentes: correcto / incorrecto, verdadero / falso o aceptar / rechazar.

Ocasionalmente, obtendrémos una caja de manís que contiene un par de piezas individuales que son demasiado duras o demasiado secas. Si revisé la casilla y clasifiqué cada pieza como "Bueno" o "Malo", serían datos binarios.

Podría usar este tipo de datos para desarrollar un modelo estadístico para predecir con qué frecuencia puedo esperar obtener un maní malo.

Al recopilar datos no ordenados o nominales, asignamos elementos individuales a categorías con nombre que no tienen un valor o rango implícito o natural. Si revisé una caja de manís y grabé el color de cada una en mi hoja de trabajo, serían datos nominales.

Este tipo de datos se puede usar de muchas maneras diferentes; por ejemplo, podría usar el análisis de chi-cuadrado para ver si hay diferencias estadísticamente significativas en las cantidades de cada color en un cuadro.

También podemos tener datos ordenados u ordinales, en los que los elementos se asignan a categorías que tienen algún tipo de orden implícito o natural, como "Corto, Medio o Alto".

Otro ejemplo es una pregunta de la encuesta que nos pide que califiquemos un artículo en una escala de 1 a 10, siendo 10 el mejor. Esto implica que 10 es mejor que 9, que es mejor que 8, y así sucesivamente.

Los usos de los datos ordenados son un tema de debate entre los estadísticos.

Todos coinciden en que es apropiado para crear gráficos de barras, pero más allá de eso, no se sabe más.