Probabilidad y estadística
Estadística: La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Es la rama de las matemáticas que se ocupa de los datos, así como de las inferencias que se pueden hacer a partir de su análisis.
Dato: Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico.
Datos cualitativos: Son un atributo que identifica a un elemento. No se pueden medir con números.
Datos cuantitativos: Indican la cantidad en que se presenta un atributo. Se miden con números.
Razón: Cuando el resultado de las frecuencias se tiene como división y se indica tal y como es.
Proporción: Cuando el resultado se resuelve.
Porcentaje: Se da el resultado en un tanto por ciento de 100%.
Cómo se tabula: Lo primero que puedes hacer para analizar la información es preparar una tabla en la que mostremos las diferentes clases de datos y el número de veces que éstos se presentaron. A esta tabla se le llama distribución de frecuencias.
Tabla de distribución de Frecuencias: Es una ordenación que tiene la forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia respectivamente.
Como ejemplo podemos retomar la tabla de Mortalidad de Graunt que se mostró en la sección anterior.
Las tablas de distribución de frecuencias a su vez pueden ser de dos tipos:
Frecuencias relativas: Es un resumen tabular de los datos que muestra la frecuencia relativa de cada clase (de un universo de 6, 3 cumplen con tal o cual característica).
Frecuencias porcentuales: Es un resumen tabular de los datos donde se ve la frecuencia porcentual de cada clase (de un universo de 6, el 50% cumple con tal o cual característica).
Variables aleatorias discretas: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos.
Variables aleatorias continúas: Una variable continua es aquella que puede tomar valores comprendidos entre dos números.
Tendencias centrales: Nos indican en torno a qué valor (centro) se distribuyen los datos.
Rango: El rango o R es la diferencia entre los valores mayor y menor del conjunto de datos. Así, cuando My representa el mayor valor del grupo y Mn representa el menor, el rango de los datos no agrupados es:
- R= My – Mn
Las medidas de centralización son:
Moda: La moda es el valor que tiene mayor frecuencia absoluta.
Media: La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
Mediana: Valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
De acuerdo con el enfoque clásico de la probabilidad, si N (A) resultados elementales posibles son favorables en evento A, y si existe N (S) posibles resultados en el espacio muestral y todos los resultados elementales son igualmente probables y mutuamente excluyentes; entonces, la probabilidad de que ocurra el evento A es
P(A)= N(A)/ N(S)
A través del enfoque de frecuencia relativa, se determina la probabilidad con base en la proporción de veces que ocurre un resultado favorable en un determinado número de observaciones o experimentos. No hay implícita ninguna suposición previa de igualdad de probabilidades. Debido a que para determinar los valores de probabilidad se requiere de la observación y de la recopilación de datos, a este enfoque se le denomina también enfoque empírico. La probabilidad de que ocurra un evento A, de acuerdo con el enfoque de frecuencia relativa es
P(A)= Número de observaciones de A = n(A)
_____
Tamaño de la muestra n