glosario de terminos basicos estadistica

20
Términos Básicos

Upload: heczobeth

Post on 08-Jul-2016

243 views

Category:

Documents


4 download

DESCRIPTION

descripción básica de términos estadísticos

TRANSCRIPT

Términos Básicos

Maestrante: Heczobeth Piña

ANÁLISIS DE CORRELACIÓN

Es el estudio que se realiza para medir la intensidad o grado de la asociación que existe

entre variables numéricas.

Glosario de Términos Básicos

Estadística

ANÁLISIS DE REGRESIÓN

Es el estudio que se realiza con el propósito de hacer predicciones. El objetivo es el

desarrollo de un modelo estadístico que pueda ser utilizado para predecir valores de una

variable dependiente, basado en los valores de la variable independiente.

AMPLITUD DE UN INTERVALO

Conocido también como amplitud de clase, es la diferencia entre los dos extremos de un

intervalo.

ANÁLISIS DE VARIANZA

Es un método para comparar dos o más medias (Ver media) de «n» grupos analizando la

varianza de los datos, tanto entre «n» grupos como dentro de ellos.

ASIMETRÍA

Es la falta de simetría entre los datos de una distribución. El concepto de asimetría se

refiere a si la curva que forman los valores de la serie presenta la misma forma a la

izquierda y derecha de un valor central (media aritmética).

AUTOCORRELACIÓN

Se denomina así a la correlación de una variable consigo misma cuando se desfasa uno

o más periodos de tiempo. Se determina calculando el coeficiente de autocorrelación.

BASE DEL ÍNDICE

Es la magnitud utilizada como unidad de referencia, contra la cual se hacen todas las

comparaciones de la variable en estudio. Esta base puede corresponder a un año, un

trimestre, un mes, etc.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

CARTOGRAMAS

Es un tipo de gráfico mediante el cual se muestra datos estadísticos sobre una base

geográfica como mapas.

BONDAD DE AJUSTE

Es un indicador que permite discernir acerca de qué tan buena es la ecuación obtenida.

Para determinar la bondad de un ajuste se utilizan diferentes criterios en la regresión

lineal. Unos se refieren a los residuales como son el valor de la sumatoria de residuales

al cuadrado, la varianza, la desviación estándar del ajuste y el coeficiente de correlación

al cuadrado. Otro indicador de la bondad de ajuste es el realizado mediante el test de

bondad de ajuste utilizando la prueba Ji-Cuadrada (X 2 ), Kolgomorov -Smirnov (K-S)

entre otras.

CENSO

Es una investigación estadística que consiste en el recuento de la totalidad de los

elementos que componen la población por investigar. Es necesario que se especifique el

espacio y el tiempo al que se refiere el recuento.

CLASE MEDIANA

En una tabla de datos agrupados, es la clase o intervalo al que pertenece el valor de la

mediana.

CLASE MODAL

En una tabla de datos agrupados, es la clase o intervalo que tiene la mayor frecuencia.

CLASE O CATEGORÍA

Se denomina así a la característica o a los intervalos construidos convenientemente para

agrupar la información. Está conformada por el número de particiones que se realiza al

conjunto de información.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

COEFICIENTE DE ASIMETRÍA DE FISHER

Es un valor que indica la asimetría. Simbólicamente se representa por ƴ ̡

CODIFICACIÓN

Es asignar números o claves a la información para facilitar el procesamiento.

Generalmente se realiza sobre las respuestas de un cuestionario, para poder

identificarlas con mayor eficacia al momento del procesamiento de datos.

COEFICIENTE DE CONFIANZA

Se representa por (1- α) y es la probabilidad de que la hipótesis nula Ho no sea

rechazada cuando de hecho es verdadera y debería ser aceptada.

COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON

Es un número que mide la intensidad de la asociación lineal entre dos variables.

El coeficiente de correlación se representa simbólicamente por "r".

COEFICIENTE DE ASIMETRÍA DE PEARSON

Es un valor que indica la asimetría. Simbólicamente se representa por As, y se obtiene

mediante la siguiente fórmula:

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

Este coeficiente se aplica cuando la relación que puede existir entre las variables es

lineal (es decir, si representáramos en un gráfico los pares de valores de las dos

variables, la nube de puntos se aproximaría a una recta).

Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1

Si "r" > 0 La correlación lineal es positiva (si sube el valor de una variable sube el de la

otra). La correlación es tanto más fuerte cuanto más se aproxime a 1.

Si "r" < 0 La correlación lineal es negativa (si sube el valor de una variable disminuye el

de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.

Si "r" = 0 No existe correlación lineal entre las variables, aunque podría existir otro tipo

de correlación (parabólica, exponencial, etc.)

De todos modos, aunque el valor de "r" fuera próximo a 1 ó -1, tampoco esto quiere decir

obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que

este resultado podría haberse debido al puro azar.

COEFICIENTE DE CURTOSIS

Es una medida de forma. Se conoce como coeficiente de curtosis de Fisher, en honor al

matemático británico Ronald Fisher (1890-1962).

El valor se obtiene mediante la siguiente fórmula:

No obstante, puede que exista una relación que no sea lineal, sino exponencial,

parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la

intensidad de la relación de las variables, por lo que convendría utilizar un tipo de

coeficiente más apropiado.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

COEFICIENTE DE VARIACIÓN DE PEARSON

Es una medida de dispersión relativa y se calcula dividiendo la desviación típica entre la

media aritmética:

La ventaja de este coeficiente es que no lleva asociado ninguna unidad de medida. Se

Interpreta como porcentaje, por lo que nos permitirá decidir entre dos muestras, cuál es

la que presenta mayor dispersión. Simbólicamente se denota por CV.

COEFICIENTES DE REGRESIÓN

Son los valores constantes de una ecuación de regresión lineal. En el modelo de

regresión lineal siguiente los coeficientes son a y b.

y = a + bx

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

COVARIANZA

Es una medida de la asociación lineal entre dos variables.

CUESTIONARIO

Es el instrumento más utilizado para recolectar datos. Consiste en un conjunto de

preguntas respecto a una o más variables a medir. La esencia de los cuestionarios son

las preguntas que permiten alcanzar los objetivos de la investigación. Las respuestas a

estas preguntas constituyen los datos estadísticos que serán utilizados para conocer las

características de la población o muestra bajo estudio.

CURTOSIS

Es una medida de forma. También se conoce como medida de apuntamiento mide si los

valores de la distribución están más o menos concentrados alrededor de los valores

medios de la muestra. Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica, distribución leptocúrtica y distribución platicúrtica. (Ver gráfico

en coeficiente de curtosis).

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

CUARTIL

Es una medida de posición no central o de localización. Los cuartiles son los tres valores

que dividen la distribución en cuatro partes iguales, es decir, en cuatro intervalos dentro

de cada cual están incluidos el 25% de los datos de la distribución:

lQ 1 Representa el primer cuartil y se interpreta como que el 25% de la

distribución es menor que el Q 1 obtenido.

lQ 2 Representa el segundo cuartil y se interpreta como que el 50% de la

distribución, es menor que el Q 2 obtenido. Este valor es igual a la

mediana.

lQ 3 Representa el tercer cuartil y se interpreta como que el 75% de la

distribución, es menor que el Q 3 obtenido..

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

DATO

Conocido también como información, es el valor de la variable asociada a un elemento

de una población o una muestra.

DESVIACIÓN ESTÁNDAR

Conocida también como desviación típica, es una medida de dispersión que se obtiene

como la raíz cuadrada de la varianza.

DESVIACIÓN MEDIA

Es una medida de dispersión. Es un número que representa la media de los valores

absolutos de las desviaciones respecto a su media aritmética. Se expresa en la misma

unidad en la que se presentan los datos. Se la denota como DM.

DATO CUALITATIVO

Es aquel que representa alguna característica de los elementos de una muestra o una

población que presentan, atributos, actitudes o son opiniones. Son datos NO

NUMÉRICOS.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

DIAGRAMA

Es un dibujo o representación gráfica que sirve para representar un objeto, indicar la

relación entre elementos o mostrar el valor de una magnitud.

DIAGRAMA DE DISPERSIÓN

Es un gráfico utilizado para representar la relación entre los valores observados de dos

variables numéricas. También se conoce como nube de puntos.

DIAGRAMA DE BARRAS

Es un gráfico utilizado para representar la distribución de frecuencias de una variable

cualitativa y cuantitativa discreta. Puede graficarse en forma horizontal o vertical.

DIAGRAMA DE SECTORES

Es un gráfico utilizado para representar la distribución de frecuencias relativas de una

variable cualitativa.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

DISTRIBUCIÓN NORMAL O CURVA NORMAL

Llamada también como distribución de Gauss, es la distribución de probabilidad más

utilizada en estadística y teoría de probabiliad. Esto se debe a dos razones:

- Su función de densidad es simétrica y con forma de campana lo que favorece su

aplicación como modelo a gran número de variables.

- Es además límite de otras distribuciones y aparece relacionada con resultados ligados

a la teoría de las probabilidades gracias a sus propiedades matemáticas. La función de

densidad está dada por:

ENCUESTA

Es un método de recolección de datos. Es llevada a cabo generalmente a través de

algún cuestionario que puede o no ser diligenciado por el encuestado y/o encuestador.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

ERROR DE MUESTREO

Conocido también como error muestral, es la diferencia que existe entre el valor real

(parámetro) obtenido con los valores de la población y el valor estimado en base a los

valores de una muestra (estimación).

ESTADÍSTICA

Es la ciencia que comprende una serie de métodos y procedimientos destinados a la

recopilación, tabulación, procesamiento, análisis e interpretación de datos cuantitativos y

cualitativos. Un objetivo de la estadística es describir "la población del estudio" en base a

información obtenida de elementos individuales. Se divide en dos ramas: Estadística

descriptiva y Estadística inferencial

ESPACIO MUESTRAL

Es el conjunto de todos los resultados posibles de un experimento aleatorio. Cada

experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas

las soluciones posibles).

Ejemplo: si tiramos una moneda al aire una sola vez, el espacio muestral será

cara o sello.

Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el

espacio muestral estaría formado por (cara-cara), (carasello), (sello-cara) y

(sello-sello).

ESTADÍSTICA DESCRIPTIVA

Rama de la ciencia estadística que se encarga desde la recopilación, procesamiento y

análisis de la información siendo sus conclusiones válidas sólo para el grupo analizado.

ESTADÍSTICA INFERENCIAL

Rama de la ciencia estadística que proporciona métodos y procedimientos que permiten

obtener conclusiones para una población a partir del estudio de una o más muestras

representativas.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

ESTADÍSTICO

Conocido también como estadígrafo, es el valor calculado en base a los datos que se

obtienen sobre una muestra y por lo tanto es una estimación de los parámetros. Entre los

más usados se tiene la media muestral y la desviación estándar muestral.

ESTRATO

Es una subpoblación o parte de una población que reúne características comunes que le

hacen ser homogénea. Los estratos son mutuamente excluyentes. Ello significa que los

elementos que pertenecen a un estrato no pueden pertenecer a otro.

ESTRATIFICACIÓN

Es un procedimiento por medio del cual una población se divide en grupos llamados

estratos, con el propósito de seleccionar una muestra separada en cada grupo. Cada

uno de estos grupos o estratos debe ser internamente lo más homogéneo posible.

EXPERIMENTO

Es un método de investigación mediante el cual se determina la incidencia de variables

independientes sobre la variable dependiente.

FRECUENCIA ABSOLUTA

Es el número de veces que la variable asume un valor dado o pertenece a una clase

dada.

FRECUENCIA ABSOLUTA ACUMULADA

Es el número de observaciones hasta (inclusive) un valor dado de una variable numérica.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

FRECUENCIA RELATIVA

Es un valor que se obtiene como el cociente de la frecuencia absoluta (n i ) sobre el

tamaño de la muestra (N). Simbólicamente se representa por hi.

FRECUENCIA RELATIVA ACUMULADA

Es una cantidad que se obtiene como el cociente de la frecuencia absoluta acumulada (N

i ) sobre el tamaño de la muestra (N). Simbólicamente se representa por Hi .

HISTOGRAMA

Gráfico utilizado para representar la distribución de frecuencias de una variable continua.

Describe el comportamiento de un conjunto de datos en cuanto a su tendencia central,

forma y dispersión. Está formado por un conjunto de rectángulos unidos, cuya base es

igual a la amplitud del intervalo, y la longitud proporcional a la frecuencia.

INDEPENDENCIA ESTADÍSTICA

Se dice que dos variables X e Y son independientes, estadísticamente, cuando la

frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales

en todos los casos, es decir:

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

INFERENCIA ESTADÍSTICA

Es una parte de la estadística cuya finalidad es obtener conclusiones respecto a la

población a partir de datos observados en muestras. Es el proceso por medio del cual se

hacen aseveraciones o estimaciones de un todo, a partir de sus partes o elementos.

INTERVALO DE CLASE

Es el conjunto de datos cuantitativos comprendido entre dos valores. Generalmente se

ubican en la primera columna en una tabla de distribución de frecuencias.

Se conoce intervalos abiertos, semiabiertos, cerrados y semicerrados, en función a la

inclusión de los valores extremos.

MARCA DE CLASE

Es la denominación que se le da al punto medio de un intervalo en una tabla de

frecuencias de datos agrupados. Hay tantas marcas de clase como intervalos tenga la

variable. Simbólicamente se representa por xi.

MEDIA ARITMÉTICA PARA DATOS SIMPLES

Es una medida de tendencia central que denota el promedio de un conjunto de datos. Se

calcula dividiendo la suma del conjunto de datos entre el total de ellos. Simbólicamente

se representa por: X

MEDIA ARITMÉTICA PARA DATOS AGRUPADOS

Es una medida de tendencia central. La media aritmética de una variable se define como

la suma ponderada de los valores de la variable por sus frecuencias relativas. Se denota

por y se calcula mediante la expresión: X

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

MEDIANA

Es una medida de tendencia central. Es el valor que divide al conjunto de datos

ordenados, en aproximadamente dos partes: 50% de valores son inferiores y otro 50%

son superiores.

MEDIDAS DE DISPERSIÓN

Son aquellas medidas de resumen que, de acuerdo a algún criterio, reflejan la

heterogeneidad de las observaciones. Dan una idea sobre la representatividad de las

medidas de tendencia central, a mayor dispersión menor representatividad. Entre ellas:

desviación media, varianza, desviación típica, coeficiente de variación, entre otros.

MUESTRA

Es un subconjunto representantivo de la población a partir del cual se pretende realizar

inferencias respecto a la población de donde procede. Los elementos seleccionados con

cierta técnica reúne ciertas características que la hacen ser representativa, significativa y

confiable y que en base a ella se pueden hacer inferencias respecto a la población. La

muestra puede ser probabilística y no probabilística.

MODA

Es una medida de tendencia central es el valor de la variable que tiene mayor frecuencia

absoluta, la que más se repite es la única medida de centralización que tiene sentido

estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por

su propia definición, la moda no es única, pues puede haber dos o más valores de la

variable que tengan la misma frecuencia siendo esta máxima.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

MUESTRA NO PROBABILÍSTICA

Es aquella que se obtiene mediante juicio de la persona que selecciona los elementos de

la muestra que usualmente es un experto en la materia.

MUESTRA PROBABILÍSTICA

Es aquella muestra obtenida por un mecanismo de probabilidades, en el cual cada

elemento de la población total o universo tiene una probabilidad conocida de selección.

MUESTREO ALETORIO SIMPLE

También llamado irrestrictamente aleatorio. Es un método de muestreo donde una

muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del

mismo tamaño tiene igual probabilidad de ser seleccionada de la población.

MUESTREO

Es un conjunto de métodos y procedimientos estadísticos destinados a la selección de

una o mas muestras es la técnica seguida para elegir muestras. El objetivo principal de

un diseño de muestreo es proporcionar procedimientos para la selección de muestras

que sean representativas de la población en estudio.

MUESTREO ESTRATIFICADO ALEATORIO

Es un método de muestreo que se aplica cuando se divide la población en grupos,

llamados estratos, donde los datos son más homogéneos pero un estrato frente al otro

muy distintos. Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a

cada estrato y el tamaño es la suma de los tamaños de todos los estratos.

MUESTREO ESTRATIFICADO ALEATORIO

Es un método de muestreo que se aplica cuando se divide la población en grupos,

llamados estratos, donde los datos son más homogéneos pero un estrato frente al otro

muy distintos. Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a

cada estrato y el tamaño es la suma de los tamaños de todos los estratos.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

POBLACIÓN

Es cualquier conjunto de unidades o elementos claramente definido, en el espacio y el

tiempo, donde los elementos pueden ser personas, granjas, hogares, manzanas,

condados, escuelas, hospitales, empresas, y cualquier otro. Las poblaciones pueden ser

finitas e infinitas.

PARÁMETRO

Es cualquier valor característico de la población. Ejemplo: la media de la población, la

desviación típica de la población. Sin embargo estos valores son desconocidos porque

no siempre podemos tener todos los datos de la población para calcularlos.

POBLACIÓN FINITA

Es aquella en la que es posible enumerar (contar) físicamente los elementos que

pertenecen a la población.

PROBABILIDAD

Es un número que se le asigna a un suceso como una medida de su incertidumbre. Este

número puede tomar valores entre cero y uno inclusive.

POBLACIÓN INFINITA

Es aquella en la que no es posible enumerar (contar) físicamente los elementos que

pertenecen a la población. Dicho de otra manera, cuando los elementos de la población

son ilimitados.

PROBABILIDAD DE SELECCIÓN

Es la oportunidad que tiene cada elemento de la población o universo de ser incluida en

una muestra.

PERCENTIL

Es el valor que resulta de dividir el conjunto de datos en 100 partes iguales.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

RANGO

Conocido también como recorrido, es un número que mide la amplitud de los valores de

un conjunto de datos y se calcula por diferencia entre el valor mayor y el valor menor. Lo

notaremos como R. No constituye una medida muy significativa en la mayoría de los

casos, pero es muy fácil

de calcular.

REDONDEO

Es el procedimiento para expresar un número de acuerdo a una precisión establecida.

TABLA DE DATOS AGRUPADOS

Es un arreglo matricial que contiene el número de veces (frecuencia) que aparece un

dato, de acuerdo a las clases de interés especificadas (puede ser intervalos).

REGRESIÓN

Es una técnia de análisis para poner de manifiesto la estructura de dependencia que

mejor explique el comportamiento de la variable dependiente o explicada a través de un

conjunto de variables independientes o explicativas, con las que se supone está

relacionada.

TENDENCIA

Es un componente del análisis clásico de series temporales. Refleja el movimiento de la

serie en el largo plazo (crecimiento, decrecimiento o estancamiento). Es necesario un

número suficientemente grande de observaciones para determinar una tendencia.

Maestrante: Heczobeth Piña

Glosario de Términos Básicos

Estadística

UNIDAD DE MUESTREO

Es la unidad estadística que se selecciona para constituir la muestra. La elección de la

unidad de muestreo más eficiente es una consideración importante en el diseño de una

muestra.

UNIDAD ESTADÍSTICA

Conocido también como unidad elemental. Es el elemento o unidad base de la población

o de la muestra que permite obtener información o datos referidos a ciertas

características o variables, que nos interesan para explicar un determinado fenómeno.

VARIABLE

Es una característica de la población o de la muestra cuya medida puede cambiar de

valor. Se representa simbólicamente mediante las letras del alfabeto. Según su

naturaleza puede ser cualitativa y cuantitativa.

VARIABLE NOMINAL

Es una variable cualitativa la cual sólo permite asignar nombres a los datos y no implica

ningún orden. Ej. el idioma de los habitantes de la tierra.

VARIABLE ORDINAL

Es una variable cualitativa cuyos valores solamente pueden ser ordenados con algún

criterio.

VARIANZA

Conocida también como variancia, es una medida de dispersión de la información. Se

obtiene como el promedio de los cuadrados de las desviaciones de los valores de la

variable respecto de su media aritmética.