terminos basicos de estadistica

13
Republica Bolivariana de Venezuela Ministerio del Poder Popular para la Educacion Instituto Universitario Politecnico “Santiago Mariño” Barcelona, Edo Anzoátegui Presentacion Nº 1 Profesor: Pedro Beltran Bachiller: Josué Landaeta Bna, 17/05/2015

Upload: josue-landaeta

Post on 13-Aug-2015

27 views

Category:

Education


1 download

TRANSCRIPT

Republica Bolivariana de VenezuelaMinisterio del Poder Popular para la Educacion

Instituto Universitario Politecnico “Santiago Mariño”Barcelona, Edo Anzoátegui

Presentacion Nº 1

Profesor: Pedro Beltran

Bachiller:Josué Landaeta

Bna, 17/05/2015

Concepto de variables y tiposTodos aquellos factores, eventos o sucesos, susceptibles de cambio, ya de sea de origen personal, social, físico, etc., que pueda adoptar más de un valor en un continuo, se le denomina variable, así por ejemplo, la edad, es una variable cuantitativa continua, ya que puede adoptar más de un valor en un gradiente preestablecido; otro ejemplo, sería el género, variable dicotómica (es decir puede adoptar dos únicos valores) de naturaleza cualitativa. Por tanto, es la naturaleza de la variable la que nos determina la forma de estudio.Clasificación de las variables:

Variable dependiente:Hacen referencia a las características de la realidad que se ven determinadas o que dependen del valor que asuman otros fenómenos o variables independientes.

Variable independiente:Los cambios en los valores de este tipo de variables determinan cambios en los valores de otra (variable dependiente)

Variables intervinientes:Este tipo de variables determina las relaciones entre dos o más variables. Los resultados de las variables de estudio pueden verse afectadas por los valores o la interposición de otras variables controladas o no en el proceso de estudio. Estas variables nos permiten determinar los indicadores de variabilidad.Todo proceso de investigación queda determinado por el número y naturaleza de las variables que incluyamos en un estudio, a mayor número de variables introducidas y controladas, mayor será la significación matemática de los resultados que arroje la investigación, por ejemplo, si estudiamos las características socioeconómicas de una zona, en la medida que introduzcamos y controlemos en nuestro estudio más de una variable, mayor será el poder predictivo y explicativo de nuestro objetivo de estudio, así si queremos explicar las características socioeconómicas de una determinada zona debemos introducir en nuestro estudio variables tales como, edad, nivel educativo, renta per cápita, actividad productiva, etc.

 Concepto de población y muestraEl concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.Destacamos algunas definiciones:"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística y en nuestro caso social, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos.Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de habitantes de una comarca.Cuando la población es muy grande, es obvio que la observación y/o medición de todos los elementos se multiplica la complejidad, en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.

Muestra:La muestra es una representación significativa de las características de una población, que bajo, la asunción de un error (generalmente no superior al 5%) estudiamos las características de un conjunto poblacional mucho menor que la población global."Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991)."Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996)."Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).Por ejemplo estudiamos los valores sociales de una población de 5000 habitantes aprox., entendemos que sería de gran dificultad poder analizar los valores sociales de todos ellos, por ello, la estadística nos dota de una herramienta que es la muestra para extraer un conjunto de población que represente a la globalidad y sobre la muestra realizar el estudio. Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población.Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.Tipos de muestreoExisten dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir como tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis

estadístico necesario para hacer muestras de probabilidad.

Parámetro estadístico

En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística.1 El cálculo de este número está bien definido, usualmente mediante una fórmula aritméticaobtenida a partir de datos de la población.2 3

Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.4

El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.Por ejemplo, suele ofrecerse como resumen de la juventud de una población la media aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal población

Medición y escalas de medida

Medición es el proceso por el cual se asignan números a objetos o características según determinadas reglas.Una escala de medida es, en un sentido general, un procedimiento mediante el cual se relacionan de manera biunívoca un conjunto de modalidades (distintas) con un conjunto de números (distintos).Estos es, a cada modalidad le corresponde un sólo número, y a cada número le corresponde una sola modalidad.Atendiendo a las relaciones que puedan verificarse empíricamente entre las modalidades de los objetos o características pueden distinguirse cuatro tipo de escalas de medida: nominal, ordinal, de intervalos y de razón.Otro concepto relacionado con las escalas de medidas es el de transformación admisible, el cual hace referencia al problema de la unicidad de la medida y que puede plantearse de la siguiente forma: ¿son las representaciones numéricas que hacemos de las modalidades las únicas posibles? NO.

Escala nominal Se utiliza en todas aquellas modalidades o características en las que la única comprobación empírica que puede hacerse es la de igualdad o desigualdad.Supongamos que se dispone de un conjunto de n elementos (o1, o2, ., on) con una determinada característica que adopta k modalidades diferentes.A la modalidad de un objeto genérico oI, la representamos por m(oi), y al número que asignamos a dicha modalidad lo representamos por n(oi).La regla de asignación de números a los objetos, de modo que se preserven las relaciones empíricas observadas entre estos debe cumplir las siguientes condiciones:Si n(oi) = n(oj), entonces m(oI) = m(oj)Si n(oi) ¹ n(oj), entonces m(oI) ¹ m(oj)La transformación admsible es: cualquiera que preserve las relaciones de igualdad-desigualdad de los objetos respecto a una determinada característica.

Escala ordinalLos objetos pueden manifestar determinada característica en mayor grado unos que otros. Ej. La dureza de los minerales.Supongamos que se dispone de un conjunto de n objetos (o1, o2, ., on)y cada uno posee una cierta magnitud de una determinada característica [m(o1), m(o2), ., m(on)].La escala para asignar números a los objetos [n(o1), n(o2), ., n(on)],de modo que reflejen esos diferentes grados en que los objetos presenten la característica, ha de cumplir las siguientes condiciones:Si n(oi) = n(oj), entonces m(oi) = m(oj)Si n(oi) > n(oj), entonces m(oi) > m(oj)Si n(oi) < n(oj), entonces m(oi) < m(oj)Transformación admisible: cualquier tranformación es válida siempre que preserve el orden de magnitud, creciente o decreciente, en que los objetos presentan determinada característica.

Escala de intervalosPermite establecer la igualdad o desigualdad de las diferencias enre las magnitudes de los objetods medidos. Ej. Termómetro, calendario.Supongamos que los valores asignados a los objetos sean una representación numérica correcta de sus relaciones empíricas.Para todo cuarteto de objetos genéricos, oI, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:Si n(oi) - n(oj) = n(ok) - n(ol),entonces m(oi) - m(oj) = m(ok) - m(ol).Si n(oi) - n(oj) > n(ok) - n(ol),entonces m(oi) - m(oj) > m(ok) - m(ol).Si n(oi) - n(oj) < n(ok) - n(ol),entonces m(oi) - m(oj) < m(ok) - m(ol).

Las transformaciones admisibles deben seguir una condicion del tipo:t[n(oi)] = a + b . n(oi), siempre que b > 0.Es decir, una trasformación lineal tal de los valores iniciales de una escala de intervalo deja la escala invariante respecto a las condiciones estipuladas en el párrafo anterior.Este tipo de transformación supone un cambio en los dos aspectos que caracterizan la escala de intervalo.Por un lado, el valor a, como constante aditiva, provoca un cambio en el origen.Por otro lado, el factor b provoca un cambio en la unidad de medida que se toma para construir la escala(sólo cuando b = 1 la unidad de medida no se altera).

Escalas de razón: Las escalas de intervalo sirven para medir características en las que el valor cero no significa ausencia de dicha característica.Los valores en una escala de razón tienen un valor absoluto, no arbitrario, o valor cero absoluto que sí significa ausencia de característica.Para todo cuarteto de objetos genéricos, oi, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:Si n(oi)/n(oj) = n(ok)/n(ol),entonces m(oi)/m(oj) = m(ok)/m(ol).Si n(oi)/n(oj) > n(ok)/n(ol),entonces m(oi)/m(oj) > m(ok)/m(ol).Si n(oi)/n(oj) < n(ok)/n(ol),entonces m(oi)/m(oj) < m(ok)/m(ol).Al tener un origen de escala absoluto, la única transformación admisible para la escala de razón es del tipo: t[n(oi)] = a . n(oI), siendo a > 0.

LA SUMATORIA

Se emplea para representar la suma de muchos o infinitos sumandos.

RAZÓN:La Razón es el cociente entre dos números, en el que ninguno o sólo algunos elementos del numerador están incluidos en el denominador. El rango es de 0 a infinito.

Ejemplos:

En el año 2002, según el Centro Nacional de Epidemiología se declararon los siguientes casos de legionelosis:            

1. Legionelosis adquirida en la comunidad/legionelosis nosocomiales= 372/29= 12,8. Por cada caso de legionelosis nosocomial hay 12,8 casos comunitarios.

 2. Defunciones por legionelosis adquirida en la comunidad/defunciones por legionelosis nosocomiales= 9/5= 1,8. Por cada defunción por legionelosis nosocomial hay 1,8 defunciones por legionelosis adquirida en la comunidad. 

PROPORCIÓN:La proporción es una razón en la cual los elementos del numerador están incluidos en el denominador. Se utiliza como estimación de la probabilidad de un evento. El rango es de 0 a 1, o de 0 a 100%.

Ejemplos (tomando los datos de la tabla de arriba):1. Casos de legionelosis comunitarias en relación al total del año 2002= 372/401= 0,93* 100= 93%. El 93% de las legionelosis declaradas en España en 2002 fueron adquiridas en la comunidad.2. Defunciones por legionelosis comunitarias en relación al total de las defunciones por legionelosis del año 2002= 9/14= 0,64* 100= 64%. El 64% de las defunciones por legionelosis declaradas en España en 2002 fueron por legionella adquirida en la comunidad. TASA:La tasa es un tipo especial de razón o de proporción que incluye una medida de tiempo en el denominador. Está asociado con la rapidez de cambio de un fenómeno por unidad de una variable (tiempo, temperatura, presión). Los componentes de una tasa son el numerador, el denominador, el tiempo específico en el que el hecho ocurre, y usualmente un multiplicador, potencia de 10, que convierte una fracción o decimal en un número entero. Según el Instituto Nacional de Estadística, en el año 2002 se encontraba censada en España una población de 41.837.894 personas.Ejemplos (ver datos de la tabla):1. Tasa de legionelosis en el año 2002 en España= 401/41.837.894 =0,96*10-5 (*100.000)= 0,96 personas padecieron legionelosis en el año 2002 en España por cada 100.000 habitantes.2. Tasa de mortalidad por legionelosis en España en 2002= 14/41.837.894= 3,3*10-7 (*100.000)= 0,033 personas fallecieron por legionelosis en España en 2002 por cada 100.000 habitantes.

Frecuencia

Se denomina frecuencia a la cantidad de veces que se repite un determinado valor de la variable.Se suelen representar con histogramas y diagramas de Pareto.

Tipos de frecuenciaEjemplo: variables de A en una muestra estadística de un conjunto B de tamaño 50 (N).En estadística se pueden distinguir hasta cuatro tipos de frecuencias:Frecuencia absoluta: Es el promedio de una suma predeterminada y además consiste en saber cual es el número o símbolo de mayor equivalencia. (ni) de una variable estadística Xi, es el número de veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).

Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias.Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)

Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N.

Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.

Indique a través de un ejemplo general, cada uno de estos conceptos.