presentacion y tratamiento de informacion 31
DESCRIPTION
MATERIAL DE ESTUDIO ENSECHTRANSCRIPT
1
INDICE
INTRODUCCION………………………………………………………………………………….……………………………………
3
ORGANIZACIÓN DE LOS CONTENIDOS…………………………………………….……………………………………
3
ORIENTACIONES DIDÁCTICAS…………………………………………….…………………………………………………
4
PROPOSITOS GENERALES………………………………………………………………………………………………………
4
BLOQUE I.
CONCEPTOS ESTADÍSTICOS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CONCEPTOS DE ESTADÍSTICA………………………………………….……………………………………………………
5
BLOQUE II.
PRESENTACIÓN DE DATOS………………………………………………….…………………………………………………
8
BLOQUE III.
PARÁMETROS CENTRALES Y DE DISPERSIÓN…………………….…………………………………………………
12
BLOQUE IV.
CORRELACIÓN LINEAL………………………………………………………….…………………………………………………
15
MATERIAL DE APOYO
BLOQUE I
CONCEPTOS ESTADISTICOS E INSTRUMENTOS DE RECOLECCION DE DATOS
LA PRESENTACION DE LOS NUMEROS…………………………….……………………………………………………
20
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS
TEXTOS DE PRENSA ESCRITA…………………………………………………………………………………………………
67
ELEMENTOS MATEMÁTICOS EXPLÍCITOS EN LA PRENSA ESCRITA…………………………………
112
BLOQUE II
PRESENTACIÓN DE DATOS
ESTADÍTICA ELEMENTAL…………………………………………………………………………………………………………
159
ESTADISTICA………………………………………………………………………….……………………….……………………… 160
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS……………..…………………
219
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS……………….…….…………… 250
2
BLOQUE III
PARAMETROS CENTRALES Y DISPERSIÓN
PARAMETROS CENTRALES………………………………………………………………………………………………………
278
ANALISIS EXPLORATORIO DE LOS DATOS……………………………………………………………………………
302
BLOQUE IV
EL TRATAMIENTO D ELA INFORMACIÓN Y LAS FUNCIONES
HACIENDO ENCUESTAS FIABLES……………………….………………………………………………………………….
353
3
INTRODUCCION
La incorporación de los temas relacionados con la presentación y el tratamiento de la información en
los planes y programas de educación secundaria es relativamente reciente. Antes se pensaba que una
buena selección de temas de aritmética, álgebra y geometría brindaba a los alumnos los
conocimientos y habilidades suficientes para enfrentar las exigencias de la vida cotidiana y proseguir
con éxito sus estudios superiores.
De esta forma, era natural que los egresados de ese nivel educativo, no entendieran el tratamiento
matemático de muchos hechos de la vida real como los cambios bursátiles, el riesgo de atentados
terroristas, los récords deportivos, las elecciones políticas, las primal de los seguros, los resultados de
análisis clínicos, los reportes médicos entre otros.
La sociedad genera gran cantidad de datos que se presentan a través de los medios de información
impresos y electrónicos mediante porcentajes, tasas e índices o bien en forma de tablas, gráficas e
inferencias estadísticas.
Por esta razón uno de los aspectos centrales en la formación de los futuros profesores es que estos
sean capaces de desarrollar en los estudiantes los conocimientos, habilidades y actitudes que les
permitirán mas tarde convertirse en ciudadanos que puedan interpretar adecuadamente ese tipo de
información.
ORGANIZACIÓN DE LOS CONTENIDOS
Los contenidos de los programas se organizan en cinco bloques temáticos. En el primer bloque se dan
las bases para que el estudiante cuantifique aspectos de la realidad que permitan interpretarla
adecuadamente, para lo cual se analiza la representatividad de las muestras y se proporcionan
elementos para elaborar y aplicar instrumentos de recolección de datos como el cuestionario y la
entrevista
En el segundo bloque se revisan los conceptos que permitan interpretar y elaborar tablas numéricas a
partir de conjuntos de datos, o de gráficas, teniendo en cuenta el fenómeno a que se refieren, o
inversamente, construir gráficas a partir de tablas estadísticas, eligiendo en cada caso el tipo de
grafica y la forma de elaboración que puede ser manual o electrónica; en este ultimo caso se propone
la utilización de un software como Excel. Se atiende de manera específica la noción de cantidades
relativas, dada su utilización en diversos indicadores sociales.
En el tercer bloque se dan criterios para elegir los parámetros centrales y de dispersión más
adecuados para describir una distribución en función del contexto y de la naturaleza de los datos,
utilizando los algoritmos tradicionales, la calculadora o la computadora para su obtención.
En el cuarto bloque se intenta que el estudiante identifique fenómenos de la vida cotidiana que varíen
a tasa constante y que realice proyecciones a futuro; describa tales fenómenos por medio de una
tabla, una grafica y una expresión simbólica de la forma y=mx+b, asimismo se trata que el estudiante
identifique fenómenos cuyo crecimiento sea de tipo aritmético o exponencial.
En el quinto bloque se pretende que el estudiante identifique fenómenos en los que intervengan dos
variables relacionadas, cuya representación grafica sea una nube de puntos alrededor de una recta; se
trata también de que, a partir de esos datos, el estudiante estime el grado de relación que tiene el
cambio de una variable sobre la otra, mediante el calculo del coeficiente de correlación lineal.
4
Asimismo, a partir del mismo conjunto de datos el estudiante encuentre la ecuación de la recta "de
mejor ajuste" determinada por procedimientos formales e informales.
Debido a que la información estadística cambia muy rápidamente, se recomienda que al trabajar los
cinco bloques que conforman la asignatura, el docente proponga el uso de datos provenientes no
solamente de libros de texto y revistas actuales, sino también de sitios o páginas de Internet.
ORIENTACIONES DIDÁCTICAS
Se sugiere desarrollar la asignatura en forma de curso-taller, donde el profesor asume el papel de
conductor de las discusiones que se suscitan en la clase; esto implica que el profesor no es quien
decide sobre la veracidad de los juicios que se emitan clase, sino el grupo, tomando como base la
argumentación que se plantee por parte de los participantes de la clase. En la sección de actividades
sugeridas se muestran algunos ejemplos de como puede organizarse el trabajo colectivo.
Debe resaltarse la diferencia entre los resultados que se encuentran mediante la estadística y los
resultados "exactos" que se obtienen por otras partes de las matemáticas.
En los bloques donde se presenta mayor cantidad de cálculos es importante que la atención se centre
en la correcta interpretación de los resultados que se obtengan mediante dichos cálculos y no en los
algoritmos utilizados. En este punto, se recomienda el uso de las herramientas computacionales, con
objeto de agilizar los cálculos y dedicar más tiempo al análisis de la información y a la interpretación
de los resultados.
Si bien en ocasiones es útil plantear información ficticia para aclarar conceptos estadísticos o resaltar
inferencias incorrectas debido a gráficas y tablas engañosas, en lo posible se debe utilizar información
real derivada del entorno social. Es conveniente que en la recopilación de datos participen todos los
integrantes del grupo.
PROPOSITOS GENERALES
Al término del estudio de los contenidos de este programa se espera que el estudiante normalista:
- Incorporar al lenguaje y modos de argumentación habituales las distintas formas de presentar
información cuantitativa sobre fenómenos y situaciones de los ámbitos social, cultural, económico y
científico, con el fin de comunicarse de manera precisa y rigurosa.
- Utilizar las técnicas de recolección y organización de datos relativos a diversos aspectos de la
realidad que permitan interpretarla adecuadamente.
5
BLOQUES TEMÁTICOS
BLOQUE I. CONCEPTOS ESTADÍSTICOS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CONCEPTOS DE ESTADÍSTICA.
Estadística Descriptiva e inferencias
1. Población y muestras. Representatividad de una muestra
2. Encuestas e instrumentos de obtención de datos. Como preparar una encuesta.
Cuestionarios y entrevistas.
3. Cantidades relativas. Promedios, densidades, concentraciones y razones de cambio
BIBLIOGRAFIA BASICA
• Johnson R. (1996) "Estadística Descriptiva. Capitulo 1" en Estadística elemental. México, Grupo,
Editorial Iberoamérica, pp.2-20.
Nortes Checa A. (1995) Encuestas y precios, España, Editorial Síntesis, pp. 11-48
• Sanchis C. (1993), Hacer Estadística, México, Biblioteca de recursos didácticos Alambra
• López Afonso P. (2000) Probabilidad y Estadística Conceptos, modelos y Aplicaciones en Excel,
Colombia, Prentice hall pp.4-31
• Allen Paulos, J. (1990), Haciendo encuestas fiables", en El hombre anumerico. Tusquets Editores,
España pp. 170-195
SEP (1994), Libro para el Maestro. Matemáticas. Educación Secundaria, México.
Actividades sugeridas
1. En trabajo colectivo, el profesor planteara las preguntas: ¿Que es la presentación y el tratamiento
de la información? ¿Que es hacer estadística? Seguramente en las respuestas Irán apareciendo
términos como población, muestra y otras mas, términos que el profesor ira anotando en el pizarrón
conforme vayan surgiendo. Cuando lo considere oportuno, el profesor puede agregar preguntas como:
¿Que es población, muestra? Una vez que se agoten las opiniones, los estudiantes leerán
individualmente las páginas 11-25 del libro de Nortes y al término de la lectura analizaran de nuevo
las preguntas planteadas con objeto de confrontar las concepciones que se tenían sobre los términos
enunciados. Enseguida, el profesor puede continuar la discusión planteando consignas como las
siguientes:
Den ejemplos de poblaciones y mencionen algunos caracteres que se pueden asociarse
a cada población. En cada caso, distingan si se trata de un carácter cuantitativo
(variable) o cualitativo (atributo.
Enuncien algunos ejemplos en los que es mejor una muestra que la población entera.
Comenten en que sentido la presentación y el tratamiento de la información es una
asignatura cultural imprescindible en la formación del individuo.
Individualmente, escriban un texto en el que expresen su opinión a este respecto. Se
sugiere que algunos alumnos lean el texto que escribieron y hagan comentarios para
6
lograr cada vez mayor claridad.
2. En trabajo colectivo, el profesor preguntara a los estudiantes cual es su grupo sanguíneo;
enseguida el grupo tabulara y calculara los porcentajes correspondientes. Después, el profesor dará a
conocer el cuadro que aparece en la página 100 del libro de Sanchís, en donde se muestran los
porcentajes en que aproximadamente se reparten los grupos sanguíneos, y preguntará si el grupo es
una muestra representativa con respecto de este atributo. Preguntara enseguida: ¿Qué se entiende
entonces por una muestra representativa? Conforme los estudiantes expresen sus opiniones sobre
noción, el profesor ira anotando los aspectos relevantes que se vayan mencionando. Después,
organizados en parejas, leerán las páginas 97-103 del libro de Sanchis. Al término de la lectura, el
profesor puede continuar la discusión planteando preguntas y consignas como las siguientes:
¿Que diferencia existe entre estadística descriptiva y estadística inferencial?
¿Que precauciones deben tomarse para extender a toda la población el
comportamiento de un determinado carácter estudiado solamente en una muestra
extraída de dicha población.
Elijan una muestra de 20 alumnos de su escuela para estudiar un carácter de esa
población; empleen para el caso diversos métodos aleatorios. Estudien el mismo
carácter en su grupo y comparen estos resultados con los de la muestra aleatoria.
3. Organizados en equipos, los alumnos leerán y comentaron las páginas 27 a 41 del libro de Nortes.
Al término de la lectura, el profesor iniciara la discusión planteando la siguiente consigna: Enuncien
ejemplos de problemas de actualidad que puedan ser objeto de una encuesta. Conforme se vayan
presentando las propuestas, el profesor las anotará en el pizarrón y enseguida pedirá a los estudiantes
que elijan el problema que consideren más interesante.
Se sugiere que los alumnos se organicen nuevamente en equipos para elaborar un proyecto de
encuesta para obtener respuestas al problema elegido. Tal proyecto deberá contener el enunciado del
problema, el objetivo de la encuesta, el cuestionario que se aplicara, la elección de una muestra
representativa de la escuela y la selección de los aplicadores.
A continuación cada equipo hará una presentación de su proyecto el cual será objeto de crítica por
parte de los demás integrantes del grupo. Los proyectos serán corregidos tomando en cuenta las
observaciones que se les hicieron. Finalmente, el grupo seleccionara el proyecto más acabado, lo
aplicara y procesara expresando los resultados de las tendencias de opinión en términos de
porcentajes.
4. El profesor iniciara la discusión planteando el siguiente metaproblema: ¿Se resuelven de la misma
manera los dos problemas que siguen? ¿Hay diferencias entre los tipos de cantidades que se dan
como datos en estos problemas?
a) Juan realiza un viaje por carretera. El primer día recorre 450 Km y el segundo, 375. ¿Cuantos
kilómetros recorrió en total?
b) Según el pronóstico del tiempo proporcionado por un noticiario, la probabilidad de que llueva el
próximo sábado es del 50% y de que llueva el domingo es también del 50%. ¿Cual es la probabilidad
de que llueva este fin de semana?
Luego que los estudiantes hayan expuesto sus puntos de vista sobre esta cuestión, leerán y
resolverán en equipo los problemas de las páginas 301 a 309 del Libro para el Maestro. Matemáticas.
Educación secundaria. Una vez que los estudiantes hayan concluido este trabajo, el profesor podrá
7
plantear las siguientes preguntas y consignas:
• ¿Qué diferencias hay entre los tipos de cantidades utilizados en el problema a) y en el
b)?
• ¿Por que el problema b) no se resuelve con una adición?
• ¿Cómo definirías una cantidad relativa? ¿Y una absoluta?
• De acuerdo con el LM, "la función principal de los porcentajes es reducir los datos a
una base común y a números cuya magnitud permita compararlos con facilidad y
darse cuenta de las relaciones existentes entre ellos". En este sentido, ¿cual es la
función de las cantidades relativas expresadas mediante promedios, densidades,
concentraciones y razones de cambio?
5. Organizados en equipos, los estudiantes leerán y comentaran la lectura "Hacienda encuestas
fiables" del libro El hombre anumérico.
Después, el profesor planteara las siguientes preguntas y consignas.
• Desde el punto de vista del autor ¿cual es el papel de los intervalos de confianza?
• ¿Cómo se produce errores en las fracciones y porcentajes?
8
BLOQUE II. PRESENTACIÓN DE DATOS
• Tablas. Frecuencia absoluta y relativa. Frecuencias acumuladas. Datos agrupados en clase.
Tablas de más de dos dimensiones.
• gráficas. Pictogramas. Diagrama circular o de sector. Diagrama de Barra.
Poligono de Frecuencias.
BIBLIOGRAFÍA BÁSICA
• Nortes Checa A. (1995), Encuestas y precios, España, Editorial Síntesis, pp. 11-24
• Sanchis C. (1993), Hacer Estadística, México, Biblioteca de recursos didácticos Alambra pp.
11-15
• Zeisel Hans (1997), Dígalo con números, México, Fondo de Cultura Económica, pp. 42-51
Rodríguez J. (1997), en Razonamiento Matemático. Fundamentos y aplicaciones, México,
Ediciones Thomson, pp. 308-339
SEP (1994), Libro para el Maestro. Matemáticas. Educación Secundaria, México.
SEP (2000), Fichero de Actividades Didácticas. Matemáticas. Educación Secundaria, México.
Actividades sugeridas
1. El profesor organizara al grupo en equipos y les planteara los siguientes problemas:
• Organizar la siguiente información en una tabla con su titulo, subtitulo y leyenda apropiados a la
situación.
En un laboratorio clínico, el número de pruebas de embarazo elaboradas durante los años 1990 a
1998 respectivamente fueron: 30685, 31463, 31583, 30026, 24509, 20453, 31677, 33 724, 31 877.
• Los censos realizados en el país durante los años de 1980 y 1990 reflejaron un aumento en
población en la mayoría de los municipios. Sin embargo, algunos tuvieron un descenso. La siguiente
tabla compara la población de ocho municipios de un Estado.
a) Completa los valores de la tabla
b) ¿Cuál municipio tuvo el cambio mayor?
c) ¿Cuáles municipios tuvieron una disminución en la población?
Cuando los equipos terminen organizara una confrontación de resultados y se continuara de la misma
9
manera con los siguientes problemas:
Después de resolver los problemas, se hará un análisis general apoyándose en las siguientes
preguntas:
a) ¿En qué medida se favorece la reflexión de los estudiantes con los problemas planteados?
b) ¿Que tipo de información se proporciona a los estudiantes?
c) ¿Cual es la estructura general de los problemas planteados?
Se recomienda al profesor recurrir a páginas como la de INEGI para seleccionar otras tablas para
plantear a los estudiantes otras actividades similares. También, si es posible se pueden construir las
tablas en Excel.
1. El profesor organizará al grupo en equipos y les planteará los siguientes problemas: ¿Qué gufeo?
La compañía de cereal "Masitas de Maíz" desea patrocinar el programa de televisión "Que Gufeo",
como parte de los preparativos de promoción, el gerente ha solicitado un informe de la distribución de
las edades de los televidentes del programa, con el fin de que los anuncios se adapten al gusto de la
teleaudiencia. Se realiza un estudio de los televidentes del programa y se presenta el siguiente
histograma con los resultados.
VER archivo GUFEO
1. ¿Qué representa la altura de cada barra?
2. ¿Cuántos televidentes participaron en la encuesta?
3. ¿Qué representa el ancho de cada barra?
4. ¿En qué grupo estaría una persona que cumplirá 28 años en una semana?
5. ¿En qué grupo se ubica una persona que tiene 15 años?
6. ¿Qué edades están incluidas en el grupo mayor de televidentes?
El departamento de la policía desea presentar el patrón de número de multas que se han dado
durante los primeros seis meses del año, y relacionarlo con una campaña de seminarios de orientación
que se han estado realizando. El jefe del departamento alega que durante los meses de orientación
aumenta el número de multas, pero este se ve disminuir durante los meses que no se han ofrecido
seminarios. La figura a continuación presenta una grafica de línea para esta situación.
VER archivo MULTAS
• ¿Cuántas multas se dieron durante abril?
• ¿En cuál mes hubo el mayor número de multas?
• ¿En cuál mes hubo el número menor de multas?
• ¿En qué meses consecutivos hubo un aumento en multas?
• ¿En cuáles meses consecutivos hubo un descenso en multas?
• ¿En cuáles meses consecutivos hubo el mayor aumento?
• Si compartiéramos el parecer del jefe del departamento en cuanto al efecto de los seminarios en el
número de multas dadas, ¿en cuáles meses podríamos inferir que se ofrecieron seminarios?
De continuar este patrón, ¿que cantidad de multas se pueden esperar para julio?
Venta de Autos
VER archivo autos
La siguiente gráfica resume las ventas de tres modelos de autos durante los años 1992, 1993, 1994,
10
1995, 1996.
¿En 1993, aproximadamente cuantos carros del modelo A se habían vendido?
¿Cuáles fueron los dos años consecutivos en que el modelo B tuvo descenso en sus ventas?
¿Cuales fueron los dos años consecutivos en que el modelo C tuvo aumento en sus ventas?
¿Cuál de los modelos podría continuar incrementando sus ventas?
Hasta 1995, ¿cuál modelo mantenía el mayor número de ventas?
Hasta 1994, ¿cuál modelo mantenía el menor número de ventas?
Describe en un párrafo el comportamiento de las ventas de los tres modelos de autos durante el
período de 1992 hasta el 1996.
Gasto Familiar
La gráfica a continuación desglosa los gastos incurridos para la remodelación de la casa de la familia
Ramírez.
VER archivo GASTO
• ¿Cuál fue el gasto total de la remodelación?
• ¿Cuál fue el componente que incurrió el gasto mayor?
• ¿Cuánto se gasto entre madera y pintura?
• ¿Qué por ciento del costo total fue dirigido a la mano de obra?
• ¿Qué por ciento del costo total fue dirigido a cemento y madera?
• ¿Cuál fue la razón del costo de mano de obra comparado con el costo de la instalación eléctrica?
• ¿Cual fue la razón del costo de madera con el costo del cemento?
Universidad Matricula de la Licenciatura
La gráfica siguiente presenta la distribución de 14600 estudiantes de un municipio matriculados en
varias instituciones educativas.
• ¿Cuál es el sector que representa el mayor número de estudiantes?
• ¿Cuál es el sector que representa el menor número de estudiantes?
• ¿Cuántos estudiantes están en matriculados en un Instituto?
• ¿Cuántos estudiantes están en matriculados en un Instituto y en la Escuela Superior?
• ¿Cuál es la razón entre estudiantes en la Escuela Superior y en la Universidad Pública?
• ¿Cual es la razón entre estudiantes en la Universidad Privada y en la Universidad Pública?
La siguiente grafica representa la distribución de estudiantes de una Universidad matriculados en los
diferentes cursos.
¿Qué porcentaje de estudiantes están matriculados en cursos de razonamiento?
¿Cuántos estudiantes están matriculados en los cursos de la Universidad?
¿Cuál es la razón entre estudiantes matriculados en cursos de ciencia y cursos de razonamiento?
2. Después de resolver todos los problemas se hará un análisis general apoyándose en las siguientes
preguntas:
• ¿En qué medida se favorece la reflexión de los estudiantes con los problemas planteados?
• ¿Que tipo de información se proporciona a los estudiantes?
• ¿Cual es la estructura general de los problemas planteados?
3. El profesor planteara, al grupo, la siguiente pregunta: ¿Que implicaciones tiene el hecho de que un
cuadro tenga mucha información? Conforme los estudiantes expresan sus opiniones, el profesor
11
anotara en el pizarrón los aspectos relevantes. Después organizados en binas, leerán las páginas 42 a
51 del libro de Dígalo con números referente a: Los cuadros como gráficas".
I. ¿En que sentido los cuadros pueden considerarse gráficas que facilitan la presentación de la
información?
II. ¿En que sentido las gráficas pueden facilitar la presentación de la información?
4. El profesor organizará al grupo en equipos leerán y comentaran el apartado 2.7 El arte de la
falsedad estadística del texto de Estadística Elemental de Robert Jonson. Posteriormente, el profesor
planteara la siguiente tarea:
Cada equipo elige un periódico o revista donde busquen gráficos y analicen si es correcta la grafica o
que tipo de truco estadístico se utilizo. Finalmente, cada equipo explicara al grupo el resultado de su
análisis.
5. Se organizara al grupo en equipos y se planteara la siguiente tarea: analizar, en los planes y
programas de estudio para la educación primaria y secundaria, respectivamente, el tema de
interpretación y elaboración de tablas y gráficas, con respecto a los siguientes aspectos:
a) ¿Dé dónde se parte y hasta dónde se llega?
b) Vínculos con los contenidos de otras asignaturas que se pueden establecer
c) Tipo de situaciones y problemas que se esperaría pudieran resolver los estudiantes que terminan la
educación secundaria, que involucren la lectura, interpretación y elaboración de tablas y gráfica.
Finalmente, cada equipo presentara al grupo el resultado de su análisis.
6. De acuerdo al proyecto propuesto en el bloque anterior y después de recopilado la información se
presentara en tablas y gráficas que mejor se adecuen al tipo de información.
12
BLOQUE III. PARÁMETROS CENTRALES Y DE DISPERSIÓN
• Concepto de Parámetros. Clases de parámetros
• Parámetros centrales. Conceptos, propiedades y cálculos de la media aritmética, mediana y moda.
Ventajas e inconvenientes de los parámetros centrales. Relación entre
• la media aritmética, mediana y moda.
• Parámetros de dispersión. Conceptos. Rango o recorrido, desviación media, varianza, desviación
típica, coeficiente de variación.
BIBLIOGRAFÍA BÁSICA
• Sanchis C. (1993), "Parámetros centrales" en Hacer Estadística, México, Biblioteca de recursos
didácticos Alambra pp. 41-62
• Lopes Afonso P. (2000) "Análisis exploratorio de los datos: Un numero que los representa a todos:
las llamadas medidas de tendencia central" en Probabilidad y Estadística Conceptos, modelos y
Aplicaciones en Excel, Colombia, Prentice hall pp.37-59
• Rodríguez J. (1997) "Medidas de Tendencia Central", en Razonamiento Matemático. Fundamentos y
aplicaciones, México, Ediciones Thomson, pp. 340-354
• Nortes Checa A. (1995) "Los cálculos" en Encuestas y precios, España, Editorial Síntesis, pp. 73 -98
SEP (1994), Libro para el Maestro. Matemáticas. Educación Secundaria, México.
SEP (2000), Fichero de Actividades Didácticas. Matemáticas. Educación Secundaria, México
ACTIVIDADES SUGERIDAS
1. El profesor organizara al grupo en equipos y les planteara los siguientes problemas:
• El sindicato de empleados de la compañía ERA, ha sometido una propuesta de aumento de salario.
En un estudio realizado en una muestra aleatoria se determinan los siguientes salarios promedios:
Moda $15 400, Media $20 000 Mediana $16 500
a) ¿Cuál promedio usaría el dueño de la compañía para justificar el NO aumentar los sueldos de los
empleados?
b) Si se desea evitar el efecto que tienen valores extremos en el promedio de los salarios de los
empleados de la compañía, ¿cuál de las medidas de tendencia central utilizarías?
Cuando los equipos terminen se organizará una confrontación de resultados y se continuará de la
misma manera con los siguientes problemas:
• Un dueño de un edificio tiene tres departamentos con dos recamaras que se alquilan a $450 por
mes, dos departamentos con una recamara que se alquila a $410 y cuatro departamentos que se
rentan en $350 por mes.
a) Si el dueño anuncia que el número de cuartos promedio de los departamentos es 1, ¿cual promedio
utilizo?
b) Si el dueño anuncia que el precio promedio de los alquileres de los departamentos es $350, ¿cuál
promedio utilizó?
c) ¿Cuál promedio representa mejor el precio promedio de los alquileres?
• Para cada uno de los siguientes casos, indicar cual medida de tendencia central utilizara para
13
describir los datos y ¿por qué?
a) La marca de automóvil de mayor venta en México
b) La estatura promedio de los estudiantes inscritos en la especialidad de Matemáticas.
c) El precio promedio de venta de una casa en México.
d) El refresco preferido por los estudiantes que visitan la cafetería de la escuela
e) El tiempo promedio para llegar a la escuela de los estudiantes de Matemáticas.
f) La edad promedio de las personas que viven en tu localidad.
Después de resolver los problemas, se hará un análisis general apoyándose en las siguientes
preguntas:
• ¿En que medida se favorece la reflexión de los estudiantes con los problemas planteados?
• ¿Qué tipo de información se proporciona a los estudiantes?
• ¿Cuál es la estructura general de los problemas planteados?
1. El profesor organizará al grupo en equipos y les planteara los siguientes problemas: Como
parte de un estudio sobre el salario de los jugadores en una liga de baloncesto profesional, se
recopiló información de un equipo de la liga. Los datos son los siguientes
Miguel $975000 Guillermo $ 310000 B.J. $140000
Horacio $215000 Scott $365000 Tuto $275000
Pepe $125000 Juan $180000 Tato$ 190000
Tito $210000 Tomás $135000 Ko Me $75000
¿Cuál es la medida de tendencia central que mejor representa a el salario de este equipo? ¿Porque?
¿Cuál es el alcance o recorrido de los salarios de los jugadores de este equipo?
3. ¿Cual es la desviación estándar?
Bloque IV. El tratamiento de la información y las funciones
Tasa índices. Crecimiento aritmético y exponencial.
Interpolación y extrapolación.
BIBLIOGRAFÍA BÁSICA
• Johnson R. (1996) "Estadística Descriptiva. Capitulo 1" en Estadística elemental. México, Grupo
Editorial Ibero América, pp.2-20.
Nortes Checa A. (1995) "índices, precios y aplicaciones", en Encuestas y precios, España, Editorial
Síntesis, pp. 133-160
14
• Sanchis C. (1993), "Índices e inferencia estadística: Índices" en Hacer Estadística, México, Biblioteca
de recursos didácticos Alambra pp. 87-96
• Zeisel Hans (1997) "Índices" en Dígalo con números, México, Fondo de Cultura Económica, pp. 98-
124
SEP (1994), Libro para el Maestro. Matemáticas. Educación Secundaria, México.
SEP (2000), Fichero de Actividades Didácticas. Matemáticas. Educación Secundaria, México.
ACTIVIDADES SUGERIDAS
1. Individualmente leerán las páginas 32 a 41 y después se organizara en grupo un análisis de los
siguientes aspectos:
• ¿Cuándo la tasa debe ser un tanto por ciento, por mil y por cien mil?
• La cadena de los tantos por ciento.
2. Organizados en equipos, los estudiantes leerán y comentaran las paginas 133 a 157 del libro de
Nortes. Posteriormente, el profesor planteara la actividad 1 de la página 158.
Cuando los equipos terminen se organizará una confrontación de resultados y se continuará de la
misma manera con los problemas 4, 5 y 6 de la página 159 del mismo libro. Después de resolver los
problemas propuestos se hará un análisis y confrontación de resultados en el grupo.
3. Individualmente, leerán las paginas 98 a 111 del texto de Zeisel. Al terminó de la lectura, el
profesor organizara una discusión con base en las siguientes preguntas:
¿Cuándo hace falta un índice y que propuesto se persigue con tal reducción a un solo número?
Determine a partir de la situación "la calificación olímpica presentada en el texto, ¿Cómo se
determinan los índices?
15
BLOQUE IV. CORRELACIÓN LINEAL
• Datos bivariados.
• Correlación lineal. Regresión lineal.
BIBLIOGRAFÍA BÁSICA
Johnson R. (1996) "Análisis Descriptivo y presentación de datos bivariados. Capitulo 3" en Estadística
elemental. México, Grupo Editorial Ibero América, pp.92-116.
Castillo Juana (1998) "El Modelo de Regresión Lineal" en Estadística Inferencial Básica, México, Grupo
Editorial Ibero América, pp. 410-473
Fernández Lopes Juan "El fracaso escolar en barriadas marginales de Málaga. Un estudio del desfase
cronológico de los alumnos en las barriadas", en Tratamiento de la información UNO Revista de
didáctica de las Matemáticas, España, GRAO, pp. 25-39
Lopes Afonso P. (2000) "Inferencia y decisiones estadísticas: Regresión Lineal y Correlación", en
Probabilidad y Estadística Conceptos, modelos y Aplicaciones en Excel, Colombia, Prentice hall pp.
227-249
ACTIVIDADES SUGERIDAS
1. El profesor organizara al grupo en equipos y les planteara las cuatro situaciones de la página 94 del
texto de Johnson, que analizaran apoyándose en las siguientes preguntas:
• ¿Están relacionadas dos variables?
• ¿Cómo es esa relación?
2. El profesor organizará al grupo en parejas y les planteara el estudio de la página 96 del texto de
Johnson, estimaran el coeficiente de correlación lineal y de la recta de mejor ajuste propuesto en las
páginas 102 y 113, respectivamente. Cuando los equipos terminen se organizará una confrontación de
resultados.
3. Individualmente leerán las paginas 175 a 188 del texto de Zeisel. Al término de la lectura, el
profesor iniciara la discusión planteando la siguiente consigna:
• ¿Cuál es el propósito de la regresión?
• ¿Cómo se construyen falsas inferencias?
• ¿Cuánto explica la regresión?
Es importante que registren en su cuaderno de notas lo que cada uno considere más importante, con
base en la lectura y la discusión.
4. El profesor planteará a los estudiante la siguiente información que corresponde a la página del
INEGI, analizaran el método que utilizan. Es conveniente, de ser posible visitar el sitio de Internet
www.ineqi.qob.mx
16
SELECCIÓN DE VARIABLES A TRAVÉS DE LA TÉCNICA DE COMPONENTES PRINCIPALES
INTRODUCCIÓN
La técnica de componentes principales tiene por objetivo el reducir el número de indicadores en el
análisis de un problema que involucra múltiples variables. Por ejemplo, para el caso que nos ocupa, el
bienestar de las familias y de los hogares mexicanos, se ha sugerido el uso de una gran cantidad de
indicadores asociados con el tema.
A partir de la propuesta de temas relacionados con la educación, la salud, la vivienda, el tamaño de la
familia o la disponibilidad de bienes y servicios para disfrute de sus miembros surgen, a su vez,
propuestas de indicadores numéricos.
Para el primer tema es factible considerar el porcentaje de individuos en una comunidad, entidad o
municipio que saben leer y escribir; el porcentaje de asistencia escolar; el promedio de años cursados
por los miembros de la comunidad; y aun algunos otros. Todos ellos nos dicen algo acerca tanto de la
infraestructura educativa disponible en la comunidad como de las oportunidades que tienen sus
miembros de mejorar sus condiciones de vida gracias a una mayor educación.
Del mismo modo es posible pensar en conjuntos numerosos de indicadores asociados a todos y cada
uno de los temas restantes. De esta forma no es difícil iniciar un estudio sobre el bienestar partiendo
de varias docenas de indicadores. La complejidad del análisis se incrementa a medida que el número
de variables crece cada una de ellas cuenta una parte distinta de la historia aunque pueda parecer que
dos o más "casi" son idénticos y, en consecuencia, nos dicen "casi" lo mismo. Es decir, parece haber
alguna redundancia entre indicadores, y de hecho la hay, pero cada uno de ellos aporta información
no contenida en los demás.
Cuando la complejidad del estudio causada por la presencia de un gran número de variables parece
insalvable, no es extraño intentar priorizar el uso de un subconjunto. De este modo, se deberá ignorar
un buen número de ellas y, en consecuencia, la información adicional que las mismas contienen.
COMPONENTES PRINCIPALES
Sin embargo, la estadística matemática ha propuesto una serie de alternativas de análisis que buscan
ayudar a resolver el conflicto: complejidad en el análisis contra pérdida de información. Entre otras, se
tiene la técnica conocida como Análisis por Componentes Principales.
En términos estadísticos, "casi idénticos" se mide con buena precisión a través del coeficiente de
correlación lineal. Más precisamente, dicho coeficiente mide el grado de redundancia lineal existente
entre dos indicadores. Cuando toma el valor 1, es posible decir que ambos indicadores son
redundantes; lo mismo ocurre cuando su valor es igual a -1, salvo que en este caso ambos
indicadores se comportan en sentidos opuestos. Por el contrario, cuando su valor es cero, se dice que
no existe ninguna asociación lineal entre ambos indicadores.
El coeficiente de correlación lineal, o la medida asociada denominada covarianza, constituye la base
del análisis por componentes principales. A partir de los valores que toman estas medidas de
asociación cuando se consideran todas las parejas de indicadores involucradas en el estudio y de los
valores de estos, es posible definir nuevos indicadores resumen denominados componentes
17
principales.
La primer componente principal es aquel indicador resumen que explica la mayor heterogeneidad
entre los casos; es decir, tiene la mayor varianza. La segunda componente principal es un indicador
resumen que es a la vez el mas heterogéneo después de la primer componente y que no esta
correlacionado con esta. La tercer componente no esta correlacionada ni con la primera ni con la
segunda y tiene la tercer varianza más grande. Las restantes componentes principales cumplen con
condiciones semejantes.
Se tienen dos situaciones extremas muy improbables en la práctica. Cuando las correlaciones entre
todas las parejas de variables son iguales a cero, lo que ocurre cuando no hay redundancia entre
ellas, habrá tantas componentes principales con varianzas distintas de cero como indicadores
originales. Por otro lado, cuando la redundancia es total, sólo la primera componente principal tendrá
una varianza distinta de cero. En el primer caso, la reducción de dimensionalidad se logrará sólo
sacrificando información. En el segundo bastará con realizar el análisis a partir del primer componente
principal.
En otras palabras, el primer componente principal resumirá toda la información sólo en el caso de
redundancia perfecta entre todos los indicadores. En cualquier otra circunstancia se hace
imprescindible considerar algunas más, siempre buscando que la perdida de información sea lo mas
pequeña posible.
Por ello, en nuestro caso, las componentes principales no son el resultado final con base en el cual
llevar a cabo el análisis, sino el recurso estadísticamente riguroso para detectar y seleccionar los
indicadores con mayor capacidad de sintetizar las diferencias habidas entre las observaciones. Una vez
hecha esta selección de indicadores, entra propiamente en juego la metodología de estratificación
multivariada para encontrar los distintos grupos homogéneos de observaciones (Entidades Federativas
o Municipios) que serán clasificados y ordenados jerárquicamente.
VARIABLES UTILIZADAS
1 % de población menor de 15 años
2 % de población residente nacida en otro estado
3 % de población de 5 años y más que en 1995 residía en otro estado
4 % de población de 6 a 14 años alfabeta
5 % de población de 15 años y más alfabeta
6 % de población de 6 a 11 años que asiste a la escuela
7 % de población de 12 a 14 años que asiste a la escuela
8 % de población de 15 a 19 años que asiste a la escuela
9 Escolaridad promedio
10 Promedio de hijos nacidos vivos de mujeres de 12 años y más
11 Promedio de hijos nacidos vivos de mujeres de 12 a 19 años
12 % de población económicamente activa
13 % de población ocupada que son trabajadores en servicios públicos
14 % de población ocupada que son comerciantes o dependientes
15 % de población ocupada que trabaja menos de 24 horas a la semana
18
16 % de viviendas con piso de tierra
17 Cuartos por vivienda
18 % de viviendas con drenaje
19 % de viviendas con agua entubada
20 % de viviendas con electricidad
21 Promedio de hijos nacidos vivos de mujeres de 12 a 29 años
22 Factor de dependencia
23 % de población rural
24 % de población urbana
25 % de población con postprimaria
26 % de población ocupada en el sector primario
19
MATERIAL
DE
APOYO
LA PRESENTACION DE LOS NUMEROS___________________________________________
20
BLOQUE I
CONCEPTOS
ESTADISTICOS E
INSTRUMENTOS DE
RECOLECCION DE
DATOS
GRÁFICAS
En este libro utilizo muy pocas gráficas. Casi
todos los números los presento en cuadros, de
modo que sea fácil leerlos. Esto obedece a que
uno de los objetivos del libro es instruir al
lector sobre la manera adecuada de
confeccionar cuadros estadísticos.
Lo más común es que los cuadros estadísticos
se los muestren a personas que no son
expertas en interpretarlos ni están ansiosas de
leerlos. De ahí que transformar los números en
gráficas no sea sino un paso más en la tarea
de esclarecer relaciones numéricas. Par si fuera
poco, con este paso se convierte en un placer
lo que las más de las veces es un tormento.
Día con día crece el volumen de la bibliografía
que trata del cómo hacer gráficas y de que
manera no hacerlas. Con la popularización de
las computadoras, se ha incrementado esta
tendencia.
Las secciones siguientes se insertan en esa
propensión, e ilustran tres clases de gráficas:
las que agregan información a una estructura
de suyo simple; las que hacen
que se destaquen, de un vistazo, relaciones
que los números, por si solos, únicamente
revelarían al ojo experto; y las elaboradas por
maestros.
LOS CUADROS COMO GRÁFICAS
Por regla general, un cuadro estadístico que
contiene mucha información es más difícil de
leer que otro que contenga poca. Hay
ocasiones, sin embargo, en que agregándole
información a un cuadro se mejora su
legibilidad. Considérese un cuadro que muestre
cual es la posición que mantiene cada una de
las 50 entidades federativas de los Estados
Unidos con respecto a la pena de muerte: en
13 de ellas no la hay; en 26 si la hay pero en
ninguna de ellas ha sido ejecutado nadie
durante los últimos 30 años; en 11 estados sí
ha habido ejecuciones. Haciendo una lista de
los nombres de estos estados, y concediéndole
a cada uno de ellos igual espacio, se facilitara
la lectura, gracias a la gráfica de barras que
abran formado tales listas (véase cuadro
11.10).
Oportunidad semejante es la que se da cuando
LA PRESENTACION DE LOS NUMEROS
LA PRESENTACION DE LOS NUMEROS___________________________________________
21
los números de un cuadro estadístico denotan
unidades que se describen al detalle en otra
parte. A veces, por ejemplo, es deseable
relacionar un cuadro, estadístico con cada uno
de los casos de que se compone.
CUADRO 11-10. La pena de muerte en los 50
estados de los Estados Unidos
La gráfica 11.1, formada de un estudio de
procedimientos legales del fuero criminal,
desempeña esta doble función. Resume la
relación que hay entre la severidad de la
sentencia impuesta al acusado después de
haber sido convicto y sus antecedentes
delictivos.
El cuadro representa gráficamente las
frecuencias respectivas
mediante el número de cuadrados dentro de
cada celda. Además, todos los casos llevan su
número para que el analista los localice
fácilmente en caso de que desee estudiarlos en
detalle.
CÁLCULOS DE UN VISTAZO
Hay ciertos números, como la media
ponderada, cuya deducción es difícil de
comunicar mediante un cuadro estadístico,
porque se requiere una serie de
multiplicaciones o divisiones. Con una gráfica,
como la de la figura 11.2, se resolverá
cómodamente el problema.
El cuadro estadística que contuviera las cuatro
tasas de detenciones plantearía un acertijo que
la gráfica soluciona sin mayor trámite: la tasa
media de arrestos correspondiente a todos los
delitos es tan baja como aparece porque los
delitos no violentos contra la propiedad
LA PRESENTACION DE LOS NUMEROS___________________________________________
22
constituyen la porción mayoritaria de las
detenciones.
Gráfica 11.2. Tasa de detenciones por delitos
denunciados a al policía.
LA "GESTALT"
Ciertas configuraciones se revelan a si mismas
sólo cuando se ven en su totalidad. Dada la
oportunidad, percibimos su estructura en un
instante. En la figura 11.3 se compara el
crecimiento del índice de homicidios en los
estados donde se han efectuado ejecuciones
por asesinato, con el mismo índice pero de los
estados en que no tienen pena de muerte o,
aunque la tienen, no han ejecutado a nadie en
el mismo periodo.
La gráfica comunica vividamente información
que seria muy difícil extraer de un cuadro
estadístico: en primer lugar, que los índices de
homicidios variaron considerablemente durante
esos años y, en segundo lugar, que el
crecimiento de ambos mostró un misterioso
paralelismo. De esta doble información
resultan estas reveladoras reflexiones: 1) que
hay en la sociedad poderosas fuerzas que
hacen ascender y descender el índice de
homicidios de una manera clara y
determinada; 2) que estas fuerzas, a juzgar
por el paralelismo de las dos curvas, son las
mismas en todos los Estados Unidos, y que el
freno que constituiría la amenaza de una
posible ejecución no cuenta entre esas fuerzas;
y
* Gestalt, en alemán "estructura" o "configuración",
se refiere a un todo integrado, que, por consiguiente,
es algo más que la mera suma de sus partes. (T.)
* Estados donde fue abolida la pena de muerte y
estados donde no se han efectuado ejecuciones
desde 1948. FUENTE: FBI Uniform Crime Reports.
GRAFICA 11.3. Tasas de homicidios, 1960-1969, en
estados con y sin ejecuciones.
3) que la virtud disuasiva de las ejecuciones,
en caso de que exista, debe ser tan pequeña
LA PRESENTACION DE LOS NUMEROS___________________________________________
23
que es prácticamente invisible
UNA IMAGEN VALE LO QUE MIL NÚMEROS
En Viena, uno de mis profesores fue el gran
Otto Neurath físico, sociólogo, filósofo,
reformador, quien luchó apasionadamente por
la presentación pictórica de la información
estadística, como parte de su búsqueda de un
lenguaje que fuera entendido universalmente.
Ahora vemos sus inicios en los aeroplanos y los
aeropuertos de todo el globo terráqueo.
Neurath enriqueció enormemente el arte de las
gráficas estadísticas con su aplicación creadora
de un imperativo fundamental: transformar
tanto las palabras como los números de un
cuadro estadístico en dibujos o pictogramas,
como él los llamaba, que fueran tan fáciles de
percibir como de entender. Cuando la leyenda
de un cuadro se refería a una distribución
geográfica, un mapa simplificado servía de
ilustración de fondo. Mostraba los objetos
contados de modo que se percibieran al
instante su sustancia y su frecuencia. Cada
símbolo pictórico representaba un número
redondo de unidades y su disposición facilitaba
la multiplicación que llevaba al número total.
En consecuencia, las palabras y los números se
relegan a posiciones subordinadas. Las gráficas
11.4 y 11.5 son dos de sus muchas e
ingeniosas gráficas.
5Tomado de Hans Zeisel, The Limits of Law
Enforcement (Chicago: The University of Chicago
Press, 1983), p. 61.
La gráfica 11.4 ilustra con claridad sus dos
ideas: la configuración como en pendiente es la
distribución del ingreso, respecto a la cual se
muestran los diferentes lugares ocupados por
los blancos y los negros. Los símbolos nos
recuerdan que estamos tratando de seres
humanos y no sólo de dólares. La grafica 11.5
describe una dramática correlación que por
fortuna ya pertenece a la historia. Por último,
las gráficas 11.6 y 11.7 se ocupan de la
seguridad: la primera de la seguridad en las
carreteras; la segunda, de la seguridad de
nuestro planeta. La ley, y nosotros también,
habla de cosas seguras y de cosas inseguras
como si hubiera una frontera natural entre
ellas. En la grafica 11.6 se trata de hacer ver
que la seguridad es más bien cosa de grado,
que puede incrementarse tomando las medidas
adecuadas. La grafica 11.7 nos permite
comprender de una ojeada un problema que,
según la mayoría de nosotros, es demasiado
complejo. Relacionando visualmente la
cantidad de armamento atómico almacenada
hoy en el mundo con ciertas referencias de
conocimiento común, comprendernos de
inmediato la gravedad de la situación. Quizá
sea ésta la gráfica más importante que jamás
se haya hecho.
RESUMEN
Una presentación descuidada suele arruinar la
función esclarecedora de las cifras de tanto por
ciento. Los tantos por ciento de más de dos
cifras y demasiados decimales son difíciles de
leer. Hay razones especiales que a veces son
superiores a los tantos por ciento ordinarios.
6Tomado de Otto Neurath, Modern Man in the Making
(Nueva York: Alfred Knopf, 1939).
• Pero todavía no a la historia del llamado Tercer
Mundo. [T.]
LA PRESENTACION DE LOS NUMEROS___________________________________________
24
Cuando los números originales acompañan a
los tantos por ciento, tienden a interferirse
mutuamente. Sirven de ayuda los recursos
tipográficos. La transformación a formas
gráficas es siempre atrayente, a menudo
esencial, y probablemente el estilo del futuro.
La potencia de fuego actual (1983), en todo el
mundo, en contraste con la correspondiente a
la segunda Guerra Mundial. El punto del centro
representa la potencia de fuego total de la
segunda Guerra Mundial: 3 megatones. Los
puntos restantes representan la potencia de
fuego de todas las armas nucleares que hoy
existen en el mundo. Este potencial equivale a
6 000 veces el de la segunda Guerra Mundial,
esto es, 18 000 megatones. Los Estados
Unidos y la Unión Soviética comparten, más o
menos equitativamente, esta potencia
destructiva.
El circulo superior izquierdo, que abarca 9
LA PRESENTACION DE LOS NUMEROS___________________________________________
25
megatones, representa el armamento de que
esta dotado un solo submarino Poseidón, que
equivale a tres veces la potencia de fuego de la
segunda Guerra Mundial y basta para destruir
más de 200 de las ciudades soviéticas más
grandes. Los Estados Unidos poseen 31
submarinos de esta clase, aparte de 10
submarinos Polaris, armados de manera
similar.
El círculo que esta dentro del cuadrado inferior
izquierdo, que abarca 24 megatones,
representa uno de los nuevos submarinos Tri-
dente, cuya potencia de fuego es ocho veces la
de la Segunda Guerra Mundial, suficiente para
destruir todas las ciudades principales del
hemisferio norte.
La Unión Soviética posee niveles equivalentes
de capacidad destructiva.
Tan solo dos de los cuadrados de esta figura
(300 megatones) representan una potencia de
fuego capaz de destruir todas las ciudades de
tamaños grande y mediano del mundo entero.
(Un comité del Senado de Estados Unidos
revisó esta gráfica y todos sus miembros
coincidieron en que se trataba de una
representación fiel del arsenal nuclear del
planeta.)
Los índices que se basan por entero o incluso
solo parcialmente en juicios tienen poca
durabilidad. Imposible comparar a las reinas de
belleza resultantes de diferentes concursos sin
hacer un nuevo concurso. Por regla general,
tampoco se puede comparar a clavadistas o
gimnastas de diferentes competencias, a no
ser que en todas ellas funjan los mismos
jueces. Sólo en los casos extremos es posible
hacer una inferencia de superioridad. Cuando
Nadia Comaneci, la joven gimnasta rumana,
ganó una calificación perfecta, no alcanzada
nunca antes por ningún otro gimnasta, fue
proclamada la mejor de todos los tiempos.
Pero, como posteriormente otros gimnastas
obtuvieron también puntuaciones perfectas, el
problema persiste.
En ciertas instituciones, a veces es posible
hacer comparaciones en las que entra en juego
el paso del tiempo. Es factible comparar a los
estudiantes calificados en determinado año por
sus profesores con los estudiantes de años
anteriores, con tal de que no hayan cambiado
mientras tanto ni las normas de calificación ni
los profesores.
LA PRESENTACION DE LOS NUMEROS___________________________________________
26
PROMEDIOS COMPLEJOS
Regresemos al índice de precios al consumidor
o índice del costo de la vida, que se basa en
datos perfectamente objetivos y que, por lo
mismo, sigue siendo comparable en términos
generales a pesar del paso del tiempo. El
propósito de este índice es el de reflejar los
cambios promedio de precios de la "canasta
básica" los bienes y servicios de primera
necesidad para una familia.
Hay desde luego dificultades conceptuales en
la definición de "la familia", pues no es creíble
que haya dos familias que compren los mismos
bienes y servicios exactamente en las mismas
proporciones. Se allana en parte la dificultad
definiendo a la familia como el promedio de la
categoría, más homogénea, de todas las
familias donde hay asalariados, en vez de
todas las familias en general.
El cómputo esquemático no real de la figura
V1.1 describe el fundamento de la definición de
este índice.
La parte que en el presupuesto familiar
representa cada una de sus categorías
principales alimentación, vivienda, médico, etc.
se determina estudiando los gastos de las
familias de
GRÁFICA V.I.I. Estructura esquemática del índice de
precios al consumidor
VI. INDICES
Se estudiaron en el capítulo anterior varias
maneras de representar una columna de
números con una cifra: el índice que simboliza
la columna. En este capitulo se amplia el
estudio de los índices, considerando su
variedad y funciones así como algunos de los
problemas que aparecen al construirlos.
Le llamaremos índice al número ideado para
medir un concepto multifacético. Por ejemplo,
los cambios del costo de la vida se miden por
el índice de precios al consumidor; el estado de
salud de una comunidad se puede valuar por
su tasa de mortalidad infantil; la belleza de
una muchacha se determina por el lugar que le
conceden los jueces en un concurso; y la
inteligencia de un estudiante por su CI, etc. En
cada uno de estos casos, se valora con un solo
numero un concepto relativamente complejo.
La complejidad que el índice trata de resumir
tal vez provenga de la multitud de sus
unidades, como sucede con los índices de
precios del consumidor, o de las muchas
dimensiones de una sola unidad, como en los
concursos de belleza.
¿Cuándo hace falta un índice y que propósito
se persigue con tal reducción a un solo
número? ¿Que no basta, se pregunta uno, con
decir, en un concurso de belleza, que la
muchacha X tiene las piernas más bonitas y la
Y la cara más hermosa? ¿Que necesidad hay
de resumir en un solo número los cambios de
precio de los alimentos, la vivienda y el
transporte? Son varias las respuestas. En
primer lugar, esta clase de número nos
informa sobre como cambia el valor real de
nuestra moneda. Y tal número hace falta, por
ejemplo, para ajustar las cuotas del seguro de
desempleo e incluso los salarios pagados por
algunas industrias.
Los índices se construyen por métodos de
durabilidad y complejidad variables. La
LA PRESENTACION DE LOS NUMEROS___________________________________________
27
clasificación de las participantes en un
concurso de belleza es asunto singular, de una
sola vez; el índice de precios al consumidor
esta planeado para durar largo tiempo.
Y, como veremos, la complejidad de un índice
puede variar desde el simple promedio hasta
intrincadas estructuras matemáticas.
INDICES DE JUICIO
La mayoría de los índices se funda en
mediciones objetivas. Algunos se derivan de
juicios subjetivos y otros de una combinación
de juicio y medición.
El índice de un concurso de belleza no puede
ser otro que el lugar promedio que acuerdan
otorgar los jueces a cada participante. En los
concursos más serios de perros o caballos, se
les proporciona a los jueces una guía que los
orienta sobre la manera de desempeñar su
función.
En muchas clases de competencias deportivas
los índices salen sobrando porque lo que en
ellas cuenta es una sola dimensión: gana el
que corre más rápido o el que salta más alto.
En otras competencias, como las de clavados,
el patinaje o el salto con esquíes, sí hacen falta
índices, pues en ellas se juzga más de una
dimensión. En el salto con esquíes, pongamos
por caso, se juzga tanto la longitud del salto
como el estilo.
1 Quetelet, previendo que algún día se medirían
fenómenos psicológicos y estéticos, escribió en
1835: "En este respecto, los criterios
psicológicos...no difieren demasiado de las
propiedades físicas: se puede estimar su magnitud,
siempre y cuando guarden alguna relation con los
efectos que producen" (Essai de Physique Sociale.
Paris, Bachelier, 1835, vol. 2, p. 98). 98
Veamos algunos de los detalles del índice que
se aplica a la calificación de clavados,
compuesto tanto de elementos objetivos como
subjetivos. La parte objetiva de este índice es
el grado de dificultad del clavado de que se
trate. Se reconocen actualmente 72 elevados
básicos, para los cuales un comité
internacional de expertos estableció valores de
dificultad que varían de 1.0 para el más
sencillo hasta 3.5 para el más difícil.
La dimensión subjetiva de la calificación final
se refiere al grado de perfección con que se
ejecuta el clavado. La establece un grupo de
jueces expertos, cada uno de los cuales decide
con arreglo a una escala de 1 a 10 y en donde
este último número representa la perfección.
Tratando de anular los efectos del prejuicio, se
eliminan, de las calificaciones que dan los
jueces, la mas baja y la mas alta, y
seguidamente se multiplica el promedio de las
calificaciones restantes por el grado de
dificultad del clavado, Cuando cada competidor
tiene que ejecutar varios clavados, su
puntuación final es la suma de las diferentes
calificaciones que obtiene en cada ejecución.
Obsérvese en el cuadro VI.1 como se
determina el índice de ejecución de cierto
clavadista en una competencia de cuatro
clavados.
la muestra. Luego se seleccionan ciertos bienes
y servicios para que representen a las
categorías y subcategorías más amplias. Así, el
precio de un pollo y el de un kilogramo de
bísteces de lomo representarían el precio de la
carne, y el del pasaje del autobús de servicio
urbano y el del lavado de un traje, el precio de
los servicios. Los precios se combinan, pues,
para constituir los subíndices de alimentación,
vivienda y servicios y, por último, el índice
global.
El índice del costo de la vida es, por
consiguiente, el promedio ponderado de
LA PRESENTACION DE LOS NUMEROS___________________________________________
28
muchos cambios de precios, cuyos pesos se
determinan por la proporción relativa de la
categoría presupuestaria a la que tales precios
representan.
OBJETO Y FÓRMULA DEL ÍNDICE
Es posible, como hemos visto, definir y
determinar con claridad el índice del costo de
la vida. En cuanto a otros índices, no es tan
sencillo transitar paso a paso el camino que va
desde el concepto a la realización. Considérese
el trabajo de construir un índice de "felicidad
conyugal". La tarea empezara en el momento
en que tratemos de explicar lo que queremos
decir con felicidad conyugal o, mas todavía,
como la reconoceremos. Quizá con la ayuda de
un consejero matrimonial logremos hacer una
lista de criterios que nos permitan distinguir
matrimonios felices de infelices. En un buen
matrimonio, decidiremos, los esposos pasan
mucho tiempo junto, conversan largamente,
celebran su aniversario de boda y se escriben
el uno al otro cuando están alejados. En un
mal matrimonio hay pleitos, infidelidad y otras
experiencias desagradables. Luego se
formalizaran estos criterios y se les asignaran
valores positivos y negativos:
a sobre las complejidades de detalle que
ofrecen estas operaciones véase, por ejemplo,
The Price Statistics of the Federal Government
(informe del Price Statistics Review
Committee; presidente, George J. Stigler),
Joint Economic Committee Hearings, U. S.
Congress, 24 de enero de 1961.
Si se considera que cierto criterio, por ejemplo
el de los pleitos, es indicador más significativo
que cualquier otro, o si surge como tai después
del análisis pertinente, se le asignara un valor
más alto:
En su forma más rudimentaria, el índice de
felicidad será el promedio de tales
puntuaciones. Considérese un índice que
pretenda medir el nivel de salarios
prevaleciente, término que, a menos que se
defina con claridad absoluta, invita al mal uso.
En el cuadro VI.2 se comparan los "niveles de
salarios" en dos años diferentes, y se obtienen
cuatro respuestas diferentes, que varían según
la manera como se defina dicho nivel (los
datos son hipotéticos).
El salario por hora subió 25%. El salario por
día permaneció inalterado porque -nos vemos
obligados a sacar en conclusión incremento de
la tarifa por hora lo compenso la reducción de
las horas de trabajo diarias. Las percepciones
anuales en dólares cayeron en 10% porque
disminuyo en la misma proporción el número
de días laborados. Por último, en cuanto a
poder adquisitivo, el nivel de salarios decreció
en 9% más por causa de la inflación.
CUADRO V1.2. "Niveles de salarios" en 1919 y
1927 *
LA PRESENTACION DE LOS NUMEROS___________________________________________
29
Segun Willford I. King, Index Numbers
Elucidated (Nueva York: Longmans, 1930), p.
29.
Mientras tanto, los precios se incrementaron
10%.
El cuadro VI.3 muestra una trampa aun más
complicada y también consecuencia de la
imprecisa definición de nivel de salarios.
CUADRO VI.3. "Niveles de salarios" en dos
campos de trabajo *
* Adaptado de Franz Zizek, Statistical
Averages (Nueva York: H. Holt, 1913), p. 35.
El salario diario lo mismo de los hombres que
de las mujeres que laboran en el campo A es
25% superior al del campo B. Sin embargo, el
salario diario promedio para todos los
trabajadores, independientemente de su sexo,
es inferior en el campo A comparado con el B.
Esta contradicción propone de la mayor pro-
porción de mujeres que hay en el campo de
trabajo B y del hecho de que el salario de las
mujeres es mucho menor que el de los
hombres recuérdese que se trata del año de
1912. Todas las contradicciones desaparecen
una vez que se definen con precisión las
denominaciones.
3Según Ernest W. Burgess y Leonard S. Cottrell, Jr.,
Predicting Success or Failure in Marriage (Englewood
Cliffs, N. J.: Prentice-Hall, 1939).
EFECTO DE “ENVEJECIMIENTO”
Una de las comparaciones que se hacen más a
menudo es la de cómo difieren entre si
personas de edades diferentes. Observada al
detalle, se aprecia lo compleja que es la
sustancia de esta clase de comparación, al
parecer sencilla. Se aclarara el problema con la
ayuda de un diagrama hipotético (gráfica
VI.2), en el cual se comparan dos grupos de
edad, el de personas que están en la tercera
década de su vida (entre los 20 y los 29 años)
y el de quienes están en su cuarta década
GRAFICA VI.2. Proporción de personas que practican
deportes (Dos conceptos de envejecimiento)
(de los 30 a los 39 años). Deseamos encontrar
que efecto tiene el envejecimiento sobre la
proporción de personas de cada grupo que
practican deportes. Se hacen dos veces las
comparaciones, en 1970 y en 1980, en un in-
tervalo de 10 años.
El efecto del envejecimiento se deduce,
normalmente, comparando el grupo 1 con el
grupo 2, que, en promedio, es de sujetos 10
LA PRESENTACION DE LOS NUMEROS___________________________________________
30
años mayores. La diferencia, que es un
descenso de 20 puntos de porcentaje, o la
mitad de todos los que a los veintitantos años
jugaban algún deporte, se atribuye al
envejecimiento.
Pero el efecto preciso del envejecimiento
depende de la época en la cual se registre el
incremento de la edad, lo que a menudo se
llama el efecto de la generación. La mejor
manera de medir este efecto consiste en
comparar el grupo 1 con el 3, y el grupo 2 con
el 4. La comparación muestra que, en el lapso
de una década, la práctica de deportes se
elevó del 40 al 70% entre personas de 20 a 30
años, y del 20 al 30% entre sujetos de 30 a 40
años.
Gracias a la gráfica VI.2 percibimos también el
efecto combinado de envejecer y de pertenecer
a otra generación. Se obtiene esta medida
comparando el grupo 1 con el 4, pues el grupo
1 de 1970 es, diez años más tarde, en 1980, el
grupo 4. Tal efecto combinado se manifiesta
como un descenso de 10 puntos porcentuales,
del 40 al 30%. Las matemáticas respectivas
son las que siguen:
INDICES DE BEISBOL
Hay ocasiones en que se mide un objeto por
varios índices, cada uno de los cuales
determina un aspecto diferente. Los tres
índices principales ideados para medir el
rendimiento del bateo de los jugadores de
béisbol el promedio de bateo, el bateo efectivo
y el número de carreras "empujadas"- son
ejemplos que vienen al caso.
Pegar de hit, es decir, pegarle tan a menudo y
tan eficazmente como se pueda a la bola
lanzada por el pitcher, e impedir que el equipo
contrario haga lo mismo, es la clave para
ganar en el béisbol. Los hits hacen que los
jugadores lleguen a una o más bases. Hits
posteriores le permiten al jugador "embasado"
completar el circuito de cuatro bases y anotar
carrera. El número de carreras hechas por
cada equipo decide cual es el ganador.
El promedio de bateo (PB) es el índice más
conocido y de más amplio uso del rendimiento
del bateo de un jugador dado:
El promedio de bateo mide el rendimiento del
bateo de un jugador por la frecuencia relativa
con que "pega de hit", lo cual no equivale
forzosamente a la frecuencia con que llega a
una de las bases "se embasa". Pues a lo mejor
se embasa no por haber pegado hit sino por
error del otro equipo. Esta jugada cuenta como
"ir al bat" pero no como hit, y por eso aumenta
el denominador del PB pero no el numerador.
Si el jugador se embasa por haber recibido
base por bolas, esto es, porque el pitcher le
hizo cuatro lanzamientos malos, o bolas; o
bien si una de las pitchadas fue de tan mala
puntería que golpeo al bateador, gracias a lo
cual tuvo derecho a ocupar la primera base
(pues ser golpeado equivale a recibir base por
bolas), el suceso no entra ni en el numerador
ni en el denominador. Se actúa así en este
caso partiendo de la idea de que en las
condiciones descritas no se pone a prueba la
habilidad del jugador para batear. Por la
misma razón, el promedio de bateo no es
afectado por el "toque de sacrificio", jugada en
la que el bateador toca levemente la pelota y
las más de las veces es hecho aut, pero hace
avanzar al compañero embasado.
. El promedio de bateo no es una medida
completa del rendimiento de un bateador, ya
LA PRESENTACION DE LOS NUMEROS___________________________________________
31
que no incorpora las otras dos dimensiones del
batear: la calidad y la oportunidad de los hits
"conectados". Se mide la calidad por el número
de bases que logra recorrer el bateador antes
de verse obligado a detenerse. Cuando solo
llega a la primera base, no cubre más que la
cuarta parte del recorrido total; si logra
alcanzar la segunda base por haber enviado la
pelota cerca del otro extremo del campo, estar
a medio camino de llegar a home, lugar donde
culmina su recorrido y anota carrera; y así
sucesivamente. Lo que se conoce como
promedio de bateo efectivo mide así la
frecuencia como la de los hits
En la gráfica VI.4 se comparan los promedios
de bateo y de bateo efectivo de tres jugadores
hipotéticos.
CUADRO VIA Bateo y bateo efectivo
Los jugadores A y B tienen el mismo promedio
de bateo, pero A posee mayor promedio de
bateo efectivo. Los jugadores B y C tienen
igual promedio de bateo efectivo, pero B tiene
el promedio de bateo más alto.
La oportunidad de un hit se mide por otro
índice de bateo más: el de número de carreras
empujadas (CE). Registra el número de
carreras anotadas por sus compañeros de
equipo gracias a los hits que pego cuando
aquellos estaban embasados.
Es instructivo considerar los meritos relativos
de estos tres índices. El de bateo efectivo es el
más amplio de los tres. Cuando los dirigentes
de un equipo se ponen a considerar cuanto
deberán pagarle a cierto jugador, toman como
referencia este índice.
El promedio de bateo registra la frecuencia
pero no la calidad del pegar de hits. Aun a así
están en su cuarta década sí, tiene una ventaja
sobre los otros dos es fácil entender por que
sus matemáticas son sencillas. Cuando pasa a
batear determinado jugador, y además de su
nombre se anuncia que su promedio de bateo
es de, digamos, "0.330", todos los
espectadores entienden el significado de este
número: la probabilidad de que pegue hit en
esta oportunidad es de 1 a 3. No hay manera
de traducir con tanta sencillez el promedio de
bateo efectivo a probabilidades. Por otra parte,
en todo juego de béisbol hay muchos
momentos en que el interrogante decisivo no
es el de si el jugador pegara un buen hit sino
simplemente la de si lo pegara o no.
El índice de carreras empujadas mide una
dimensión que pasan por alto los índices de
"bateo" y de "bateo" efectivo. No todo hit
termina con la anotación de una carrera. Con
mucha frecuencia, al final de una entrada
(turno de batear de cada equipo), quedan
corredores en base, indicación de que no todos
los hits se aprovechan. Ser capaz de pegar hit
en el momento conveniente, cuando haya
jugadores en base que puedan llegar a home,
es en un beisbolista cualidad muy apreciada. El
índice de carreras empujadas mide esta
cualidad, sólo que de modo imperfecto. En
primer lugar, porque no se relaciona con la
frecuencia con que batea el jugador. De ahí
que se incremente con el progreso de la
temporada de juegos. En segundo lugar,
resulta afectado por el orden en que batea el
jugador. Cuando lo hace después de buenos
bateadores, que llegan a ocupar las bases con
más frecuencia que sus otros compañeros, su
probabilidad de empujar carrera es mayor que
la de otros jugadores que acaso sean tan
buenos como él.
Aun tornados en conjunto, estos tres índices de
LA PRESENTACION DE LOS NUMEROS___________________________________________
32
bateo no abarcan la capacidad ofensiva total
de un jugador, pues no consideran ni su
destreza para "tocar la pelota" ni su habilidad
para "robar bases". Tal medida global seria,
sugieren algunos, el "índice de anotación", o
probabilidad (medida par el rendimiento
anterior) de que el jugador ocupe una base,
multiplicada por la probabilidad de que llegue a
home. Tendría este índice otra ventaja: la de
servir de fundamento de un índice de equipo,
pues permitiría promediar las puntuaciones de
cada uno de los jugadores. Y como cada
jugador debe saber también jugar a la
defensiva, cuando está bateando el equipo
contrario, para completar el cuadro deberá
haber igualmente índices adecuados de
defensa.
Los índices de bateo suscitan una duda más. A
veces, alguien trata de comparar el
rendimiento de los beisbolistas legendarios con
el de los contemporáneos. Esto plantea el
problema de si el paso del tiempo afecta o no
la estabilidad de los índices. Tal estabilidad se
ve desde luego amenazada, porque de tiempo
en tiempo se han hecho cambios que han
facilitado o dificultado el pegar hits: cambios
de las características de la pelota; prohibición
de que el pitcher "escupa" la pelota para que,
al lanzarla, ésta describa una trayectoria
peculiar; uso de mejores guantes y terrenos
más lisos, ambos factores a favor del trabajo
de los "jardineros", o encargados de capturar
la pelota en las profundidades del campo;
modificaciones de las reglas de "pitcheo", etc.
4 Véase Earnshaw Cook y Wendell L. Garner,
Percentage Baseball (Cambridge, Mass.: MIT, 1964),
cap. 2.
Se han hecho diversas propuestas para
corregir y ajustar el promedio respecto a tales
cambios, por ejemplo medir el rendimiento del
jugador por la razón de su promedio de bateo
anual al promedio de todos los promedios de
bateo registrados durante ese año. El promedio
de la carrera toda de un jugador seria entonces
el promedio de 'codas sus razones anuales.
Conforme a tal medida, Ty Cobb encabeza a
los grandes de todos los tiempos con una razón
índice de ±102%. Y con +96%,5 lo sigue "No
lo digas “Sin zapato” Jackson, el desafortunado
jugador cuyos registros fueron borrados por su
participación en el escándalo de los Medias
Negras, en 1919.
LA CALIFICACION OLÍMPICA
Para rematar nuestra revisión de los índices
que se emplean en los deportes, demos un
vistazo a la peculiar construcción de la medida
que sirve para decidir quiénes son los
ganadores del decatlón olímpico. En cada una
de sus diez disciplinas, la ejecución se mide
con precisión en centímetros o en fracciones de
segundo, según la prueba de que se trate.
¿Pero como se combinan unas con otras las
mediciones de centímetros y segundos, o la
puntuación del salto de longitud con la del
salto de altura, las cuales se miden en
centímetros? ¿Y cómo se decide quién gana, si
A o si B, en caso de que A salte más alto que B
pero B corra más rápidamente que A?
Un sistema justo debe asignar, en cada
disciplina, el mismo numero de puntos a
ejecuciones que sean de dificultad o excelencia
comparables. En el cuadro VI.5 hay una lista
de ejecuciones equivalentes en diez disciplinas.
5Véase Reed Browning, "These Numbers Don't Lie",
Sports Illustrated, 7 de abril de 1980, pp. 70 ss.
LA PRESENTACION DE LOS NUMEROS___________________________________________
33
Cuadro V.I.5. Calificaciones equivalentes de las diez
disciplinas
Estas ejecuciones fueron calificadas con 800,
900 y 1000, respectivamente (se omitieron las
calificaciones intermedias).
En cada disciplina, el intervalo de ejecución
que va de 800 a 900 puntos es mayor que el
intervalo que va de 900 a 1000. En la carrera
de 100 metros pianos, por ejemplo, los dos son
de 0.4 y 0.3 de segundo. Esto refleja el hecho
de que ganar un décimo de segundo se hace
cada vez más difícil cuando se alcanza el nivel
de ejecución máximo.
¿Cómo se determinan estos puntos de igualdad
entre disciplinas? Se empieza, en el ámbito de
cada disciplina, por recopilar muestras de las
actuaciones de atletas competentes, definidos,
por ejemplo, como atletas que han participado
en un número suficientemente grande de
competencias internacionales de alto nivel. Es
probable que estas ejecuciones den lugar a
distribuciones que se aproximen a la curva
normal, con forma de campaña. Tal
distribución posee dos dimensiones básicas: la
media y la desviación estándar. Esta última es
la distancia que hay de la media al punto en
donde la curva cambia de inflexión, como lo
muestra el cuadro V1.3.
Grafica V.I.3 Las medidas estándar de la distribución
normal de los 100 m planos y el salto de longitud
En la parte inferior de la gráfica, los niveles de
ejecución de la carrera de 100 metros y del
salto de longitud ocupan las posiciones que les
corresponden en sus respectivas distribuciones
normales. Cada una de las medidas de
ejecución yuxtapuestas, de las dos disciplinas,
son equivalentes, es decir, que deben ser y son
calificadas con el mismo número de puntos,
porque ambas ejecuciones tienen el mismo
grado de "dificultad" en sus distribuciones
respectivas.
PORCENTAJES QUE SE RELACIONAN
MUTUAMENTE
El ejemplo siguiente, tornado del campo de la
investigación de número de lectores, contiene
LA PRESENTACION DE LOS NUMEROS___________________________________________
34
un conjunto de índices, muy simples, que,
cuando se relacionan convenientemente unos
con otros, abarcan un sistema conceptual
amplio.
De tres conjuntos básicos de datos se extraen
fracciones que miden aspectos editoriales
relevante los artículos que ofrecen los medios
de difusión impresos. Se elaboraron estos
datos con el fin de que los directores de
publicaciones valoraran la calidad de sus
productos y advirtieran las razones de que
algunos de ellos gozaran de más aceptación
que otros. A los miembros de una muestra de
1 000 lectores de cierta revista, se les hicieron
las siguientes preguntas:
(A) ¿Vio usted este articulo?
En caso de respuesta positiva a A: (B)
¿Empezó usted a leerlo?
En caso de respuesta positiva a B: (C)
¿Terminó usted de leerlo?
De cada artículo, se obtuvo un conjunto de
porcentajes básicos, como a manera de
ejemplo se muestra en el cuadro VI.6.
6 Se elaboró originalmente para la desaparecida
revista This Week. (Ma-
Estas respuestas tienen coincidencias parciales.
Los 200 que terminaron de leer el artículo MM
forman parte de los 800 que empezaron a
leerlo; y a su vez estos 800 son parte de los
900 que vieron el artículo.
De estas tres medidas, se pueden elaborar
cuatro índices de lectura, los cuales informan
sobre el fracaso y el éxito relativos del artículo,
así como, pasta cierto punto, la razón de una u
otra cosa
Lectura completa: razón C/T
La proporción de todos los lectores de- revistas
que terminaron de leer el artículo. Ésta es la
medida de ejecución total. No es lo que nos
dice cual fue la causa de que el artículo "se
hubiera desempeñado" bien o deficientemente.
Tal información la dan los tres índices
siguientes. Para el artículo MM, este índice fue
de 0.20.
Valor de la atención: promedio A/T
La proporción de lectores que notó el artículo
al hojear la revista o, más exactamente,
quienes recordaron haberlo visto. Se
consideraría este índice como la medida de
todos los factores que explican come fue
atraída la atención inicial' del lector, entre ellos
la posición del articulo en la revista, el tamaño
del titulo, su formato y el tamaño y los colores
de la ilustración, en caso de que la haya. Para
el artículo MM, este índice fue de 0.90.
tilda White y Hans Zeisel, "Reading Indices",
Journal of Marketing, octubre de 1941, pp.
103-111.)
Cuadro VI.6 Datos del número de lectores de tres
artículos
LA PRESENTACION DE LOS NUMEROS___________________________________________
35
Atracción del tema: promedio B/A
La proporción de lectores que empezaron a
leer el artículo como parada con la de quienes
lo notaron. Es una medida tosca del atractivo
del tema tal y como lo sugieren el titulo, la
ilustración y otros factores. Para el artículo MM,
este índice fue de 0.89.
Capacidad para mantener la atención:
promedio C/B
La proporción de lectores que terminó de leer
el artículo, de entre quienes comenzaron a
leerlo. Es una medida de la capacidad del
artículo para mantener en él la atención, y la
constituyen factores como el atractivo del
contenido, el desarrollo de la trama, el tamaño,
la dificultad del estilo. Para el articulo MM, este
índice fue de 0.25.
Los cuatro índices varían desde 0.0, que
representa la peor de las realizaciones, hasta
1.0, la máxima posible. Como todos los
índices, estos revelan su verdadera utilidad
cuando se utilizan para pacer comparaciones.
El cuadro VI.7 interpreta los datos del cuadro
VI.6 en sus índices respectivos.
CUADRO VI.7. Cuatro índices de lectura de tres
artículos
Medido por su éxito total, de lectura completa,
el artículo NN restito ser el mejor (0.30),
seguido por el MM (0.20) y el 00 (0.10). Los
otros tres índices explican por que fue tan alta
o tan baja la lectura total. Prácticamente todos
los miembros de la muestra (0.90) vieron el
articulo MM, y casi todos los que lo vieron
(0.89) empezaron a leerlo pues parecía
prometedor. Por algunas razones, sin embargo,
el artículo fue incapaz de mantenerlos
interesados. El índice C/B muestra el ínfimo
valor de 0.25, indicativo para el director de que
la debilidad de tal articulo estaba en el propio
texto.
Sólo una pequeña proporción de los lectores
(0.30) vio el artículo NN. Lo digno de
observarse es que todos los que lo vieron
comenzaron a leerlo (1.00), y la exposición del
asunto debió cumplir las expectativas de los
interesados porque el índice de capacidad para
retener su atención alcanzo también el valor
máximo (1.00): todos los que iniciaron la
lectura del artículo terminaron de leerlo.
Fueron muchos también los lectores que vieron
el artículo 00 (0.80), pero sólo unos cuantos lo
acabaron (0.25). Debe haber sólo poco
atractivo el contenido sugerido, ya que sólo la
mitad de quienes empezaron a leerlo lo
terminaron (0.50).
Los entrevistadores exploraron un poco más el
significado precise de estos índices,
investigando de qué factores dependía que el
índice de atención fuese alto o bajo. ¿Qué
atrae o repele al presunto lector de un artículo
dado? ¿Y qué tiene en si un artículo que lo
hace conservar o perder el interés de quien
comienza a leerlo?
INDICES SICOMÉTRICOS
Los índices que ahora se describir in se fundan
en las llamadas puntuaciones sociométricas de
actitudes. Describen la estructura de grupos
pequeños, como una clase escolar, una tropa
de boy scouts, un taller. Se le pide a cada
miembro del grupo que exprese su actitud
LA PRESENTACION DE LOS NUMEROS___________________________________________
36
hacia cada uno de los demás miembros,
valiéndose para ello de una sencilla escala de
cinco puntos que va desde la aceptación
máxima (+1) hasta el rechazo completo (-1),
con un punto medio neutral de 0 y valores
intermedios de +1/2 y -1/2.
El cuadro VI.8 presenta las puntuaciones de
aceptación mutua, de un grupo de siete
miembros identificados con números romanos.
El 1 que se localiza en la intersección del
miembro III (arriba) con el II (izquierdo)
expresa aceptación total del miembro II por el
miembro III.
Partiendo de estas puntuaciones es posible
construir un número de índices
asombrosamente grande que describe la
variedad de relaciones de este grupo de siete
miembros.
Los primeros seis índices describen a los
individuos; el índice 7 caracteriza la relación
entre parejas; y el 8 caracteriza al grupo.
Índice 1, Puntuación media recibida
Mide la aceptación del individuo por parte del
grupo. Se obtiene dividiendo entre 6 los
números de la última columna del cuadro, que
son el total de las puntuaciones recibidas. Igual
que las puntuaciones individuales, varía entre
+1.0 y -1.0.
7 Véanse, por ejemplo, Evelyn Perloff, "Prediction of
Male Readership of Magazine Articles", Journal of
Applied Psychology, vol. 32, 1948, pp. 663-674, y
otro artículo sobre primacía femenina en la misma
revista, vol. 33, 1949, pp. 175-180.
Los índices correspondientes a cada uno de los
miembros son: I (0.41), II (0.75), III (0.08),
IV (0.50), V (0.17), VI (-0.25) y VII (0.08). El
miembro II tiene la puntuación de aceptación
más alta y el VI la más baja.
Índice 2, Desviación promedio respecto a la
puntuación media recibida
El grado de unanimidad con que se atribuyó el
índice 1 a cada individuo. Una desviación de
cero indica que los otros seis miembros del
grupo coincidieron en otorgarle la misma
puntuacion al mismo individuo. El promedio de
desviación con respecto al índice 1 de las seis
puntuaciones individuales, correspondientes a
cada uno de los siete individuos, es de: I
(0.42), 11 (0.25), III (0.14), IV (0.17), V
(0.50), VI (0.50) y VII (0.25). El veredicto del
grupo sobre el miembro II es relativamente
homogéneo (0.14); la aceptación de los
miembros V y VI muestra la variación más
pronunciada de uno a otro miembro del grupo
(0.50).
Índice 3, Puntuación media expresada
Mide la sociabilidad activa del individuo: el
grado en que el individuo acepta, a su vez, a
los demás miembros del grupo: I
(0.33), II (0.08), III (0.0), IV (0.08), V (0.25),
VI (0.67), VII (0.33). El miembro VI muestra la
LA PRESENTACION DE LOS NUMEROS___________________________________________
37
mayor disposición a aceptar a los otros (0.67);
y el III, la menor (0.0).
Índice 4, Desviación promedio respecto a la
puntuación media expresada
Muestra el grado en que cada individuo
discrimina, en su aceptación, a los demás
miembros: I (0.33), II (0.43), III (0.50), IV
(0.43), V (0.25), VI (0.22), VII (0.33). El
número VI hace menos diferencia al aceptar a
sus compañeros (0.22). El III muestra el
mayor grado de diferenciación (0.50).
Índice 5, Correlación entre las puntuaciones
asignadas a los demás miembros y las
recibidas de estos
Por medio del coeficiente de rango de
correlación de grado, de Spearman, mide hasta
que punto son recíprocos los sentimientos de
los diferentes miembros del grupo: I (0.17), II
(0.43), III (-0.19), IV (-0.51), V (0.17), VI
(0.17), VII (-=0.11). El miembro II
corresponde con mayor exactitud a la
aceptación que recibe del grupo (0.43). El IV,
en cambio, califica a sus compañeros
prácticamente de manera contraria a la
aceptación que recibe de ellos (-0.51). Y del
VII diría que la aceptación que expresa es
independiente (-0.11) -o sea que tiende a
cero- de la que recibe de sus colegas.
Índice 6, Correlación entre las puntuaciones
expresadas por cada individuo y la puntuación
media general (Índice 1) de aceptación de
cada individuo
El grado en las puntuaciones expresadas por
cada individuo se conforman a la opinión
general expresada por el grupo en su conjunto.
Los coeficientes son: I (0.94), 11 (0.14), III
(1.00), IV (0.94), V (0.69), VI (0.71), VII
(0.83). El miembro III calificó a sus
compañeros exactamente como el grupo lo
calificó a 61 (1.00).
El II fue el que más se desvió de todos los
demás miembros del grupo (0.14). Que todos
los coeficientes sean positivos indica que, en
general, hay consenso en el grupo.
Índice 7, Media de las puntuaciones asignada y
recibida, calculada entre cuales quiera de dos
individuos y la cual indica la afinidad que hay
entre ellos.
Sólo una de las (6 7:2) - 21 relaciones de
pareja dentro del grupo obtuvo la puntuacion
mutua más alta posible (+1.00). Se trata de la
formada por los miembros I y II. Las relaciones
mas deficientes (-0.25) corresponden a las
parejas II y V, III y VI, y III y VII. No aparecen
puntuaciones inferiores a -0.25.
.8Aquí se evidencia muy especialmente que, en un
grupo tan pequeño como este, la actitud de un solo
individuo puede tener un efecto exagerado sobre la
puntuación del grupo. Ese efecto seria despreciable
si el grupo fuera más grande.
Índice 8, Media de todas las puntuaciones
Mide la cohesión del grupo. Con ayuda de este
índice se pueden comparar diferentes grupos y
también medir los cambios que ocurren dentro
del grupo con el paso del tiempo. La media de
todas las puntuaciones asignadas (y recibidas)
dentro del grupo es de (10:42) = 0.25.
Considerando que la puntuación máxima
hipotética es de 1.00 (si todas las
puntuaciones expresaran aceptación -
completa) y que la mínima es de -1.00 (si
todas las puntuaciones expresaran rechazo
total), diremos que este es un grupo de
cohesión moderada.
COEFICIENTE DE CORRELACION DE
RANCOS DE SPEARMAN
LA PRESENTACION DE LOS NUMEROS___________________________________________
38
Emprenderemos ahora una faena que acaso
parecerá gratuita, la de construir un índice que
ya existe desde hace mucho y que puede
encontrarse en cualquier libro de estadística
elemental: el coeficiente de correlación de
rangos de Spearman.* Este índice mide, con
un solo numero, el grado de similitud o
disimilitud entre dos conjuntos de
ordenaciones por rangos de los mismos
conceptos. En nuestro ejercicio de
construcción, partiremos de las tres diferentes
clasificaciones de cinco concursantes, como se
ve en el cuadro VI.9.
* Más exacto seria llamarlo "Coeficiente de
correlación de variables expresadas en
rangos", como las medidas con escalas
ordinales, por ejemplo, las de "Me gusta
mucho, poco, nada". En las ediciones
anteriores de esta obra, a este numero se le
llama "coeficiente de correlación de grado".
[T.]
Sin necesidad de hacer muchos cálculos, salta
a la vista que las apreciaciones del juez A se
asemejan más a las del juez B que a las del C.
Lo que es difícil ver al instante es si las
conclusiones del juez B se parecen mas a las
del juez A que a las del C. Uno de los objetivos
que persigue el índice que nos proponernos
elaborar es el de que constituir una medida
que sea lo suficientemente sensible para
distinguir entre clasificaciones muy
semejantes.
¿De dónde partiremos para crear nuestro
índice de similitud? Empezaremos por definir
los dos límites extremos que deberá abarcar:
la identidad absoluta y la disimilitud máxima.
En el cuadro VI.10 se denotan estos dos
extremos mediante una escala de cinco puntos,
como en nuestro ejemplo.
Estas dos parejas de ordenaciones por rangos
tienen una propiedad matemática cuya validez
se conserva independientemente del tamaño
de las escalas: la suma de los productos de
cada par de ordenaciones por rangos alcanza
su máximo cuando hay similitud absoluta
(identidad) y su mínimo en caso de disimilitud
total.
Tales implicaciones y tales sumas se efectúan
en la tercera y la sexta columnas, (a) X (b),
del cuadro VI.10: en caso de similitud
absoluta, la suma de los productos es 55; en
caso de total disimilitud, 35. La diferencia
entre estos dos valores extremos es 20. Las
sumas de los productos de todas las demás
combinaciones posibles de escalas de cinco
conceptos están entre 35 y 55.
Estos límites varían naturalmente con la
longitud de la escala. En una escala de cuatro
puntos están entre 20 y 30; en otra, de seis,
estarán entre 56 y 91; y así sucesivamente.
Toda vez que nos gustaría que la fórmula del
índice que estamos por construir se aplicara a
escalas de cualquier tamaño, lo aconsejable
seria que el valor máximo (de identidad)
produjera siempre un índice de +1.0, y el de
LA PRESENTACION DE LOS NUMEROS___________________________________________
39
disimilitud total otro de -1.0. El punto medio de
esa amplitud de 45 en la escala de cinco
puntos; de 25 en la de cuatro debe ser siempre
igual a 0.0, lo que indica el punto de falta de
correlación.
Lo que queda por pacer es simple.
Determínese el intervalo entre la puntuacion
máxima y el punto medio. Para la escala de
cuatro puntos es de 30 - 25 = 5. Luego,
divídase el intervalo del índice que va de +1.0
a 0.0 en cinco secciones iguales; y asígnense
estos valores a las puntuaciones entre 30 y 25,
de modo que 29 sea +0.8, 28 sea +0.6. etc.
En la gráfica VIA se concretan estas ideas en
relación con las escalas de cuatro, cinco y seis
puntos.
Los valores del índice son los valores
respectivos del coeficiente de correlación de
rangos de Spearman. Claro esta que es mucho
más sencillo calcularlos con la fórmula del
propio Spearman, el equivalente, más
elegante, de nuestra tosca pero instructiva
deducción:
Tres jueces en el cuadro VI.II se dan los
valores de P correspondientes a las tres
parejas de jueces.
Cuadro VI.II. Correlación de rangos entre tres jueces
Los dictámenes de los jueces A y B son los mas
semejantes entre sí (+0.8). Los jueces A y C
son los que más discrepan (+0.5). La relación
entre los jueces B y C se halla entre las cifras
anteriores (--f-0.6).
INDICES HECHOS A LA MEDIDA
LA PRESENTACION DE LOS NUMEROS___________________________________________
40
A veces es tan peculiar el problema de hacer
índices, que ninguna de las formulas
tradicionales se adapta a la tarea y tiene que
construirse uno a la medida.
Cierta vez en una comunidad se presento la
necesidad de medir el grado de monopolización
de los principales medios de difusión -o medios
de comunicación unidireccionales como son los
periódicos y las estaciones de radio-. Surgió el
problema como parte de un litigio ante la
Comisión Federal de Comunicaciones. Al
Departamento de Investigaciones Sociales
Aplicadas de la Universidad de Columbia se le
pidió que elaborara un índice que pudiera el
grado en que estuvieran concentrados los
medios de -difusión locales en copropiedad. La
formula obtenida finalmente comprendía los
siguientes datos:
1. El numero de unidades de medios de
difusión (estaciones de radio o periódicos) de
la comunidad.
2. El grado en que estas unidades eran de
propiedad mancomunada.
Quizá la comunidad tuviera, por ejemplo, dos
periódicos y dos estaciones de radio, y un
periódico y una estación de radio fueran de un
mismo propietario. Para elaborar la formula del
índice se definieron varias condiciones,
derivadas en parte del concepto de
monopolización y en parte de ciertos requisitos
formales que lo hicieran claro y practico.
1. El índice no distinguiría entre estaciones de
radio y periódicos; unas y otros se reducirían a
unidades de medios de difusión (M).
2. El índice variaría de 0.0, cuando diferentes
medios de difusión fueren de diferentes -
propietarios, a 1.0, cuando todos los medios
fueren de propiedad común (el monopolio
absoluto).
3. El índice crecería a medida que decreciera el
número de medios de difusión en competencia:
en una ciudad con cuatro unidades de medios
de difusión, M-M, M-M tendría un índice más
elevado que M-M, M, M.
4. A numero igual de unidades en
competencia, mayor valor del índice cuanto
mayores fueran las desigualdades entre los
medios de difusión rivales: M-M-M, M debería
producir un mayor valor de índice que M-M, M-
M.
Esta fue la formula que finalmente se obtuvo:
LA PRESENTACION DE LOS NUMEROS___________________________________________
41
RESUMEN
Construir un índice es expresar un objeto de
varias dimensiones con un solo número. Si se
mide el objeto en su totalidad, el índice será
una contracción de esas mediciones. A
menudo, sin embargo, el objeto del índice se
define conceptualmente y la formula del índice
trata de hacerle justicia al concepto. En cierto
sentido, es tautológica la pregunta de qué
mide un índice: mide lo que la formula indica.
Pero es posible que el concepto trascienda la
formula inmediata e incluya propiedades que
estén meramente relacionadas con los valores
numéricos de la formula.
SEGUNDA PARTE
LOS INSTRUMENTOS DEL ANALISIS
CAUSAL
Mucho del trabajo que se efectúa en el campo
de las ciencias sociales consiste aun en la
tarea, simple relativamente, de describir lo que
es y lo que sucede, pues sigue abundando en
parcelas donde aun no se han realizado
observaciones precisas. De ahí que con
empeño creciente estemos tratando de
descubrir por qué ocurren las cosas y cuales
son sus efectos. Ninguna otra realización
marca mejor el progreso de las ciencias
sociales, que nuestra capacidad, cada vez
mayor, de explicar por que la gente se
comporta como lo hace y de pronosticar, en
cierta medida, los efectos de nuestros actos.
El capítulo VII, primero de esta Segunda Parte,
describe uno de los pasos preliminares que
conducen al análisis causal. El refinamiento de
los datos estadísticos consiste en ver cómo
varían ciertas relaciones de un subgrupo de la
población a otro: en que difieren los jóvenes de
los ancianos, o los hombres de las mujeres, o
las jóvenes de las ancianas, etcétera.
El capítulo VIII se ocupa de uno de los
instrumentos, bien conocido pero raramente
empleado, que sirve para explorar relaciones
de causa y efecto: el experimento aleatorio
controlado. Como mejor lo conocemos es por
informes sobre las pruebas de eficacia que se
hacen en el campo farmacéutico. Este recurso
nos permite determinar con alguna precisión si
cierto tratamiento produce o no el efecto
esperado. Aparte de su utilidad como
instrumento de investigación, el experimento
controlado es importante como el paradigma
conceptual que guía también el análisis de
datos casi experimentales o definitivamente no
experimentales.
El capitulo IX plantea los problemas de analizar
datos de tratamientos diferentes que no se
obtuvieron por experimentación aleatoria
controlada. Tales datos no experimentales
llamados también observaciones son muchas
veces los subproductos administrativos del
curso normal de los acontecimientos. Se deno-
mina cuasiexperimento a los diseños
experimentales que tienen, potencialmente,
todas las características del experimento ideal
LA PRESENTACION DE LOS NUMEROS___________________________________________
42
HACER ESTADÍSTICAS
C. SANCHÍS
J. SALI LLAS
T. RIERA
G. FONTANET
DEFINICIÓN
Decimos que una muestra es representativa
con relación a un carácter x si el porcentaje de
elementos de la población total que posee
dicho carácter coincide con el porcentaje de
elementos que tienen dicho carácter en la
muestra.
Ejercicios
1) Ya sabes que para realizar transfusiones de
sangre es muy importante conocer el grupo
sanguíneo al que pertenecen el donante y el
receptor. Los grupos sanguíneos se reparten
aproximadamente según indica el cuadro
siguiente:
Tomamos como muestra de la población los
alumnos de tu clase.
¿Es una muestra representativa? ¿Se aleja
mucho de los porcentajes dados por el cuadro?
Indicación: Pregunta a tus compañeros cual es
su grupo sanguíneo; recoge los dados,
tabúlalos y calcula los correspondientes
porcentajes.
2) Según el celebre escritor norteamericano
Edgar Allan Poe (en su cuento El escarabajo de
oro), ordenando las letras del alfabeto ingles
según su frecuencia de utilización, de mayor a
menor, se obtiene la serie:
Coge un libro inglés y lee una página del
mismo; ordena las letras según su frecuencia
de aparición. ¿Es esa página una muestra
representativa de la población total?
Repite el mismo ejercicio con todos los
alumnos de la clase, leyendo cada uno una
pagina del mismo libro distinto o de libros
diferentes. ¿Cuál de las dos muestras es más
representativa?
3) Lee una pagina de un libro escrito en
castellano y ordena las letras según su
frecuencia de aparición de mayor a menor. Haz
el mismo ejercicio con varios o todos los
alumnos de la clase, sumando las frecuencias
obtenidas por cada uno.
4) Siguiendo con el ejercicio anterior:
a.- Calcula la frecuencia relativa de aparición
de cada una de las letras.
b.- Compara los resultados obtenidos con los
datos siguientes (sacados de un libro de
Fonética y Fonología Españolas):
LA PRESENTACION DE LOS NUMEROS___________________________________________
43
De la definición de muestra representativa que
hemos dado anteriormente resulta que para
saber si una muestra es representativa de una
población dada, necesitamos estudiar la
muestra y la población total, para poder
comparar los porcentajes correspondientes y
ver si coinciden.
Pero, si hemos estudiado toda la población ya
no necesitamos la muestra para deducir el
comportamiento de la población. Precisamos,
por tanto, de un procedimiento matemático
que nos permita juzgar la representatividad de
una muestra sin necesidad de conocer los
datos de toda la población.
Llegados a este punto, no podemos continuar
sin entrar de lleno en el campo de la Teoría de
la Probabilidad. Sí podemos decir, sin
embargo, que los procedimientos matemáticos,
que nos permiten averiguar si una muestra es
o no representativa, no nos dan una certeza
absoluta (a la que estamos acostumbrados, por
otro lado, en casi todas las ramas de la
Matemática), sino que nos proporcionan
únicamente una cierta probabilidad de acertar
y un riesgo de error.
Otro problema que plantean las muestras,
como hemos dicho al principio, es del de la
elección de los elementos que las componen.
¿Cómo deben elegirse los elementos de una
muestra? Para que una muestra sea
representativa es preciso que los elementos de
la población a estudiar tengan todos la misma
probabilidad (las mismas oportunidades) de ser
elegidos; este método de elección se llama
"método aleatorio o al azar".
Ejemplo:
Queremos elegir una muestra de 20 alumnos
de primer curso, en un colegio que tiene 250
alumnos de dicho curso, para estudiar la talla
media de los mismos.
El método aleatorio para elegir la muestra
puede consistir en ordenar alfabéticamente
todos los alumnos de primero asignándoles a
cada uno un numero del 1 al 250. A
continuación extraemos de una urna con 250
bolas, numeradas también del 1 al 250, veinte
de ellas y seleccionamos a los veinte alumnos
que tienen esos números.
Otro procedimiento puede consistir en sustituir
la extracción de bolas de la urna por una tabla
de números aleatorios. Actualmente podríamos
resolver el problema generando 20 números
aleatorios entre 1 y 250 mediante un
ordenador que, de paso, nos da también los
nombres de los alumnos agraciados.
Ejercicios
1) Tomando como población el conjunto de los
alumnos de la clase, vamos a estudiar la media
de las notas de Dibujo en la última evaluación:
a.- Calcúlala a partir de todos los elementos.
b.- Elige aleatoriamente 10 alumnos y calcula
la media correspondiente a los mismos.
c.- Compara ambas medias.
LA PRESENTACION DE LOS NUMEROS___________________________________________
44
d.- Repite los apartados b) y c) con otras
muestras aleatorias.
2) A partir de los datos del cuadro adjunto
realiza las siguientes actividades:
a.- Calcula la media de vehículos matriculados.
b.- Elige una muestra aleatoria de 6 provincias,
y calcula su media.
c.- Compara ambas medias y di si la muestra
es representativa.
d.- Resuelve las mismas cuestiones con los
permisos expedidos.
e.- Haz lo mismo con las licencias.
Otra cuestión relacionada con las muestras es
la relativa al tamaño de las mismas. ¿De
cuantos elementos debe constar una muestra?
En igualdad de condiciones, cuanto mayor sea
el número de elementos de una muestra tanto
más se acercaran los parámetros calculados en
la misma a los parámetros correspondientes de
la población total. En la práctica real el número
de elementos de una muestra depende de
diversos factores:
• Dificultad de elección de los elementos
• Gastos que origina la elección de los
elementos
• Tiempo necesario para elegirlos según el
carácter a estudiar
• Grado de fiabilidad deseado
• Etcétera.
El tamaño real de la muestra en los estudios de
estimación estadística aplicados en Economía,
en Sociología, en Política, etc. depende, sobre
todo, de la aproximación que deseemos
obtener en la estimación y del riesgo que nos
permitamos corner en la predicción. Ambos
conceptos se miden en términos de
probabilidad y, por tanto, caen fuera de los
propósitos de este libro.
Los cálculos requeridos se hacen más
fácilmente con la ayuda de una calculadora o
programa computacional. Es posible que un
centro de computo local tenga una lista de
programas disponibles y también podría
proporcionar la información y accesoria
LA PRESENTACION DE LOS NUMEROS___________________________________________
45
necesarias para analizar los datos en una
computadora.
HACER ESTADÍSTICAS
C. SANCHIS
J. SALI LLAS
T. RIERA
G. FONTANET
PARAMETROS CENTRALES
3.1. OBJETIVOS ESPECÍFICOS
Los objetivos específicos de este capitulo los
podemos resumir en los siguientes:
• Introducir la necesidad de los parámetros
estadísticos.
• Adquirir la idea correcta de parámetros
estadísticos.
• Comprender la utilidad de los parámetros
centrales.
• Calcular la media aritmética en los diversos
casos.
• Comparar dos conjuntos a partir de sus
medios.
• Calcular la mediana en los diversos casos.
• Calcular la moda en los diversos casos.
• Conocer las ventajas e inconvenientes de
cada uno de los parámetros centrales.
• Saber discernir que parámetro central es el
más adecuado según los datos.
• Hallar gráficamente los parámetros centrales.
• Conocer los cuartiles, deciles y percentiles.
3.2. CONCEPTO DE PARÁMETRO. CLASES
DE PARÁMETROS
Como habrás tenido ocasión de observar en la
parte que precede, una característica casi
constante a lo largo de la Estadística es el
manejo de gran cantidad de datos. Los
ejemplos de la vida real suelen superar en
mucho a los que nosotros utilizamos en el
texto, ya que estos últimos los hemos elegido
con la finalidad primordial de hacerlos
manejables y conseguir así que los cálculos
correspondientes sean factibles sin un excesivo
trabajo. Por este motivo, no debe extrañarte
que para el estudio de casos reales los
estadísticos necesiten utilizar ordenadores.
Uno de los fines importantes de la Estadística
Descriptiva es el de resumir o sintetizar esas
grandes cantidades de datos en unos pocos
números que nos proporcionen una idea, lo
mas aproximada posible, del comportamiento
de todos los elementos de una población con
relación al carácter que deseamos estudiar.
Estos números se conocen con el nombre de
parámetros y se dividen en dos grupos:
a) Parámetros centrales.
b) Parámetros de dispersión.
Los parámetros centrales son unos números
que tienen como objetivo agrupar o centralizar
los datos correspondientes a toda la población
en un solo valor numérico, representante del
conjunto total.
Los parámetros de dispersión tienen como
objetivo el darnos una idea o "medida" de la
proximidad o lejanía que presentan los datos
de la población respecto del valor que hemos
tornado como "central" o representante del
conjunto total.
LA PRESENTACION DE LOS NUMEROS___________________________________________
46
que se lee "sumatorio desde i igual a 1 hasta
n". Sirve para indicar de un modo abreviado
una suma que consta de n sumandos siendo un
número natural cualquiera.
Para aclarar este concepto, imagínate que
queremos sumar los diez primeros números
naturales. Podemos expresar esta suma, como
habrás hecho siempre, en la forma
O bien como habrás visto muchas veces,
utilizando puntos suspensivos
Queda patente el hecho de que este
simbolismo es tanto más útil cuanto mayor es
el número de sumandos de que consta la suma
y que resulta muy cómodo si se ha de trabajar
con muchas sumas como es el caso de la
Estadística.
Análogamente obtendríamos en la expresión:
a.- Todos los números impares inferiores a
2.000.
b.- Todos los múltiplos de 3 inferiores a 1.000.
c.- Los cuadrados de todos los números
naturales entre 30 y 50.
d.- Los cubos de todos los números naturales
entre 30 y 50.
3.4. PARÁMETROS CENTRALES
Como hemos dicho anteriormente, los
parámetros centrales son unos números con
LA PRESENTACION DE LOS NUMEROS___________________________________________
47
los que intentamos resumir o sintetizar los
datos correspondientes a toda una población.
Resulta a todas luces un tanto simplista el
querer representar todos los datos de una
población (que, como sabes, pueden ser
cientos, miles o millones) mediante un único
número. Sin embargo, veremos que estos
parámetros centrales son de gran utilidad para
el manejo de datos estadísticos.
Los principales parámetros centrales son:
• la media antmética
• la mediana, y
• la moda.
3.5. LA MEDIA ARITMÉTICA
Es sin duda el parámetro central que se utilizo
con mayor frecuencia, no sólo como
representante del promedio de los valores de
toda la población, sino también como elemento
auxiliar en el cálculo de otros parámetros que
veremos luego.
Seguramente tienes ya una idea sobre la
media aritmética (aunque no sepas definirla
con exactitud) y la has utilizado en más de una
ocasión. ¿Cuántas veces has preguntado a tus
profesores si para la nota final de curso hacen
la "media" de las notas de las evaluaciones?
Ejemplo:
Supongamos un alumno que realiza un
ejercicio de Ciencias Naturales compuesto de
cinco preguntas y obtiene las siguientes
puntuaciones:
¿Cual crees que debería ser la nota final del
ejercicio?
Ya se te habrá ocurrido que la nota final podría
obtenerse sumando las cinco puntuaciones
obtenidas en las preguntas y dividiendo el
resultado por cinco, es decir:
este valor, 5,2, recibe el nombre de nota
media o simplemente media. Es un número
que nos resume o sintetiza, en este caso, las
cinco puntuaciones obtenidas por separado en
las cinco preguntas.
Esta necesidad de resumir o condensar en un
solo número un conjunto de ellos se hace más
acuciante a medida que crece el número de
elementos del conjunto. Por consiguiente,
vamos a dar la definición de media aritmética
de un conjunto de datos o valores.
DEFINICIÓN
Si tenemos un conjunto de N datos numéricos
que representaremos por:
es decir, la medida aritmética de un conjunto
de N valores numéricos es decir el cociente de
divide la suma de todos los valores por el
número de ellos
Si usamos el símbolo , introducido
antenormente, podemos escribir la fórmula (1)
abreviadamente
LA PRESENTACION DE LOS NUMEROS___________________________________________
48
Si el número de valores considerados es
grande y los hemos tabulado, como se indico
en capítulos anteriores, mediante una tabla de
frecuencias, entonces la media aritmética se
calcula utilizando la formula:
+
Ejemplo:
Las notas de francés de una clase de 40
alumnos han sido las siguientes:
Queremos hallar nota media de los alumnos de
esta clase.
Procedemos, en primer lugar, a contra y
tabular los datos, como ya sabemos:
A partir de dicha tabla, y aplicando la formula
(2), tenemos:
Este numero, 4,6, nos da una idea de las notas
de los 40 alumnos en conjunto, de forma mas
intuitiva que las 40 calificaciones por separado;
además, resulta de gran utilidad cuando se han
de realizar comparaciones entre diversos
grupos o clases para extraer resultados de
rendimientos.
Es conveniente que nos vayamos
acostumbrando a pensar que en Estadística no
interesan los datos de un individuo particular
LA PRESENTACION DE LOS NUMEROS___________________________________________
49
(en este caso, la nota de fulanito), sino que
interesa el conjunto de toda la población y la
forma en que están distribuidos estos datos
Ejercicios
1) Realiza 30 tiradas con un dado y anota los
resultados. Tabula los resultados obtenidos.
Calcula la media aritmética de los puntos
obtenidos
2) Repite el mismo ejercicio anterior, pero en
grupo (por ejemplo, haciéndolo por separado
cada uno de los alumnos de la Clase).
Compara las medidas obtenidas por cada uno.
Deduce alguna consecuencia.
3) En tu clase toma como variable estadística x
el número de asignaturas aprobadas por cada
alumno en la última evaluación. Calcula la
media aritmética Opina sobre el fracaso esco-
lar.
4) Realiza una encuesta en la clase sobre el
número de hermanos de cada uno de los
alumnos. Calcula la media. Haz lo mismo con
los padres de los alumnos de la clase. Compara
los medios y saca consecuencias sobre la
evolución de la natalidad
5) Consulta la sección de economía de un
periódico cualquiera. Anota las cotizaciones del
dólar durante una semana. Calcula la
cotización media de la divisa norteamericana
durante esa semana.
Veamos ahora cómo se calcula la media
aritmética cuando los datos están agrupados
en clases. Tomemos como ejemplo la
extensión en Km2 de las cincuenta provincias
españolas (antes de constituirse las
Autonomías):
Podemos agruparlas en clases tomando, por
ejemplo, como longitud de clase 2.500 Km2
Indicaremos la primera clase por [0, 2'5), la
segunda por [2'5, 5), etc. La tabla de recuento
y de frecuencias viene dada por:
Aquí nos encontramos con una pequeña
dificultad: los Xi no son un número
determinado, sino intervalos. En este caso,
para calcular la media aritmética, sirve
también la formula (2), siendo Xi la marca de
clase y f1 la frecuencia de la clase
correspondiente.
Las marcas de clase, coma ya sabes de
páginas anteriores, son el punto medio del
intervalo correspondiente, que se obtiene
sumando los valores extremos y dividiendo por
dos; así, pues, tenemos:
LA PRESENTACION DE LOS NUMEROS___________________________________________
50
Entonces, la extensión media en Km2 de las 50
provincias españolas es igual a 10.100 Km2.
Ejercicios
1) Calcula la extensión media de las provincias
españolas partiendo directamente de los datos
sin agrupar. Compara el resultado con el que
acabamos de obtener.
2) Recoge las tallas de los alumnos de la clase.
Agruparlas en clases. Tabula los resultados.
Calcula la media.
3) Toma un periódico de hoy. En la sección que
trata del tiempo encontraras las temperaturas
máximas y mínimas de las capitales de
provincia. Tabula los resultados agrupados en
clases. Calcula la media de las temperaturas
máximas y la media de las mínimas.
4) Repite el ejercicio anterior con las
temperaturas de las principales capitales
europeas.
Realiza el mismo ejercicio con las temperaturas
de las principales capitales mundiales.
5) Busca los periódicos correspondientes a una
semana determinada y anota las temperaturas
máximas y mínimas relativas a la capital de la
provincia o región. Calcula la media
correspondiente a cada una de ellas.
3.5.1. MEDIA ARITMÉTICA PONDERADA
Habrás oído hablar sin duda de una posible
reforma de las Enseñanzas Medias y del
segundo ciclo de EGB, cuyo ensayo esta ya
funcionando. Aunque no se sabe aun
exactamente, en que va a consistir, una de las
novedades puede ser el que los alumnos
aprueben el curso "globalmente" y no
asignatura por asignatura.
Ejemplo:
Supongamos que en el primer curso del nuevo
plan figuren las siguientes materias, con el
número de horas semanales que se indican:
Lengua española………………………….………………… 4 H
Lengua extranjera…………………….…………………… 2 H
Matemáticas............................................. 4 H
Ciencias Naturales..................................... 3 H
Geografía e Historia….………………………………….. 3 H
Educación física……..……………………………………… 2 H
Tecnología……………………………………………………… 2 H
Informática……………………………………………………. 2 H
Etica (Religión)……………………………………………… 1 H
Música……………………………………………………………. 1 H
Como no está totalmente previsto el modo de
calificar, a la hora de poner la nota "global", se
podría adoptar como criterio el cálculo de la
media aritmética de todas las notas. Sin
embargo, parece más razonable que las
asignaturas no tengan todas la misma
influencia en el resultado final (que no tengan
el mismo peso); se decide, por tanto, que la
importancia o influencia de cada asignatura en
la nota global sea proporcional al número de
horas semanales que se imparten de la misma.
Siguiendo en el terreno hipotético,
supongamos que un alumno X ha obtenido las
siguientes calificaciones:
LA PRESENTACION DE LOS NUMEROS___________________________________________
51
Lengua española………………………….………………… 5
Lengua extranjera…………………….…………………… 6
Matemáticas............................................. 2
Ciencias Naturales..................................... 3
Geografía e Historia….………………………………….. 7
Educación física……..……………………………………… 6
Tecnología……………………………………………………… 4
Informática……………………………………………………. 8
Etica (Religión)……………………………………………… 5
Música……………………………………………………………. 2
¿Qué nota global corresponderá al alumno X?
Si para aprobar el curso es necesaria una nota
global igual o superior a 4,5 ¿qué suerte
correrá nuestro amigo X?
En este caso no podemos hacer la media
aritmética de las calificaciones obtenidas en
cada una de las asignaturas, pues ello
equivaldría a que todas tuvieran la misma
importancia. Debemos introducir un factor que
nos permita a cada calificación la importancia
(el peso) que tienes según el número de hojas
semanales correspondiente a la asignatura en
cuestión para ello multiplicaremos la
calificación obteniendo en las toda la
asignaturas por el número de horas
correspondiente ala misma, sumaremos estos
productos y dividiremos por el número total de
horas semanales: tendremos así que la nota
global será:
la nota global del curso será, pues, 4,75 y
como quiera que 4,75 > 4,5 nuestro amigo x
habrá aprobado el curso completo.
Este valor x se llama media aritmética
ponderada. Los valores por los que se
multiplican los datos (en nuestro caso las
notas), para darles una determinada
importancia, se llaman pesos. Así, en nuestro
ejemplo, la nota de Lengua española tiene
peso 4, la nota de Ciencias Naturales tiene
peso 3, mientras que la nota de Música tiene
peso 1.
En general, cuando se trata de calcular la
media aritmética ponderada, partimos de un
conjunto de datos agrupados XI con unas
frecuencias FI y unos pesos PI, tal como se
Indica en la tabla adjunta:
DEFINICIÓN
Para un conjunto de datos, con sus frecuencias
y sus pesos expresados en la tabla anterior, se
llama media aritmética ponderada al valor XP
dado por la formula siguiente:
La media aritmética ponderada se utiliza en
multitud de ocasiones, un caso muy
interesante es el cálculo del Índice de Precios
al Consumo (IPC), del que hablaremos más
adelante.
Ejercicios
1) Un profesor de Matemáticas realiza a lo
largo del curso nueve ejercicios puntuables,
tres cada trimestre. Para la calificación final de
los alumnos hace la media aritmética
ponderada con el siguiente criterio: los
LA PRESENTACION DE LOS NUMEROS___________________________________________
52
segundos ejercicios de cada trimestre cuentan
doble que los primeros, y los finales de cada
trimestre valen triple que los primeros.
Dos alumnos X e Y obtienen las notas
siguientes, en el orden que se indica:
X: 563; 745; 642
Y: 258; 045; 216
¿Qué nota final corresponderá a cada alumno?
¿Qué nota correspondería a cada alumno si el
profesor hiciera la media aritmética?
2) Los rendimientos del cultivo de trigo en
cuatro parcelas son los siguientes (expresados
en Qm/Ha):
Calcular el rendimiento medio.
3.5.2. VENTAJAS E INCONVENIENTES DE
LA MEDIA ARITMÉTICA
Una de las propiedades más importantes de la
media aritmética es el hecho de que este
parámetro tiene en cuenta todos los valores o
datos de la población y que los cálculos
necesarios para su elaboración son sencillos.
Sin embargo, presenta un inconveniente, a
.veces grave, que consiste en los efectos que
sobre ella producen los valores extremos que,
en muchas ocasiones, son los menos
significativos por su rareza o excepcionalidad.
Este problema es uno de los que surgen al
querer sintetizar en un solo número un
conjunto de ellos.
A veces nos encontramos con dificultades que
nos impiden el cálculo de la media aritmética.
Tal es el caso de datos agrupados en clases
cuando existen las llamadas "clases abiertas".
Así, según el INE (Instituto Nacional de
Estadística), la población española en 1981
constaba de 37.680.900 individuos,
distribuidos del siguiente modo:
Si quisiéramos calcular la media nos
encontraríamos con la dificultad de la última
clase (mayores de 64 años).
Otras veces las dificultades para el cálculo de
la media aritmética provienen de que los datos
observados o estudiados no son numéricos o
cuantitativos sino cualitativos.
LA PRESENTACION DE LOS NUMEROS___________________________________________
53
Para resolver estos inconvenientes se utilizan
los otros parámetros centrales que, en algunas
ocasiones, son más representativos que la
media aritmética. Así tenemos la moda y la
mediana.
3.6 MODA
Se llama moda de un conjunto de datos a
aquel valor que se presenta con mayor
frecuencia.
De acuerdo con estas definiciones existentes
conjunto de datos que no tienen moda (ningún
dato se repite), que tiene una moda (hay un
dato con mayor frecuencia en el resto) o que
tiene más de una moda (varios datos con la
misma frecuencia) en este último caso se habla
de distribuciones bomidales, trimodales o
multimodales.
Ejemplo
1) si consideramos las notas de matemáticas
correspondientes a los 40 alumnos de la clase
vista anteriormente (página 46), vemos que la
nota 4 tiene frecuencia 8, que es la mayor
frecuencia de todas; según la definición
anterior, la moda de este conjunto de notas es
el 4.
2) Si miramos la tabla correspondiente a la
extensión de las provincias españolas (página
47), vemos que la clase modal es la (5, 7'5)
cuya frecuencia es 12.
3) Lanzamos un dado cinco veces y obtenemos
los siguientes resultados: 5 1 2 4 6 Esta serie
de datos no tiene moda.
4) Lanzamos dos dados veinte veces
obteniendo como suma de los puntos de cada
tirada los valores:
44, 8, 8, 7, 10, 2, 5.
La moda de esta distribución es el 7, que
aparece seis veces.
En el caso de una serie de datos agrupados en
clases se suele tomar como moda el valor
correspondiente a la marca de clase relativa a
la clase modal. Así, en el caso de los datos
correspondientes a la extensión de las
provincias españolas, la clase modal es la [5,
7'5) y podemos tomar como moda el valor
6'25, que es la marca de dicha clase.
Ejercicios
1) Lanza dos dados 40 veces y anota la suma
de las puntuaciones obtenidas en cada tirada.
Construye la tabla de frecuencias y di cuál es
la moda.
2) Haz el ejercicio anterior en grupo (realizar
cada uno de los alumnos de la clase el mismo
experimento). Compara los resultados
obtenidos.
¿Crees que es una casualidad, o hay alguna
razón que justifique el resultado?
3) Coge un libro cualquiera, escrito en
castellano, y lee una pagina del mismo
anotando las veces que aparece cada una de
las letras. Haz una tabla de frecuencias y di
cual es la, moda.
4) Realiza el mismo ejercicio con los resultados
obtenidos por tus compañeros. Compara los
resultados. ¿Qué explicación le das?
Comprueba si el mismo ejercicio, realizado con
un libro escrito en distinto idioma te da la
misma moda.
3.6.1. CÁLCULO GRÁFICO DE LA MODA
Hemos dicho hace poco que cuando los datos
están agrupados en clases se suele tomar
como moda el valor correspondiente a la marca
de clase de la clase modal. Se puede
aproximar un poco más este resultado si
trabajamos con papel milimetrado y de modo
gráfico, tal como se indica en la figura adjunta:
LA PRESENTACION DE LOS NUMEROS___________________________________________
54
La intersección de las rectas PR y QS nos da el
punto M correspondiente a la abcisa X de la
moda.
El parámetro moda no es tan representativo
como la media aritmética, pero es útil en
algunas ocasiones, como habrás podido
apreciar en los ejercicios anteriores. La mayor
representatividad de la media se debe, sobre
todo, a que en el cálculo de esta intervienen
todos los datos del conjunto estadístico,
mientras que en el caso de la moda esto no
ocurre.
La moda y la clase modal no tienen demasiado
interés, salvo cuando su frecuencia se destaca
claramente de las del resto de la distribución.
La moda se considera como un valor central
porque indica la mayor frecuencia, pero puede
estar situada muy cerca de los extremos. Sin
embargo, tanto la moda como la clase modal
tienen un significado real; por ejemplo, en
Geografía pueden ser la expresión de una
estructura determinada, caracterizar una
región al darnos cuenta de un clima domi-
nante, del paisaje o de las actividades que
predominan en la misma.
Además, la moda es el único valor central que
puede calcularse en las series nominales.
El otro parámetro central es la mediana.
3.7. MEDIANA
Hasta el presente no hemos tenido en cuenta
para nada el orden de los valores que
componen la serie estadística. Pero es fácil de
comprende que al hablar de medidas centrales
nos puede ser útil disponer de los datos en
forma ordenada (generalmente en forma
creciente), siempre que dicha ordenación sea
posible.
Supongamos, pues, que dado un conjunto de
valores o datos Xi los hemos ordenado de
modo que
3.7.1. DEFINICIÓN
Se llama mediana a aquel valor, Xm, que ocupa
el lugar central si hay un número impar de
datos o a la media aritmética de los valores
centrales, xm y Xm+1, si el número de datos es
par.
Ejemplos:
1) Si consideramos las cinco tiradas del dado,
LA PRESENTACION DE LOS NUMEROS___________________________________________
55
mencionadas anteriormente, y ordenamos las
puntuaciones obtenidas de menor a mayor,
resulta
1 2 4 5 6
La mediana es el 4 (valor central).
2) En el caso de las puntuaciones obtenidas
mediante el lanzamiento de dos dados
simultáneamente, una vez ordenadas
tenemos:
2 2 3 4 4 5 5 5 7 7 7 7 7 7 8 8 1 0 1 1 1 1 1 1
Los dos valores centrales valen 7 y, por tanto,
la mediana es 7
3) Supongamos ahora la serie de datos 2 3 4 4
5 5 6 7; los valores centrales son 4 y 5 y, por
consiguiente, la mediana es la media
aritmética de ambos, es decir, 4,5.
La mediana se utiliza especialmente en los
casos siguientes
• Cuando se trata con datos cualitativos
susceptibles de ser ordenados.
• Cuando el conjunto de datos estadísticos
posee unos valores extremos excepcionales
que afectan demasiado al valor de la media
• Cuando se trata de datos estadísticos
agrupados en clases y las clases extremas (o al
menos una de ellas) son abiertas,
3.7.2. PROPIEDAD DE LA MEDIANA
La mediana, tal como se deduce de su
definición, tiene la propiedad de que el
cincuenta por ciento de los datos son menores
o iguales que ella y el cincuenta por ciento
restante son mayores o iguales. Dicho de otra
manera: la mediana divide el conjunto de
datos en dos partes iguales dejando la mitad
de ellos a su izquierda y la mitad restante a su
derecha.
Esta propiedad justifica plenamente la inclusión
de la mediana entre los parámetros centrales.
3.7.3. CALCULO GRÁFICO DE LA MEDIANA
Para calcular gráficamente la mediana de una
distribución, un método consiste en dibujar el
polígono de frecuencias acumuladas, colocando
en el eje de las X los valores o clases y en el
eje de las Y los porcentajes correspondientes,
como indica la figura:
se traza una paralela al eje de las X por el
punto correspondiente al 50%, que corta al
polígono de frecuencias en un punto M; por
éste se traza una paralela al eje de las Y, que
corta al eje de las X en un punto M', que es el
valor de la mediana buscada. (Es conveniente
realizar el gráfico en papel milimetrado para
mayor precisión.)
3.8. RELACIÓN ENTRE LOS TRES
PARÁMETROS: MEDIA, MODA Y MEDIANA
En las distribuciones normales, como se ve en
la figura adjunta, los tres parámetros coinciden
en un mismo valor; además los datos están
distribuidos de forma simétrica a ambos lados
de dicho valor central. Este tipo de
distribuciones es muy frecuente y de gran
LA PRESENTACION DE LOS NUMEROS___________________________________________
56
interés en los estudios teóricos de Estadística y
de teoría de probabilidades.
En las distribuciones que no son simétricas,
pero tampoco excesivamente asimétricas,
como las de las figuras siguientes, se verifica la
relación que escribimos a continuación:
media – moda = 3 (media-medina)
El signo = se lee aproximadamente igual
(quiere decir que no se trata de una igualdad,
sino simplemente de una aproximación).
3.9. CUARTILES, DECILES Y PERCENTILES
Al estudiar la mediana hemos dicho que
cuando una serie de datos estadísticos se
colocan ordenados de menor a mayor, la
mediana es aquel valor que divide al conjunto
en dos partes iguales. A veces es conveniente
dividir el conjunto de datos en más partes
iguales; es frecuente dividirlo en cuatro partes
iguales, y a los valores que verifican esta
división se los conoce con el nombre de
cuartiles, designándose habitualmente por las
letras Q1, Q2 y Q3 y llamados
Q1: primer cuartil
Q2: segundo cuartil
Q3: tercer cuartil
Otras veces se divide el conjunto de datos en
diez partes iguales; en este caso los valores
que proporcionan tal división se conocen con el
nombre de deciles y se representan por D1,
D2, D9. Si dividimos el conjunto de datos en
den partes iguales los correspondientes valores
se llama percentiles y se representan por P1
P2,…, P99.
Es obvio que estos parámetros se utilizan a
medida que el número de datos aumenta, con
objeto de dividir el conjunto de datos en partes
con el mismo porcentaje de elementos.
El cálculo de los cuartiles, deciles y percentiles
se efectúa de modo similar a lo hecho en el
caso de la mediana. Observa asimismo que el
segundo cuartil Q2 coincide con la mediana, y
lo mismo ocurre con el quinto decil D5 y con el
percentil P50.
Ejemplos
1) Lanzamos un dado 25 veces y obtenemos
los resultados siguientes:
5, 3, 2, 6, 5, 1, 2, 3, 2, 1, 5, 1, 5, 2, 4, 5, 6, 1,
2, 4, 4, 2, 2, 4, 3
Queremos calcular los cuartiles Q1, Q2 y Q3.
Ordenamos los datos de menor a mayor:
-
1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4,
LA PRESENTACION DE LOS NUMEROS___________________________________________
57
4, 5, 5, 5, 5, 5, 6, 6
Q1 = 2 (media de los datos 6.° y 7.0).
Q2 = 3 (valor del dato 13.°).
Q3 = 5 (media de los datos 19.° y 20.°).
Esto nos dice que el 25% de tiradas ha salido
un número igual o menor que 2; que el 50%
de las tiradas ha salido un número igual o
menor que 3 y que el 75% de las tiradas
hemos obtenido una puntuación igual o menor
que 5.
2) Las calificaciones de 150 alumnos se
recogen en el siguiente cuadro:
EJERCICIOS DE RECAPITULACIÓN
1) Lanza dos dados 100 veces y anota las
sumas obtenidas en cada tirada. Tabula los
resultados. Calcula la mediana, los cuartiles y
los deciles. Construye el polígono de las
frecuencias acumuladas y calcula a partir del
mismo la mediana, los cuartiles y los deciles.
Compara los resultados obtenidos mediante
ambos procedimientos.
2) Calcula los cuartiles y los deciles de la tabla
correspondiente a la extensión de las
provincias españolas.
El 25% de las provincias españolas tiene una
extensión igual o menor que
Km2
El 60% de las provincias españolas gene una
extensión igual o menor que
Km2.
3) Una clase de 40 alumnos se divide en tres
grupos para calcular la nota media de inglés,
resultando lo siguiente:
10 alumnos → nota media 6,5
18 alumnos → nota media 5,8
12 alumnos → nota media 7,1
¿Cuál es la nota media de los 40 alumnos de la
clase?
4) Realiza los ejercicios que se piden a partir
de los datos de las quinielas correspondientes
a la temporada actual.
a.- Calcula la media, la mediana y la moda
correspondientes a las variables: número de
veces que ha salido "" 1 ", '"x",
“2”
b.- Idem para la variable: numero de variantes
("x" y "2").
c.- ¿Qué medida de éstas te parece más
representativa?
d.- Si quisieras hacer una quiniela de acuerdo
con los datos obtenidos anteriormente,
¿cuántas variantes pondrías?
¿Cuantos "2"?
f.- Agrupa las recaudaciones en 8 clases: haz
la tabla de frecuencias, el diagrama de barras,
el polígono de frecuencias y el polígono de
frecuencias acumuladas.
g.- A partir del polígono de frecuencias
acumuladas calcula la moda, la mediana y los
cuartiles.
h.- Calcula la media de las recaudaciones.
LA PRESENTACION DE LOS NUMEROS___________________________________________
58
Con los datos anteriores:
a.- Calcula la mediana y la media de las
ganancias de los jugadores.
b.- ¿Tiene sentido hablar de la moda de las
ganancias?
c.= Calcula la moda del número de torneos
jugados, la media y la mediana.
d.- ¿Qué valor de los anteriores, calculados en
el apartado?
c) ¿te parece más representativo?
LA PRESENTACION DE LOS NUMEROS___________________________________________
59
HACER ESTADÍSTICAS
C. SANCHÍS
J. SALILLAS
T. RIERA
G. FONTANET
5. INDICE E INFERENCIA ESTADÍSTICAS
5.1. OBJETIVOS ESPECÍFICOS
Los objetivos específicos de este capítulo los
podemos resumir en los siguientes:
• Introducir el concepto de índice o números
índice.
• Tratar las principales propiedades de los
índices.
• Destacar la importancia de los índices en el
estudio de series temporales.
• Destacar la utilización de los índices en
Economía.
• Estudiar un poco el IPC.
• Dar unas nociones sobre el poder adquisitivo.
• Idea de la inferencia estadística.
• Conocimiento de la teoría de muestras.
• Propiedades que han de cumplir las
muestras.
• Elección de los elementos que componen una
muestra.
• Juzgar la representatividad de una muestra.
5.2. ÍNDICES (O NÚMEROS ÍNDICE)
SU SEÑORÍA EL IPC
El Índice de Precios de Consumo (IPC) es,
quizás, el indicador de la economía española al
que se presta más atención en los últimos
tiempos, por ser el expresivo de la marcha de
la tasa de inflación. Recogemos la evolución
del índice general, mes a mes en 1982 y 1983.
Los titulares anteriores pueden servir de
motivo para la introducción del concepto de
índice (o números índice). Debemos señalar,
sin embargo, que el concepto de índice es
mucho más amplio, aunque es preciso
reconocer que la mayor parte de los índices
han sido utilizados por los economistas para
resumir, sintetizar y comparar diversos
fenómenos.
Los índices se calculan con objeto de seguir
aisladamente la evolución de caracteres en
función del tiempo y facilitar de esta manera
las comparaciones. Ya hemos hablado
anteriormente de las series temporales;
existen boletines especializados que publican
series temporales bajo la forma de índices.
Tanto el Estado como las empresas y los
bancos poseen departamentos especializados
dedicados a la confección de índices. Así, el
Instituto Nacional de Estadística (INE) es
el encargado de confeccionar el IPC.
Un número índice es una medida estadística
cuya finalidad es mostrarnos los cambios
sufridos por una variable o por un grupo de
variables a través del tiempo (series
temporales) o de alguna otra característica
LA PRESENTACION DE LOS NUMEROS___________________________________________
60
como la edad, la profesión, el nivel educativo,
la distribución geográfica, etc.
5.2.1. Tipos de índices
Podemos dividir los índices tal como indica el
cuadro:
Vamos a explicar brevemente cada uno de
ellos
a) Índices elementales simples
Un índice elemental simple es la razón o
cociente entre el valor vt de una variable en un
tiempo (t) y el valor vo de la misma variable
en un tiempo to tomado como referencia.
DEFINICIÓN
Al cociente Vt/Vo se le llama valor relativo.
Generalmente se expresa en forma de
porcentaje o de tanto por ciento, es decir, en la
forma
(Vt/Vo) x 100
De la formula se deduce fácilmente que al
valor correspondiente al tempo o, o sea, Vo le
corresponde el porcentaje 100.
Ejemplo:
Queremos estudiar la evolución de las
importaciones españolas de crudos de petróleo
desde el ano 1973 hasta el 1983. Según
fuentes del INK DG Aduanas, disponemos de
los datos siguientes:
LA PRESENTACION DE LOS NUMEROS___________________________________________
61
Se pueden observar dos cambios bruscos en el
precio de los crudos: el primero del 320,8% en
el ano 1974 y otro de 1.305,5% en el año
1980, mientras que las cantidades importadas
se mantienen prácticamente iguales según nos
muestran los índices correspondientes. Estas
variaciones bruscas corresponden a los
aumentos de los precios por parte de los países
productores de petróleo (OPEP) y que dieron
lugar a crisis económicas importantes, sobre
todo la de los años 73-74 que todavía
arrastramos.
Ejercicios
1) Actualizar los datos del ejemplo anterior
hasta la flecha presente
2) con los mismos datos del cuadro de
importaciones de crudos calcula los índices
correspondientes tomando como año de
referencia 1890
3) en los cuadros siguientes figuran los
principales protectores y consumidores de
petróleo (y, además, España) en 1982
a) Calcula los índices de productores tomando
como referencia España.
b.- Calcula los índices de consumidores
tomando como referencia los Estados Unidos.
4) El siguiente cuadro representa el cambio
medio anual del dólar desde 1977 hasta 1983
(con relación a la peseta)
LA PRESENTACION DE LOS NUMEROS___________________________________________
62
B) ÍNDICES ELEMENTALES PONDERADOS
Ya hemos hablado en el Tema 3 de la media
aritmética ponderada, en la que aparecían
unos números, llamados pesos, que servían
para dar una mayor o menor importancia a los
valores del conjunto estadístico. También aquí
al tratar de los índices aparece con frecuencia
la necesidad de combinar dos o más índices
elementales simples papa construir un índice
ponderado que los relacione.
Así, por ejemplo, si tenemos el precio pt de un
artículo determinado y la cantidad CL del
mismo producido en un periodo t y, por otro
lado, conocemos el precio po y la cantidad Co
del mismo artículo en el tiempo de referencia
to, podemos hallar el índice relativo del valor
de dicho artículo (entendiendo por valor el
producto del precio por la cantidad) tendremos
y, teniendo en cuenta las propiedades de las
fracciones, el cociente anterior se puede
escribir como un producto de dos cocientes
lo que nos dice que el índice del valor es igual
al producto del índice del precio por el índice
de la cantidad.
C) ÍNDICES SINTÉTICOS
En general, los índices elementales aportan
poca información en la economía a gran escala
donde se juega con multitud de datos. Por este
motivo han sido los economistas quienes han
creado los índices sintéticos que combinan
toda una gama de precios y. Al iniciar este
capítulo de los índices hemos tornado como
sugerencia el celebre IPC, en este no
interviene un solo articulo, sino una gran
cantidad de ellos.
Se podrían calcular los precios relativos o
índices de cada uno de los artículos o bienes
(comida, vestido, vivienda, transportes...),
pero esto nos daría tal cantidad de índices
(unos que subirían mucho, otros poco, otros
que bajarían que seria materialmente
imposible sacar una idea clara de la variación
de los precios de un ano con relación al año
anterior. Por este motivo interesa un solo
Índice que sintetice el conjunto de todos ellos.
No hace falta hacer hincapié en que la
elaboración de un índice de estas
características lleva aparejadas una serie de
dificultades tales como:
• Elegir el valor central que resuma mejor y
deforme menos la información.
LA PRESENTACION DE LOS NUMEROS___________________________________________
63
• Establecer las ponderaciones más adecuadas.
• Decidir que bienes o artículos intervienen en
el mismo.
• Determinar el precio de los artículos que
varían a lo largo del año.
5.2.2. EL IPC
Para que to hagas una idea de la complejidad
ponemos a continuación una lista de los
artículos que intervienen, con sus
ponderaciones, correspondientes, en el cálculo
del IPC (según el sistema antiguo).
Recomendamos consultar el Anuario de INE
para ver el cuadro completo de los artículos
que intervienen.
Estos pesos fueron sustituidos recientemente
(finales de 1985) po, otros nuevos de acuerdo
con una estadística efectuada por el INE sobre
los hábitos de consumo de los españoles. En
un gráfico de la primera pagina de este
capitulo se recogen las nuevas ponderaciones.
En palabras de un director del INE:
LA PRESENTACION DE LOS NUMEROS___________________________________________
64
"Para actualizar las ponderaciones del IPC se
ha realizado desde abril del 80 a abril del 81
una nueva encuesta de precios familiares... en
la que han colaborado durante un ano una de
cada 400 familias españolas (unas 24.000 en
total)... ", y en otro lugar "Hoy día la
elaboración de un buen índice de precios de
consumo exige un dispositivo técnico muy
perfeccionado, que mide, a su vez, el nivel de
calidad de la estadística de los países. El
principio es muy sencillo: se trata de comparar
en dos momentos del tiempo to que cuesta en
dinero un conjunto homogéneo de bienes y
servicios. Ahora bien, esto obliga a estimar
cual es la composición del consumo de la
población... ".
Generalmente a los trabajadores nos
aumentan el sueldo cada ano. Pero esto no
quiere decir que aumentemos el poder
adquisitivo, V2 que esto depende de varios
factores como el aumento del IPC, la
depreciación de la peseta, etc. De una manera
un poco simplista, podríamos decir que la
relación entre el aumento de sueldo y el del
IPC nos da la variación (perdida o aumento)
del poder adquisitivo: si el tanto por ciento de
aumento salarial es superior al tanto por ciento
de aumento del IPC se produce un auge del
poder adquisitivo y una disminución en caso
contrario.
Puedes sacar algunas conclusiones con los
datos que te ofrecemos a continuación sobre el
IPC y el salario mínimo:
LA PRESENTACION DE LOS NUMEROS___________________________________________
65
Como vemos, estos dos índices no coinciden;
además no tienen las mismas propiedades.
Puesto que ambos están basados en la media
aritmética, adolecen de los defectos de ésta,
ya vistos anteriormente,
Para el cálculo de los índices sintéticos se
utilizan las medias aritmética, geométrica o
armónica, y a veces combinaciones de ellas.
Vamos a dar un ejemplo de utilización de la
media aritmética ponderada para el calculo de
índices sintéticos.
Ejemplo:
LA PRESENTACION DE LOS NUMEROS___________________________________________
66
Supongamos, para simplificar, que en el
calculo del IPC intervienen cuatro conceptos A,
B, C y D, de los que conocemos sus precios po
en el año de referencia to y sus precios pt en el
año t, así como las ponderaciones o pesos q
atribuidos a cada uno de ellos. Representamos
todos estos datos en este cuadro:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
67
PRENSA Y EDUCACIÓN MATEMATICA
ANTONIO FERNANDEZ CANO
LUIS RICO ROMERO
Fernández Cano, Antonio y Luis Rico Romero (1992),
"Potencialidad matemática de las diferentes unidades
de contenido en los texto: de prensa escrita" y
"Elementos matemáticos explícitos en la prensa
escrita", en Prensa y educación matemática, Madrid,
Síntesis (Matemáticas: cultura y aprendizaje, 29),
pp. 63-130 y137-182.
“Siempre que de nosotros se apodera el
sentimiento, de armonía a él se apegan
mágicamente los detalles, como la última
pincelada…”
E. Jünger, Radiaciones.
En el capitulo anterior establecimos 11 tipos
distintos de unidades de contenido para los
textos de prensa escrita. Estas unidades de
contenido, solas o en combinación, organizan
la información que se transmite mediante la
prensa.
Si consideramos la información general que se
transmite mediante la prensa podemos
diferenciar cinco grandes categorías
informativas: Noticias. Publicidad, Opinión,
Agenda y Pasatiempos.
Prácticamente toda la información que
transmite la prensa se puede incluir en una de
esas categorías. Las unidades de contenido son
las diferentes formas de organizar las
categorías anteriores.
Pasamos a considerar la potencialidad
específica de cada uno de estos tipos en la
enseñanza- aprendizaje de las matemáticas.
4.1. TITULARES
Un titular es un resumen de lo esencial, o de lo
más destacable, de una noticia. Suele aparecer
como encabezamiento de la noticia y en
tamaño mayor, ocupando uno o dos renglones.
La habilidad de algunos periodistas está en
condensar un titular en el mínimo número de
palabras; por lo general este no suelen tener
más de 20.
La función de un titular es anticipar o resumir
lo esencial de una noticia; por este motivo se
incluyen los datos o hechos claves de la noticia
y un enjuiciamiento de los mismos.
Así, en el titular del ejemplo, los datos incluyen
la mayor parte del titular; Único juicio que
aparece está en el término “invasión”.
Esta misma noticia en un periódico pro-iraquí
no hubiera empleado ese término.
Los datos o hechos pueden venir expresados
mediante números y cantidades. o bien
mediante la descripción de objetos.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS
TEXTOS DE PRENSA ESCRITA
La invasión iraquí eleva un 15%
el precio del crudo en los
mercados internacionales
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
68
El secretario general del V Centenario
asegura que Granada tendrá el
protagonismo que merece en 1992
En este titular hay muchos datos, tres de ellos
numéricos, y el juicio está en la expresión o
“protagonismo que merece”. En este otro
titular:
La Cruz Roja suprime toda
indumentaria
militar en los miembros de la
institución
no hay datos numéricos, pero si hechos. El
enjuiciamiento viene dado por el verbo
“suprime”. En este caso podía haberse escrito
“elimina” o “prohíbe”, juicios más duros o
descalificadores, o bien “reemplaza”,
“prescinde”, que dan una idea menos
conflictiva.
El que aparezcan datos numéricos en un titular
no quiere decir que la información sea más
precisa. De los dos ejemplos anteriores, el
segundo titular es más preciso que el primero.
Con la información numérica quedan mejor
delimitadas sólo aquellas partes del titular
afectadas por números, pero esto no hace -en
principio- más precisa la noticia.
En los titulares aparecen unos hechos escuetos
y una o dos relaciones entre esos hechos;
conjuntamente forman un juicio e intentan
transmitirnos una idea global sobre una
noticia. Los titulares no llegan a elaborar un
concepto, sino solo su aspecto más
destacable. Hasta no tener la noticia completa,
desde el punto de vista conceptual, un titular
comprende sólo hechos y alguna relación
importante entre ellos. Aunque el titular tenga
una expresión muy literaria:
DINERO CON OLOR A VINO
se ajusta a transmitir unos hechos y una
relación entre los mismos.
Conviene considerar que los titulares no
afectan solo a las noticias, las diferentes partes
y secciones de un periódico también se
distinguen entre si mediante titulares;
igualmente pueden aparecer titulares en los
anuncios.
Desde el punto de vista procedimental los
titulares ponen de manifiesto una buena
capacidad de síntesis. El mejor titular es el que
expresa con menos palabras la idea
fundamental de una información. Se puede
estimular a los alumnos a sintetizar noticias
elaborando titulares: para ellas, y discutiendo
cuales son los más acertados. También puede
seleccionarse el titular más adecuado entre
varios, comparando lo que dicen varios
periódicos; finalmente, se puede pedir el
desarrollo de una noticia de acuerdo con lo que
dice un titular.
Son tres tipos de actividades que permiten
mejorar las capacidades de interpretar,
resumir y comparar informaciones.
Si los empleamos como fuentes de información
se pueden plantear cuestiones a partir de un
titular y probar a obtener nueva información en
base a los datos aportados por el titular.
Este trabajo tiene que ver con la invención de
preguntas y el enunciado de problemas.
¿Cuántas preguntas significativas es capaz de
plantearse un alumno ante la lectura de un
titular? ¿Cuántas de esas preguntas tienen
sentido atendiendo al contexto de la
información? ¿Cuántas pueden responderse?
¿Qué otros datos son necesarios para lograr
una respuesta?
Estas actividades forman parte de las fases
iniciales en cualquier estrategia para la
resolución de problemas.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
69
En los titulares aparecen con frecuencia
números y cantidades, índices porcentajes;
comparaciones y relaciones entre
características; frecuencias y valores medios:
El estado tuvo un superávit de 60,000 millones
de pesetas en noviembre.
El Banco de España ganara más de 100.000
millones en 1988
La detección precoz del cáncer de mama tiene
un éxito del 75%
El aumento de la tensión en el Golfo provoca
de nuevo la calda de las bolsas y la subida del
crudo.
También pueden aparecer algunos términos
con significado matemático, de uso común,
como superficie, longitud, peso, capacidad,
producto, división, cuadrado, cubo pirámide,
volumen, etc.
Un buen ejercicio de reconocimiento puede
consistir en localizar todos los términos
matemáticos que aparezcan en los titulares de
un periódico, en día determinado.
Cuando haya que redactar titulares se pueden
poner condiciones complementarias como la de
no emplear términos matemáticos, o utilizar
uno, dos más de ellos.
Dentro de los titulares de un periódico hay uno
especialmente destacado, que es su cabecera.
En la cabecera de un periódico aparecen una
serie de Datos fundamentales, que
proporcionan información sobre la historia del
periódico, su dirección, su precio y su
orientación editorial. Los datos de la cabecera
permiten plantear cuestiones y ejercicios
numéricos interesantes.
4.2. NOTICIAS ESCRITAS
El grueso de información que se transmite por
la Prensa diaria puede catalogarse, según
hemos dicho, en cinco apartados generales:
Noticias, Publicidad, Opinión, Agenda y
Pasatiempos.
Las noticias narran los acontecimientos
cotidianos más destacados, o que son más
interesantes para una sociedad determinada.
Las noticias constituyen uno de los núcleos
fundamentales de la prensa diaria y una de sus
razones principales de existencia. La sociedad
necesita conocer los hechos o acontecimientos
que se han producido recientemente y, cu
algunos casos, su evolución y conclusión. Por
todo ello necesita información sistemática, que
presente los datos más relevantes de los
acontecimientos y que permita un
enjuiciamiento o una valoración de ellos.
Las noticias de la Prensa hacen una selección
de lo más destacable, dentro de lo cotidiano, y
ofrecen a los lectores sus aspectos más
interesantes. Las noticias suelen aparecer
clasificadas en grandes apartados mediante
criterios temáticos, en los que se tiene en
cuenta la mayor o menos proximidad del lugar
en el que se produce la noticia con el área de
difusión prioritaria del periódico y también su
concordancia o adaptación para la promoción
de determinado tipo de valores éticos o
morales.
Con ligeras variaciones de terminología,
resumiendo a veces dos o más epígrafes en
uno solo, las noticias suelen aparecer
agrupadas bajo las siguientes denominaciones:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
70
La mayor o menor extensión de la noticia; el
detalle con el que se desarrolla; la coherencia,
claridad y precisión con la que esta
presentada; su acompañamiento por
elementos gráficos que resaltan algunos
aspectos destacables de la información; el
enjuiciamiento y valoración que se desprende
de la exposición de los hechos son, todos ellos,
elementos valiosos que delimitan y configuran
la noticia.
Mediante estos elementos se expresa la
importancia que los redactores del periódico
conceden a la noticia y, por tanto, del interés
que puede presentar para los lectores a los que
va dirigida la información.
Una misma noticia puede recibir tratamientos
muy diferentes, y de hecho los recibe, según la
mayor o menor cercanía física, intelectual o
moral que pueda presentar con sus lectores
potenciales.
Las Noticias no aparecen en todas las páginas
de un periódico, o al menos no en el sentido en
el que venimos empleando el término de
noticias. Hay páginas dedicadas solo a Opinión,
a Publicidad, a Agenda o a Pasatiempos.
Lo más usual es que en una misma página
aparezca, al menos, información de dos de
estas categorías, pero es cierto que las Noticias
se suelen concentrar en determinadas páginas.
Hay periódicos que concentran más sus
noticias, mientras que otros las presentan más
dispersas.
Si dividimos el número de páginas en las que
aparece al menos una noticia por el número de
páginas totales del periódico tenemos el
porcentaje de páginas con noticias, que suele
oscilar entre un 60 y un 75 por 100, en
promedio, para diferentes periódicos.
También los periódicos varían en el número de
noticias que transmiten. En principio, a mayor
numero de paginas mayor número de noticias,
pero el número total de noticias, como
unidades de información diferenciadas no es,
por sí sólo, un dato relevante.
La extensión y el detalle con el que la noticia
se desarrolla el espacio -que se le asigna- es
un dato más revelador sobre el tratamiento
que un periódico hace de la noticia en cuestión.
La medida directa de la extensión de una
noticia viene dada por el número de caracteres
que se emplean en ella. Tabulando las noticias
de un periódico según su extensión, podemos
tener una medida de la finura y la capacidad
de análisis con la que un periódico transmite
las noticias.
Este proceso es complicado y nosotros lo
reemplazamos por tres índices:
En los cuadros que aparecen a continuación
tabulamos los datos obtenidos sobre cinco
periódicos durante una semana con relaciòn a
las noticias, Diario, ABC, 16 AL 22 de
noviembre de 1987.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
71
De la comparación de los datos podemos
observar que el porcentaje de paginas con
noticias oscila entre un 50 por 100, que en
números redondos es, lo que corresponde al
diario ABC, hasta un 75 por 100,
aproximadamente el promedio del Diario.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
72
Esto no indica nada sobre si hay mayor o
menor numero de noticias, o sobre si éstas
están más o menos desarrolladas. Si indica un
grado de estructuración interna del material
del periódico y una delimitación de las distintas
informaciones que lo componen.
El Ideal y el Ya presentan una regularidad
considerable sobre este porcentaje. Y, por los
datos obtenidos, parece usual ocupar alrededor
de los dos tercios de las páginas de un
periódico con noticias.
Otro dato importante es el índice de noticias
por página. Los valores más bajos los tiene el
diario ABC con un promedio semanal de 2,6
noticias por página, mientras que el diario Ya
tiene un promedio de 3,8 noticias por página.
Un mayor índice indica menor desarrollo de las
noticias, si bien esta relación habría que
matizarla también con el porcentaje de
ocupación de la página por las noticias.
Pero, en principio, si es valido suponer que un
mayor número de noticias por pagina -en
igualdad de circunstancias- supone un menor
desarrollo de las noticias correspondientes.
Los índices de ocupación oscilan entre 2,2
(valor mínimo) y 4,3 (valor máximo); sin
embargo, las frecuencias de las que se
obtienen estos valores medios y que no
aparecen tabuladas, pueden oscilar entre 1 y
.4.
La comparación que hemos realizado de cinco
diarios nacionales durante una semana es un
modelo de actividad que se puede desarrollar
en una clase de estadística o de ciencias
sociales, indistintamente.
Otra actividad consiste en comparar las
diferencias de tratamiento que distintos medios
hacen de una misma noticia.
En lo que sigue presentamos la información
transmitida por cinco diarios: ABC, El
Independiente, El País, El Sol, e Ideal, sobre
una misma noticia: La votación en el
Parlamento de la República Democrática
Alemana para establecer la fecha de su
integración en la República Federal Alemana, el
día 24 de agosto de 1990.
Elaboramos una ficha que abarca todos los
aspectos relevantes (indicadores) de la noticia
y que nos va a permitir comparar las distintas
informaciones.
Noticia: Votación en el Parlamento de la RDA
para establecer la fecha de su integración en la
RFA.
INDICADORES
Datos básicos:
I. Fecha establecida: 3 de octubre de 1990.
2. Resultado votación: 294 a favor, 62 en
contra, 7 abstenciones.
Problema planteado:
3. Determinar fecha adecuada para la
integración política de la RDA en la RFA.
Datos del problema
4. Ruptura de la coalición gobernante en la
RDA el 20 de agosto.
5. 12 de septiembre: Conferencia 2 + 4 en
Moscú sobre negociación para concluir
implicaciones de la derrota de Alemania en la
II Guerra Mundial.
6. I y 2 de octubre: reunión ministros Asuntos
Exteriores de la Conferencia de Seguridad y
Cooperación Económica Europea para tratar la
unificación alemana.
7. 7 de octubre: XLI aniversario de la RDA.
8. 14 de octubre: elecciones para los gobiernos
de los nuevos estados federales surgidos de la
RDA.
9. 2 de diciembre: elecciones en la Alemania
unificada.
10. Artículo 23 de la Constitución de la RFA
autoriza integración automática de nuevos
estados federales que lo soliciten.
11. Partidos en el Parlamento actual de la RDA:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
73
Unión Cristiano Democrática (CDU); Partido
Socialdemócrata (SPD), Unión Social Alemana
(DSU); Liberal; Comunistas (PDS).
Opciones:
12. Unificación inmediata (DSU).
13. Unificación 15 de septiembre (SPD).
14. Unificación 14 de octubre (CDU).
15. Oposición a la unificación (PDS).
Solución:
16. Unificación el 3 de octubre de 1990,
presentada por DSU, SPD, CDU y Partido Libre
Democrático.
Otras decisiones adoptadas
17. Aprobación ley electoral para próximas
elecciones en la Alemania Unificada.
Otros dato
1.8. Población: RFA 61 millones habitantes.
RDA 16 millones habitantes.
19. La RDA se constituye en 5 nuevos estados
federales.
20. Otros antecedentes del proceso de
unificación alemana.
Valoración político:
21. Pone en marcha el desenlace formal de la
unificación.
22. Despeja una incógnita social y económica.
23. Establece un marco legal conocido.
24. Abre perspectivas de inversión económica.
25. Supone un éxito del gobierno de la RFA.
26. Lleva consigo la desaparición de la RDA.
Temas pendientes:
27. Concluir tratado de unificación.
Otras cuestiones:
28. Hora de aprobación del acuerdo.
29. Necesidad de adaptar la RDA al nuevo
modelo federal.
30. 144 diputados de la RDA formarían parte
del Bundestag.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
74
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
75
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
76
La vista de la información que aparece en cada
uno de los diarios y del listado anterior, se
puede elaborar el siguiente cuadro.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
77
Aparte están las valoraciones políticas que
acompañan a la noticia, y que se expresan
mediante el uso de diferentes términos como:
anexión, unificación, reunificación,
desaparición, dejara de existir, etc.; también
aparecen consideraciones sobre implicaciones
para el futuro.
La matriz de unidades de información que
componen esta noticia pone de manifiesto que:
a) No hay dos noticias totalmente coincidentes.
b) Las diferentes noticias coinciden sólo en el
dato básico de la fecha.
c) Ninguna noticia cubre totalmente la matriz.
Las conclusiones de este análisis parecen
claras. Toda noticia escrita se puede
descomponer en una serie de unidades de
información, formadas por que datos generales
básicos; una cuestión o cuestiones destacadas;
datos para poder abordar la cuestión; opciones
posibles; desenlace de la cuestión; otras
decisiones y datos complementarios;
valoración del desenlace; cuestión; pendientes
y otras cuestiones relacionadas.
Cada una de esas unidades puede componerse
de uno o varios indicadores de información, y
su desglose constituye la matriz que permite
analizar la noticia y comparar sus diferentes
versiones.
La matriz de análisis de una noticia permite
conocer y controlar todos elementos
constituyentes.
Pasamos ahora a considerar el distinto peso
que tiene el conocimiento matemático en las
diferentes clases de noticias.
En las noticias de economía, en las políticas y
en los deportes suelen, aparecer datos y
relaciones cuantitativas considerables, que
permiten utilizarlas como generadoras de
conocimiento aritmético, estadístico e incluso
algebraico.
También pueden aparecer datos numéricos en
las noticias de Sociedad, procesos y
Espectáculos; pero en estos casos también
conviene analizar las relaciones de carácter
lógico que se establecen entre los distintos
componentes de la noticia, para considerar la
coherencia de la información y utilizarlos como
generadores de conocimiento lógico.
En las noticias de Cultura y Ciencia,
independientemente del tópico específico que
desarrollen, es más usual encontrar cuerpos y
figuras geométricas como elementos
constituyentes de la noticia o bien esquemas,
gráficas y representaciones en las que se
ofrece un modelo de las ideas presentadas en
la información.
Teniendo en cuenta que en este campo no se
pueden establecer leyes, generales, si es cierto
que hay una mayor probabilidad de localizar
determinados contenidos matemáticos en unas
categorías que en otras.
Al comparar la misma noticia en dos o más
periódicos podemos lograr que nuestros
alumnos:
- Obtengan una idea más completa de la
noticia.
- Reconozcan todos los elementos o unidades
de información que constituyen la noticia.
- Establezcan semejanzas y diferencias entre
las distintas versiones.
- Diferencien entre información e interpretación
en una noticia.
- Detecten lagunas e incoherencias en la
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
78
noticia.
Sólo para alumnos de los grados superiores de
Secundaria puede tener sentido elaborar la
matriz de información de una noticia.
Todas estas consideraciones son válidas,
independientemente del contenido particular
que tenga la noticia y su utilización específica
de conceptos procedimientos matemáticos.
Finalmente, conviene destacar que, salvo para
noticias muy relevantes, es muy difícil
conseguir que cinco periódicos compartan una
misma noticia de manera que se puedan
considerar como versiones diferentes de una
misma información.
Es mucho menos frecuente de lo que se
supone el que una noticia tenga entidad
suficiente como para ocupar un espacio en
varios periódicos, lo cual indica cierto grado de
autonomía y capacidad de selección de la
información por parte de los consejos de
redacción.
4.3. ANUNCIOS
La Publicidad constituye otro de los grandes
bloques informativos que podemos encontrar
en la Prensa diaria. Por Publicidad entendemos
todo tipo de información que se incluye de la
Prensa a petición de alguna de las partes
afectadas y con el fin de hacer llegar esa
información de manera rápida y directa a un
colectivo determinado, o bien a la totalidad de
los lectores. La Publicidad puede generarse por
un particular, una empresa o una institución
pública o privada. Dentro de la publicidad se
encuentran los anuncios, edictos y
convocatorias.
En el caso de los anuncios se oferta o se
demanda un producto. El producto ofertado
puede ser un determinado punto de vista,
sostenido desde una opción política o religiosa,
sobre un suceso concreto; en estos casos, y
para no confundir con una opinión aceptada
por el periódico suele encabezarse con el
epígrafe de publicidad.
Pero lo más usual es que un anuncio tenga
carácter comercial, de oferta o de demanda.
También podemos calificar de anuncios la
comunicación de noticias de carácter
particular, como pueden ser las esquelas.
Los edictos y convocatorias se verán más
adelante, razón por la cual limitamos ahora
nuestra consideración a lo que hemos
denominado anuncios.
Los anuncios aparecen concentrados en
determinadas páginas especialmente dedicadas
a ellos o bien intercalados con otras
informaciones. La distribución de los anuncios
es también un rasgo característico de cada
periódico.
Presentamos la distribución de anuncios en los
cinco diarios ya considerados en el apartado de
noticias, y para el mismo periodo de tiempo.
Hemos distinguido tres niveles:
- Páginas que incluyen sólo anuncios, por lo
general sólo uno.
- Páginas de Anuncios por Palabras.
- Páginas con anuncios, pero con otras
informaciones.
Finalmente, hemos determinado el porcentaje
de páginas afectadas por anuncios respecto del
total de páginas de cada número o edición. Los
resultados son los siguientes:
ABC. 16 al 22 de noviembre de 1987.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
79
Es prácticamente imposible sacar conclusiones
definitivas de estos datos.
Sin embargo, la elaboración de las tablas nos
ha permitido realizar una observación más
minuciosa, que nos lleva a varias
consideraciones.
El fenómeno de la publicidad es complejo y en
él convergen intereses muy diversos. En los
anuncios encontramos desde la página doble
que utiliza cual gran empresa para
promocionar un producto nuevo, para lo cual
los elementos gráficos y el texto que emplea
son muy sencillos y directos, hasta los textos
reducidos de los anuncios por palabras. En
medio cabe toda la gama de combinaciones de
elementos gráficos y texto en diferentes
tamaños formatos.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
80
También se observa que la publicidad es un
fenómeno cíclico. No tiene la misma densidad
todos los días, alcanzándose unas crestas y
unos valles según días. Tampoco coinciden los
altos y bajos en todos los periódicos.
Si bien puede verse que el domingo es un día
con más publicidad, destaca el hecho de que
hay más páginas completas, pero el porcentaje
de ocupación de páginas no es muy diferente.
El jueves parece ser, al menos para el período
estudiado, un día también favorecido por la
publicidad.
Para los periódicos de difusión nacional, el
sábado es el día con menor peso de publicidad,
cosa que no ocurre con la prensa local.
Este análisis seria interesante realizarlo para
períodos más largos, ya que no cabe duda que
la publicidad tiene un fuerte componente
económico, y por tanto esta sometido a
diversos ciclos: semanal, estacional y ciclos
económicos más amplios.
Seguramente hay una correlación alta entre el
fenómeno de oferta demanda que se
manifiesta en los anuncios y otros indicadores
económicos.
Los anuncios pueden clasificarse según el
sector de la economía al que corresponden.
Otra observación importante es la poca
variabilidad que tienen algunos periódicos en
su porcentaje de páginas por anuncio.
El diario Ya oscila entre el 40 y el 51 por 100;
esta regularidad también se observa en la
propia distribución de los anuncios en la
composición de las páginas: la maquetación
elegida coloca siempre los anuncios en la mitad
inferior, y no suele haber muchos anuncios por
página. En el diario El País tampoco hay una
gran variación del porcentaje (el valor inferior
para el domingo se debe a que aquí no hemos
contabilizado las Ofertas de Empleo como
Anuncios); en este caso la maquetación es
diferente, y son muy pocas las páginas que no
quedan afectadas por anuncios.
Otros periódicos presentan una variación
mucho mayor en sus porcentajes: ABC entre el
60 y el 80 por 100; Diario 16 entre el 37 y el
57 por 100 e Ideal entre el 58 y el 91 por 100,
para días consecutivos. Con estos datos se
ponen de manifiesto ciertas regularidades y
cierto estilo de componer las páginas de los
periódicos y de distribuir las noticias en ellos.
Las páginas dedicadas a Anuncios por Palabras
también son un buen indicador de la difusión
del periódico, aunque en este caso conviene
considerar los tamaños relativos de cada
página, ya que a mayor tamaño también
mayor número de anuncios. Esta claro que los
diarios nacionales tienen una cantidad superior
de anuncios por palabras que los diarios
locales.
El número total de estos anuncios y los
criterios para su clasificación ofrecen otras
tantas posibilidades para su estudio.
Las matemáticas estudian regularidades, las
cuantifican, e intentan establecer relaciones
entre ellas. Esto es lo que nosotros
pretendemos hacer con esta reflexión sobre los
Anuncios, si bien hay que tener en cuenta que
el campo de trabajo que se puede desarrollar
tiene posibilidad de ser más amplio y profundo.
Las actividades escolares que se pueden
proponer relativas a los Anuncios son muy
variadas:
• Localizar el anuncio de un mismo producto en
varios periódicos y establecer las semejanzas y
diferencias.
• Estudiar la evolución de los anuncios de un
mismo producto en un determinado periódico,
durante un período de tiempo determinado.
• Estudiar las características generales que
pueden tener los anuncios de un tipo
determinado.
• Elaborar un anuncio estándar para un
producto determinado, utilizan de los
elementos gráficos y la cantidad de texto que
se indique.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
81
• Reconocer, de entre varias opciones, cual es
la más adecuada para anunciar un
determinado producto.
• Señalar sesgos, errores o falsas pistas en el
anuncio de un producto.
La elaboración de un anuncio también indica
capacidad de síntesis, para expresar los rasgos
más destacables o más atractivos de forma
escueta y concisa. En este caso la
incorporación de elementos gráficos puede ser
importante, y supone una variante que no se
contemplaba en las noticias.
4.4. FOTOGRAFÍAS
La fotografía es uno de los elementos gráficos
más utilizados en la prensa escrita. Salvo raras
excepciones, la fotografía aparece como
acompañamiento de una noticia o de un
anuncio y le sirve como apoyo o soporte visual.
Hay periódicos que emplean la técnica de dar
algunas noticias en dos fases: en primer lugar,
transmiten una fotografía acompañada de un
pequeño comentario o pie y, en segundo lugar,
hacen un comentario escrito más extenso, y
continuación.
También siguen esta técnica algunos periódicos
para componer las primeras páginas, en las
que se incluyen las noticias más importantes,
acompañadas de una ilustración gráfica.
Otros periódicos, como es el caso de ABC,
tienen una sección grafica en la que se
adelantan la información mediante una o varias
fotografías y un breve comentario, lo cual no
excluye el desarrollo posterior de la misma
Las fotografías de la prensa diaria reproducen
personajes y hechos, principalmente. La
fotografía del personaje: políticos, hombre de
negocios, deportista, artista o delincuente,
suele ser una foto de archivo, y no tiene rasgos
matemáticos destacables, salvo sus
dimensiones y la mayor o menor simetría la
foto.
Las fotografías que reproducen hechos son, en
su mayoría, fotos de agencia que suelen
coincidir en más de un periódico y tratan de
reproducir algún momento destacado del
hecho que se describe, o en su defecto una
foto anterior del mismo hecho o del lugar en el
que ocurre; en estos casos se indica que se
trata de una foto de archivo.
Con estas fotografías no se trata de transmitir
ninguna simetría, ni regularidad, ni sensación
de espacio ni ningún otro tópico o
consideración matemática, sino principalmente
“la emoción” del momento.
Tampoco estas fotografías suelen tener unos
valores, matemáticos considerables. Por otra,
la baja calidad de la reproducción suele hacer
que sea difícil captar muchos detalles en las
fotos de la prensa.
Suelen estar mucho más cuidadas las
fotografías que aparecen en los suplementos
semanales, en las que si es posible visualizar
cuerpos, figuras y relaciones geométricas.
Igualmente ocurre con las fotografías que
acompañan a los anuncios. Lo usual es que
aparezca la reproducción del producto que se
ofrece, o en todo caso algún grupo de personas
disfrutando del producto. De nuevo es en los
suplementos semanales en los que aparecen
composiciones gráficas más elaboradas y que
permiten encontrar patrones y regularidades.
Las fotografías de la ilustración contienen una
serie de elementos geométricos que visualizan
conceptos y relaciones geométricas muy
claras.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
82
Surgen de aquí una serie de actividades
posibles de carácter matemático a desarrollar
mediante las fotografías. En primer lugar caben
consideraciones generales de tipo lógico:
asociar fotografías y noticias; elaborar un pie
adecuado para una fotografía; eliminar
información incorrecta para una fotografía;
ordenar la secuencia que forman varias
fotografías para dar una noticia, etc. Todas
estas actividades son interesantes y sirve para
cultivar la atención y la capacidad de
observación de los alumnos.
Las mismas actividades se pueden considerar
para las fotografías que acompañan a un
anuncio, con la diferencia de que ahora la
libertad de actuación de los alumnos es mucho
mayor, pudiéndose emplear grades dosis de
inventiva para elaborar o diseñar un anuncio
adecuado.
En segundo lugar tenemos la elaboración de un
archivo de fotografías en las que se visualicen
distintos conceptos matemáticos. Debe ser el
Profesor el que disponga de elementos gráficos
suficientes como para motivar a sus alumnos,
pero las actividades las deben realizar ellos
mediante trabajo en equipo. Proponer como
tarea para la semana buscar y recortar todas
las fotografías de prensa -periódicos y revistas-
en las que aparecen objetos con una
determinada forma geométrica (pirámide,
cubo, cilindro, prisma, circulo, cuadrado, etc.),
proporciona gran cantidad de material que
sirve para elaborar un mural, en el que los
datos y relaciones más relevantes del concepto
geométrico en cuestión quedan visualizados
con claridad.
La comparación entre la información
desarrollada por los diferentes murales permite
poner en evidencia las relaciones mal
contempladas o los conceptos deficientes,
proporciona una base para su discusión y
aporta otras informaciones que llevan a
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
83
consideraciones correctas.
Los resultados más destacables de los murales
elaborados para un determinado concepto
deben quedar expuestos en clase durante un
tiempo, y deben utilizarse como referencia
obligada en cualquier repaso que se realice
sobre el concepto en cuestión. Esta
información puede enriquecerse con nuevas
fotografías que aparezcan con posterioridad y
que supongan una mejora evidente del
material disponible.
En tercer lugar esta la realización de
fotografías por parte de los alumnos. Las
experiencias realizadas hasta el momento
(González, 1989) indican que se trata de una
actividad motivadora y creativa, con alumnos
de 12 años en adelante.
La motivación la proporciona el hecho do
realizar una excursión para visitar una
localidad cercana y conocer el entorno en el
que se enmarca. La actividad consiste en
buscar motivos, tanto en la población como en
su medio, que puedan servir como ejemplos o
modelos de un concepto o una relación
matemática. La capacidad de invención de los
alumnos es sorprendente, pero más
sorprendente es aun ver como se estimula su
capacidad para observar el entorno con visión
matemática y como aumenta su habilidad para
abstraer el aspecto geométrico de una
situación cotidiana.
No se trata en este caso de una actividad que
se pueda realizar con frecuencia ya, que es
necesario que cada alumno disponga de una
pequeña maquina fotográfica e, igualmente,
emplear una jornada completa -o al menos
media jornada- en recorrer una población y
fotografiaría desde todos los ángulos posibles.
Ahora bien, nuestra experiencia en este campo
nos dice que la actividad se prolonga con la
búsqueda de títulos o lemas para cada una de
las fotografías, con la valoración de los lemas
que presentan los compañeros, con la
preparación de una exposición del mejor
material conseguido y, si es posible, con la
valoración y concesión de premios a los
mejores trabajos.
Esta no es una actividad que surja del material
de prensa ya elaborado, pero si es una
actividad que permite contemplar las
fotografías como soporte de una noticia, aun
cuando la noticia en cuestión sean uno o varios
conceptos matemáticos.
Finalmente, queremos destacar que el empleo
de fotografías en la Prensa diaria tampoco es
un fenómeno aleatorio, sino que esta sometido
a unos esquemas y a una estructura, igual que
el resto de los elementos que constituyen el
material diario de la prensa escrita.
Que un periódico es un producto altamente
estructurado es algo casi evidente, pero no
deja de sorprender la cantidad de
regularidades que se obtienen cuando
realizamos su observación sistemática.
Hemos contado el número de fotografías que
aparecen en las Noticias de los cinco diarios
que venimos utilizando como muestra, durante
cada uno de los días de una semana.
Igualmente hemos contado el número de
fotografías que aparecen en los Anuncios. A
continuación hemos dividido el primer dato
entre el número total de noticias
correspondientes, obteniendo así el índice de
noticias con fotografías diario. Luego hemos
dividido el segundo dato entre el número total
de páginas con anuncios y obtenemos el índice
de páginas con anuncios que incluyen
fotografía. En cada uno de los casos se observa
un tipo de regularidad.
ABC, 16 al 22 de noviembre de 1987.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
84
Si el primer índice lo simbolizamos por 11 y al
segundo por 12, la oscilación de cada índice en
cada diario viene dada en esta tabla:
Se observa que, con los datos utilizados, El
País y el diario Ya tienen mayor regularidad en
el uso de fotografías por página con anuncios,
mientras que Ideal y Ya tienen mayor
regularidad en el empleo de fotografías para
las noticias.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
85
Seguramente, un estudio más detallado y
durante un periodo más amplio, llevaría a
inferir regularidades más consistentes.
4.5. CONVOCATORIAS
Constituyen junto con los Anuncios, el grueso
de lo que hemos denominado Publicidad. Sin
embargo, se trata de un tipo de publicidad
diferente, ya que se refiere a la difusión
pública que la Administración, en cualquiera de
sus niveles, debe realizar de sus actuaciones;
incluimos aquí también las convocatorias y
ofertas de empleo que hacen las empresas u
otras entidades privadas.
Se trata de un tipo de información que suele
tener otros cauces y mecanismos de difusión
establecidos, como pueden ser los Boletines
Oficiales, las resoluciones, los tablones de
anuncios y cualquier otro medio para dar a
conocer una decisión, convocatoria o
información de carácter oficial o semioficial.
Toda esta información viene siendo costumbre
comunicarla públicamente, al menos en
aquellos casos en los que el número de
personas afectadas o interesadas por la
información hace aconsejable una mayor
difusión pública de la que consiguen los medios
oficiales de comunicación.
Bajo este titulo están comprendidos los Avisos,
Notas informativas, Concursos de Obras,
Convocatorias, Expedientes de expropiación,
Presentación de Candidaturas, Concursos
públicos para asignación de servicios o
adquisición de bienes, Edictos y muchos otros,
de los que en ilustración se presentan varios
ejemplos.
El interés específico que presentan es el de
ofrecer una primera oportunidad de contacto a
los alumnos con las comunicaciones de
carácter social, en donde es una entidad
administrativa, económica o cualquier tipo de
sociedad que transmite una información de
interés general, y que no responde a intereses
particulares.
Hay un análisis general de estas informaciones
que facilita su comprensión por parte de
alumnos en formación. Una posible ficha para
hacer el estudio de la información que contiene
una convocatoria, es la siguiente:
1. Entidad convocante.
2. Servicio o Área de gestión que hace la
convocatoria.
3. Fecha en que se acordó realizarla.
4. Objeto de la convocatoria-o comunicación.
5. Condiciones para intervenir, solicitar o
participar.
6. Material que hay que presentar.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
86
7. Lugar de presentación de la documentación
pertinente.
8. Calendario hábil de solicitud o reclamación.
9. Otras indicaciones.
No codas las convocatorias necesitan cubrir
todos los apartados, pero hay apartados de
especial relieve que aparecen en todos los
casos.
Una vez hecho el análisis de varias
convocatorias se puede pedir a los alumnos
que redacten una Convocatoria a partir de una
información determinada. También se les
puede pedir que detecten que información
relevante, la que falta en una Convocatoria de
la que se ha eliminado parte del texto.
O cual de entre varias opciones que responder
a un mismo objetivo, se adapta mejor al
esquema de una convocatoria y cubre mejor la
información.
Se puede aprovechar el análisis de estos
elementos informativos para que los alumnos
conozcan cuales son las principales entidades
de su localidad y de su Comunidad Autónoma
que hacen convocatorias, y cuales son los
objetivos usuales de las mismas.
Esto puede servir para conectar con el estudio
de las competencias y funciones que ejercen
cada uno de esos organismos. El contenido y
condiciones de la convocatoria suelen llevar
una serie de datos que se prestan a plantear
cuestiones relevantes y, en su caso, permiten
enunciar y plantear problemas inventados por
los propios alumnos.
Lo más interesante de este tipo de información
esta en la reflexión que permite realizar sobre
el mundo de la Administración. Sus
competencias, los órganos que las ejecutan y
la participación de los ciudadanos en la puesta
en marcha y ejecución de las decisiones
administrativas.
4.6. EDITORIALES
El tercer gran bloque de información que
constituye el contenido de la prensa escrita,
además de las Noticias y la Publicidad, es el
llamado Opinión.
Bajo la categoría de Opinión entran todas
aquellas informaciones cuyo objetivo consiste
en enjuiciar, valorar y emitir una calificación
ética, estética, moral, política, económica o
práctica de unos determinados hechos o
actuaciones.
La Opinión puede provenir del Consejo de
Redacción del periódico, en cuyo caso se suele
presentar como Editorial. Las otras dos formas
usuales son la opinión del especialista o
persona de reconocido prestigio, que se
expresa mediante un Artículo, o la opinión de
cualquier particular que se expresa mediante
una Carta.
Nos ocupamos aquí de los Editoriales, y en los
siguientes apartados trataremos los Artículos y
las Cartas.
El Editorial, o Editoriales, de un periódico es un
elemento estable y permanente del mismo,
que suele ocupar una determinada posición y
tiene un formato y una extensión que lo hacen
fácilmente reconocible en cada periódico. El
Editorial esta sometido a un patrón preciso en
cada diario, que facilita su identificación y sirve
para ejercer una de las funciones más
destacadas de la prensa diaria: contribuir a la
creación de un estado de opinión sobre los
temas relevantes que interesan a una
sociedad, o a un sector destacado de ella.
El editorial, que no tiene firma, expresa la
opinión de todo el equipo que redacta el diario
y de los intereses que representa y defiende.
En cada periódico suele haber una o varias
personas encargadas de preparar y mejorar las
sucesivas redacciones que se realizan de un
mismo editorial, pero hasta que no lo aprueba
el Consejo de Redacción, o el equipo delegado
para esta tarea, no puede darse por finalizado
el proceso. Su contenido suele versar sobre las
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
87
noticias de mayor actualidad en coordinación
con los temas prioritarios que constituyen la
línea editorial de cada periódico.
No hay limitaciones en cuanto a las noticias
que pueden formar parte del contenido de un
editorial y, de hecho, se pueden encontrar
editoriales sobre la práctica totalidad de los
temas informativos que aparecen en la prensa.
Pero lo específico en este caso no es dar la
información sino enjuiciarla y orientar al
público sobre las posibles consideraciones y
actuaciones que se pueden realizar y
emprender con relación al objeto de la noticia.
La misión de los editoriales es profundamente
didáctica y educativa, en el sentido más real
del término, y para ello debe utilizar los datos
y relaciones más significativos de entre los que
constituyen una noticia.
La extensión del editorial no es lo importante,
lo que hace un editorial valioso es la
coherencia de sus argumentos, la claridad de
su exposición y la contundencia en el
enjuiciamiento resultante y en el
mantenimiento de unos principios. La amplitud
de visión, el predominio de lo social sobre lo
particular del comportamiento responsable y
de los valores democráticos son algunos de los
elementos que deben predominar en un
editorial. No deben quedar excluidos los puntos
de vista y opciones más particulares pero, en
estos casos, debe explicitarse que se esta
defendiendo una determinada opción entre
otras posibles. La confianza de los lectores se
consigue cuando la defensa de los valores
sociales de carácter general se asume sin
subterfugios ni manipulaciones.
Un periódico puede producir uno, dos o tres
editoriales diarios; dependerá del interés
relativo de las noticias sobre las que conviene
emitir opinión el que haya uno o varios, y que
la extensión relativa de los mismos sea igual o
diferente.
El Editorial o editoriales, ocupa un espacio
permanente que no suele rebasarse. Los datos
relativos a la muestra de periódicos que
venimos utilizando para realizar nuestras
observaciones son los siguientes:
En la misma página de los editoriales suelen
aparecer los datos relativos a Empresa Editora,
Director, Subdirectores, Consejo de Redacción,
Responsables de Secciones, y todos los datos
necesarios para identificar la distribución de
competencias en la elaboración del periódico.
Al igual que con el resto de las noticias,
conviene entrenar a nuestros alumnos a que
analicen editoriales. En este caso los elementos
que conviene tener en cuenta son diferentes.
Desde nuestro punto de vista, el análisis de un
editorial debe abarcar los siguientes puntos:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
88
Son muchas las consideraciones que se pueden
desarrollar a partir de esos puntos. Nuestra
misión aquí consiste en recuperar y potenciar
el punto de vista adecuado para una
orientación matemática.
Una primera reflexión consiste en determinar
toda la información cuantitativa que aparece
en la noticia.
En segundo lugar, interesa considerar silos
datos señalados intervienen dentro de los
aspectos positivos o de los negativos,
destacando por qué esas cantidades vienen
afectadas por una valoración en uno u otro
sentido.
En tercer lugar conviene explicitar al máximo
la línea argumental que sustenta el juicio
crítico, diferenciando entre elementos lógicos y
los aspectos discutibles. Si en la
argumentación intervienen datos numéricos,
hay que asegurarse de que su empleo es
correcto y no se esta haciendo ninguna
manipulación numérica ni tampoco
interpretaciones inadecuadas.
Conviene cuestionarse también si los datos
utilizados son o no pertinentes para el tema en
discusión, si falta o sobra información, cómo
quedarían modificadas las conclusiones con
una pequeña variación de los datos o con un
dato nuevo, y si los datos forman parte
esencial o secundaria de la línea argumental.
Finalmente, en la valoración hay que distinguir
(cuando sea posible) entre una conclusión
derivada lógicamente de los pasos anteriores y
lo que una valoración moral o política, que
depende fuertemente del punto de lista del que
hace el enjuiciamiento. Ayudar al alumno para
que distinga entre elementos de una
argumentación lógica y elementos de una
valoración personal es contribuir a su
formación intelectual y moral.
No todos los editoriales serán adecuados para
todas las edades, ni tampoco los temas
interesan por igual. Un trabajo sistemático con
este material puede comenzarse en
Secundaria. Conviene tener también en cuenta
que, independientemente de la asignatura bajo
la que se realice este trabajo, la tarea que aquí
se propone es eminentemente interdisciplinar y
por ello debe realizarse bajo la coordinación de
varios profesores, entre ellos el de mate-
máticas.
La planificación de esta actividad permitirá a
los profesores comprobar que no sólo
comparten una tarea formar a unos mismos
alumnos sino que los métodos y conceptos de
los que se sirven son complementarios para el
dominio y conocimiento del medio social.
4.7. ARTICULOS
Para crear estado de opinión la Prensa diaria
no emplea solamente editoriales: Además de la
opinión del Consejo de Redacción hay otros
Puntos de vista importantes. También es
conveniente enjuiciar otros aspectos de
nuestro medio social, y no sólo aquellos que se
derivan de la actualidad inmediata.
Para genera un estado de opinión es necesaria
la aportación de diferentes interlocutor que
conozcan los temas que se debaten con
profundidad suficiente, con algún tipo de
especialización y disponiendo de información
destacada.
La presentación de diferentes interpretaciones
de las mismas cuestiones permite
contraponerlas, da lugar a un intercambio de
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
89
ideas y argumentos, promueve el debate y
obliga a apreciar con mayor nitidez la riqueza
de matices con los que pueden contemplarse
cada uno de los temas que interesan a la
opinión pública.
Para poder realizar esta función la prensa
diaria dispuso de una o varios secciones de
artículos, que pueden recibir distintas
denominaciones, Por lo general, hay una
sección fija y, en ocasiones, hay también
secciones especificas en algunos de los
apartados informativos.
Últimamente se viene estableciendo la
costumbre de dedicar unas páginas especiales,
con carácter monográfico, a un tema específico
un día determinado de la semana; en estas
páginas monotemáticas los artículos constitu-
yen una parte destacada. Los temas
deportivos, económicos, culturales, educativos,
científicos, sociales y de ocio, están entre los
más usuales de esas páginas especiales.
Los artículos de opinión suelen estar
redactados por un especialista, persona de
prestigio o periodista cualificado en la materia.
Además de los artículos de opinión, también
aparecen bajo este título trabajos de divulga-
ción que intentan transmitir al público no
especializado un resumen adecuado de alguna
información científica o técnica, que destaque
algunos aspectos curiosos, nuevos
descubrimientos o aplicaciones nuevas de
conocimientos ya existentes.
Su denominador común es que pueden ser
leídos por el lector no especializado y mediante
ellos se logra transmitir un tipo de información
útil poco difundida. Estos artículos no suelen
estar escritos por profesionales de la
información, sino por especialistas de los
campos correspondientes, si bien es frecuente
en la mayor parte de los temas que haya
periodistas altamente especializados.
Por sus características particulares están a
medio camino entre lo que aquí hemos
denominado noticias y lo que estamos
describiendo como artículos. No suelen ser
frecuentes en la composición general de un
diario, si bien en los suplementos especiales
son un elemento casi obligado.
Se pueden hacer consideraciones didácticas
sobre los artículos muy similares a las que
hemos hecho sobre los editoriales. El análisis
de un artículo puede hacerse siguiendo el
guión preparado para los editoriales, quizás
con la única variante de que los datos
relevantes del artículo pueden necesitar de un
desglose más detallado.
Determinar-la información cuantitativa que se
emplea en el articulo, las relaciones entre los
datos y la valoración que reciben; reconocer la
línea argumental que se desarrolla, si el
empleo de los datos es o no pertinente para los
argumentos, la carencia de datos o información
importante; valorar si las conclusiones se
derivan lógicamente de los argumentos
empleados, o si el peso de las consideraciones
morales o políticas es más importante a la hora
de establecer el enjuiciamiento de los hechos
que se comentan; son todos ellos aspectos
importantes a la hora de analizar un artículo.
Seguramente los artículos sirven mejor para
transmitir información cualificada que como
unidades de información o textos de prensa
escrita, útiles para iniciar a los alumnos en el
análisis y enjuiciamiento critico. Salvo para
temas especialmente significativos, que
conecten bien con alguno de los tópicos que se
estén trabajando en el aula, los artículos sirven
mejor como documentos de trabajo sobre un
asunto determinado que para realizar
reflexiones lógicas o conseguir un contexto en
el que tengan sentido problemas numéricos.
No es usual una información matemática se
convierta en noticia; cuando dispone de un
archivo con noticias como ésta se puede hacer
el planteamiento de la clase de matemáticas
directamente desde noticias de prensa.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
90
Finalmente, en un artículo de opinión, como el
de Juan Cueto, se emplea la noción
matemática de simetría y se juega con ella
para hacer una pequeña crítica social; en este
caso la motivación esta servida.
4.8. CARTAS
Junto con los Editoriales y los Artículos, la
sección de Cartas de los lectores completa el
apartado dedicado a Opinión dentro de la
Prensa escrita. Si el Editorial expresa la opinión
del equipo que elabora el periódico y de la
empresa que lo edita, y los Artículos recogen
diversas opiniones de especialistas y personas
de calificación destacada, la sección de Cartas
transmite la opinión del lector, de cualquier
lector.
La sección de cartas se utiliza con varias
funciones. En primer término puede ocurrir que
una persona este afectada directamente por
una noticia publicada en el periódico. A veces,
la noticia les parece incompleta, otras que está
tergiversada la información o malinterpretados
los datos, muchas veces es cuestión de un
matiz o de unas consideraciones incompletas, o
también puede ocurrir que se confirme alguna
conjetura adelantada al completar una
información. En todos estos casos el lector,
que participa de algún modo en la noticia,
ejerce su derecho a mejorar la información
emitida por el periódico. En ocasiones se puede
producir un debate porque distintas partes
afectadas continúen explicando su punto de
vista y desmintiendo el punto do vista
contrario.
La segunda función que se realiza con las
cartas es la de dar cauce a las quejas por el
funcionamiento deficiente de un determinado
servicio, público o privado. Esto ocurre,
independientemente de que el periódico se
haya manifestado previamente sobre la
adecuación y aceptabilidad del servicio
denunciado. De este modo se llama la atención
públicamente sobre una gestión incorrecta, lo
cual permite que todas las partes interesadas
tengan un conocimiento inmediato y
simultáneo del problema, y éste pueda
aclararse y, o procede, poner los medios
necesarios para remediarlo. En algunos casos
estas denuncias ponen sobre aviso a los
redactores del periódico señalándoles un tema
sobre el que conviene realizar un estudio más
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
91
detallado y elaborar una información más
completa. Pero aún en el caso en que ese
estudio no se realice, las quejas dan cauce a
un control público sobre los servicios de las
distintas administraciones que es conveniente
y necesario.
Como complemento hay que señalar que no
siempre se producen comentarios negativos
sobre el funcionamiento de los servicios; en
ocasiones el comentario es positivo y da lugar
a una felicitación.
Estas manifestaciones de los usuarios
contribuyen a mejorar la calidad del
funcionamiento administrativo y de servicios.
Un tercer lugar, las cartas suelen expresar
opiniones muy variadas sobre un tema de
actualidad, que no afecta directamente al
redactor de la carta. Estas cartas son las que
realmente dan el pulso de la opinión de los
lectores de un periódico sobre un tema.
Aunque parezca una actividad trivial y sencilla,
redactar una carta para un periódico
exponiendo un punto de vista determinado
sobre un tema de actualidad es una tarea
ardua y compleja.
En estos casos la opinión hay que expresarla
con brevedad, claridad y precisión, aportando
argumentos nuevos e interesantes que
destaquen aquellos rasgos que se quieren
poner de manifiesto, y esto, aunque parezca
sencillo no es fácil de conseguir, cuando no se
esta especialmente entrenado.
Aparte de lo que tiene de compromiso
personal, una opinión más explicada o
defendida se puede convertir en un argumento
a favor de aquello que uno quiere combatir;
por ello es importante que los argumentos
estén bien expresados, los razonamientos sean
coherentes, los datos están bien elegidos y las
conclusiones se deriven con claridad y
contundencia de la información disponible.
La cantidad y calidad de las cartas que los
lectores de un periódico envían sobre un tema
determinado son índices claros del interés y
actualidad que tiene la noticia, y de su peso
real en el área de información correspondiente.
Esto permite orientar a la redacción del
periódico sobre el tipo de información
complementaria que se necesita en cada caso.
Finalmente, hay una cuarta función de las
cartas de los lectores; se trata de aquellos
casos en que un lector está preocupado por un
tema que no es una, noticia de actualidad, y
sobre el que quiere emitir unas opiniones
meditadas. Se trata de una función idéntica a
la de los articulistas ya que introduce en la
prensa diaria temas de interés cultural o social,
o reflexiones políticas de carácter más general
o profundo que las que constituyen las noticias
cotidianas y sus comentarios. Hay cartas que
son realmente artículos escritos por un
particular, que o bien no es una personalidad
reconocida en el campo de opinión sobre el que
escribe, o también puede ocurrir que si lo sea y
quiera dar su opinión como un lector más,
aunque su firma preste un mayor peso a los
argumentos utilizados y las conclusiones
defendidas.
La sección de cartas de los lectores es una
sección muy importante que transmite el pulso
de la actualidad, de las valoraciones y temas
de interés y del grado de consenso o polémica
que se logra con algunos temas.
La actividad didáctica más específica en este
apartado consiste en la preparación y
redacción de una carta con relación a una
noticia determinada. El tema elegido debe ser
un tema de actualidad, sobre el que se
disponga de suficiente información y que haya
generado cierto grado de polémica. También
puede elegirse un tema científico del que se
quiera combatir algún concepto erróneo. Una
vez elegido el tema y asignada la redacción de
la carta a un grupo de cuatro o cinco alumnos,
se debe seguir un plan para la preparación del
material necesario y la redacción del
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
92
documento.
El plan de trabajo puede constar de los
siguientes apartados:
1. Elección del tema.
2. Datos relevantes sobre el tema y
descriptores.
3. Opiniones emitidas sobre el tema y
argumentos principales en cada caso.
4. Puntos fuertes y puntos débiles de cada uno
de los argumentos considerados.
5. Disconformidad con el estado de opinión
sobre el tema.
6. Nuevos argumentos y nueva información.
7. Nueva valoración y opinión que se deriva.
8. Conclusiones y redacción de la carta.
Hasta aquí no hay gran diferencia con la
preparación de un trabajo cualquiera en grupo,
salvo lo específico del tema. Pero en este caso
se trata de influir sobre el estado de opinión
que tengan los compañeros de clase sobre el
tema en estudio, por ello hay dos etapas más
que deben llevarse a cabo:
9. Distribución de la carta a todos los
compañeros de la clase.
10. Discusión pública de la opinión transmitida
por la carta.
11. Crítica del material y de las actuaciones.
12. Balance y valoración final.
De este modo se consigue interesar a los
alumnos sobre un tema de actualidad, se les
enseña a buscar información y argumentos que
apoyen un punto de vista determinado y a
exponerlos con claridad y coherencia; final-
mente aprenden a tener en cuenta otras
valoraciones de los mismos hechos y a sopesar
sus argumentos.
Desde el punto de vista específico de las
matemáticas interesan aquellos temas en los
que las valoraciones cuantitativas y los datos
numéricos aportados desempeñen un papel
clave tanto en la clarificación de la información
como en su valoración posterior.
4.9. DIBUJOS
En la clasificación de las unidades de
información en la prensa diaria hemos
considerado tres apartados relativos al
tratamiento o presentación gráfica de la
información, son los que hemos denominado
Fotografía, Dibujo y Graficas.
Por Gráficas entendemos los distintos tipos de
diagramas y técnicas de representación
estadística que se utilizan en la prensa diaria.
Entre las Gráficas y las Fotografías es donde
situamos la categoría que denominamos
Dibujo.
Por dibujo entendemos toda representación de
una información mediante métodos gráficos,
excluidos los diagramas, empleados para
representar relaciones numéricas, y las
técnicas fotografías.
El dibujo tiene por misión dar la representación
de un objeto, persona o situación, de manera
que sea fácilmente reconocible; la gráfica tiene
un carácter más abstracto y su función no es
visualizar sino representar relaciones.
El empleo del dibujo en la prensa presenta una
gran variedad de matices y se utiliza para
muchas funciones diferentes.
Mientras que el uso de la fotografía esta
centrado en las Noticias y la publicidad, es más
raro su uso en Opinión y muy poco frecuente
en Agenda y Pasatiempos, sin embargo los
dibujos se emplean indistintamente en las
''cinco categorías de información.
El chiste y la caricatura constituyen un
elemento de opinión importante en, la prensa,
y tanto el uno como la otra entran dentro de la
categoría de dibujo. Igualmente, los esquemas
y mapas son dibujos que transmiten una
información del tipo que denominamos agenda.
Podemos distinguir diferentes tipos de dibujos
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
93
en la prensa diaria.
En primer lugar están los Retratos, que
reproducen a una persona y reemplazan la
fotografía del personaje; en aquellos medios
que utilizan sistemáticamente el retrato
pueden introducirse matices en la imagen del
personaje presentando una imagen más
bondadosa, agresiva, dura, hierática, o
cualquier otro rasgo que se quiera destacar.
En el otro extremo está la caricatura del
personaje, que pone de relieve algún rasgo
cómico o critico.
En segundo lugar podemos considerar las
Reproducciones de un objeto o situación, que
también son una alternativa de la fotografía. El
dibujo permite hacer cierta interpretación de la
realidad que reproduce destacando algunos
rasgos o elementos del objeto o situación, o
bien añadiendo elementos gráficos que no
corresponden a ninguna realidad visual pero
que sirven para enfatizar o destacar algún
aspecto de aquello que se reproduce.
Muchas veces la Reproducción mejora la
fotografía, ya que transmite la misma
información pero incluye elementos destacados
que reflejan la opinión que se quiere dar en la
noticia o en el anuncio. Los dibujos pueden
favorecer la imagen de aquello que se quiere
promover, o empeorar la de aquello que se
quiere perjudicar.
A veces la Reproducción es el complemento de
una información escrita, mientras que en otras
es una simple ilustración, que mejora el diseño
de la información pero no modifica, ni siquiera
matiza, su contenido.
En tercer lugar encontramos los Comics. Los
Comics incluyen los Chistes, historietas
infantiles, tiras cómicas e incluso narraciones
para adultos cuyo soporte fundamental es el
dibujo. En la prensa diaria no suelen ocupar
mucho espacio, pero suelen constituir
secciones fijas.
Las dos funciones principales que realizan son
las de entretener y hacer una critica
desenfadada de alguna costumbre social o
noticia de actualidad.
Los apartados de Comics constituyen parte
popular y conocida de cada diario, y sus
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
94
autores son auténticos profesionales del
periodismo, capaces de encerrar una
información, con sus elementos fundamentales
y un enjuiciamiento global de la misma, en
unos cuantos dibujos y palabras.
En cuarto término están los dibujos meramente
ilustrativos, de carácter más o menos artístico,
que acompañan y embellecen alguna unidad de
información, pero que no aportan ningún dato
complementario ni suponen una matización o
valoración de ella.
El que no tengan interés informativo no quiere
decir que estos dibujos no cumplan funciones
convenientes en un diseño adecuado del
periódico.
Aunque todos los dibujos, necesariamente,
esquematizan, simplifican e interpretan aquella
realidad que quieren reproducir, no cabe duda
que los tipos de dibujos considerados hasta
ahora incluyen ciertas dosis de realismo y en
ellos se intenta que siempre puedan
reconocerse las personas u objetos que se
reproducen.
Sin embargo hay una segunda clase de dibujos
en lo que no se intenta producir un objeto sino
representar un territorio a grandes rasgos y,
sobre todo, destacar algunas relaciones
importantes entre los elementos considerad-
ores en una reproducción.
Nos encontramos así con los Esquemas,
Planos, Mapas y Diagramas, en los que los
elementos gráficos y de representación
continúan teniendo un papel muy importante,
pero sirven a una función distinta que en los
casos interiores.
Con un Esquema se proporciona una imagen
visual de las sucesivas fases de un fenómeno
natural, mecánico o social. En un esquema
deben estar claros sus diferentes
componentes, las relaciones que se establecen
entre ellos en alguna secuencia de acción.
Con el esquema se quiere informar de las
causas que llevan a modificar las relaciones
mutuas de una situación y a seguir un
desarrollo o evolución.
Los esquemas nos permiten conocer dónde hay
que actuar para acelerar, o retrasar o alterar
un proceso. Un buen esquema supone una
capacidad de abstracción considerable y un
conocimiento profundo del fenómeno que se
describe. Los esquemas son un instrumento
didáctico de primer orden y ofrecen un
complemento adecuado para la comprensión y
dominio de una información.
Los planos son la representación gráfica de un
territorio en el que destacan el tamaño y la
posición relativa de una serie de elementos
importantes para el que recibe la información,
así como su ubicación en un contexto más
amplio y su orientación, si procede.
En la prensa aparecen con frecuencia los
planos de viviendas en los anuncios, planos de
edificios cuando se da una información
arquitectónica, planos de un sector de una
ciudad, de un barrio e incluso de la ciudad
completa.
En cada caso el detalle de la reproducción y la
extensión de territorio real representado
responden a las necesidades informativas de la
noticia que se transmite.
Un plano nunca aparece aislado de su contexto
informativo y sirve para visualizar las
relaciones mutuas entre los elementos
destacables del territorio que describe la
información, así como la posición concreta de
los elementos relevantes.
El plano esta relacionado con el urbanismo y la
arquitectura, y su empleo en la prensa
responde a necesidades informativas dentro de
esta escala; en ocasiones los planos
reproducen un objeto en perspectiva o varias
perspectivas de un mismo objeto.
Un mapa también es la representación gráfica
de un territorio, en el que los elementos que se
destacan son los del relieve terrestre, tales
como ríos, costas, montañas, islas, etc., o bien
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
95
los núcleos de población, sus divisiones
administrativas y las principales vías de
comunicación.
Los mapas se relacionan con la geografía y las
divisiones políticas. Su aparición en la prensa
es muy frecuente para transmitir información
climatológica, estratégica, política, económica
o cientifica.
Los mapas pueden ser locales, nacionales,
regionales, continentales o mundiales, si bien
la graduación entre unos y otros puede ser
todo lo amplia que se quiera.
A veces se combinan dos o más mapas de un
mismo territorio con lo que se mejora la
visualización de una región y, al mismo
tiempo, contextualizan la situación descrita.
Tanto los planos como los mapas son
instrumentos potentes que sirven para
posicionar una noticia a escala geográfica o
urbana, para entender gran parte de los
condicionantes del suceso que se relata o de la
información que se transmite, y para localizarlo
en el caso de que se quiera observar directa-
mente o actuar en relación con él.
Además de los diagramas de tipo cartesiano,
que vamos a considerar a continuación, en la
prensa se utilizan otro tipo de diagramas
distintos de los que representan relaciones
numéricas. Nos referimos a los diagramas que
dan una visión gráfica de los elementos
destacados de una noticia o una información y
de las relaciones que se consideran entre ellos.
Con un diagrama no se intenta reproducir
ningún objeto, ni fenómeno, ni territorio, sino
destacar cuáles son las conexiones que nos
interesan entre ellos. En estos casos podemos
decir que un diagrama as la expresión gráfica
resumida de una noticia.
Los diagramas tienen una importancia
creciente en la representación de conceptos,
dando lugar a muy diversas técnicas de
representación tales como los diagramas de
flujo, los ordinogramas, grafos de distintos
tipos y los planos conceptuales (Novak).
Puesto que los conceptos hemos dicho que son
unidades de información fuertemente
interconectadas, una forma de visualizar un
concepto consiste en representar sus
elementos relevantes mediante un dibujo, un
símbolo o una palabra, y señalar las relaciones
entre los elementos mediante líneas.
Esto es lo que hace esencialmente un
diagrama: levantar el plano conceptual más o
menos parcial de lo más destacable de una
información. Si además hay qua indicar un
orden, una prioridad o una secuencia de
acción, esto suele conseguirse distribuyendo
los elementos de arriba hacia abajo o de
izquierda a derecha, a indicando con flechas el
orden de relación.
Los elementos gráficos pueden aparecer
combinados, y para ello se emplean diversas
técnicas de combinación. Las dos más usuales
son las viñetas y la composición.
Una viñeta es un dibujo que forma parte de
una secuencia y transmite sólo una parte de
una información. La información completa la
constituyen varias viñetas conjuntamente.
La secuencia de las viñetas es la misma que la
de la escritura: de izquierda a derecha y de
arriba a abajo; cuando se quiere seguir una
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
96
secuencia distinta hay que destacarlo con
elementos gráficos complementarios. Muchas
veces sobre todo en los Comics la información
no concluye con las viñetas de un día, sino que
la historia continúa a lo largo de un período de
tiempo más amplio.
La composición combina distintos elementos
gráficos, y a diferentes escalas, para dar una
visión más completa de una noticia.
Así, en la siguiente ilustración se observa el
dibujo de una autopista (con su mapa
correspondiente anidado) y el esquema:
secuencial explicativo de un aparatoso y
cruento accidente, todo ello coordinando
distintos aspectos de una misma información.
Hacer una buena composición gráfica para una
noticia indica un nivel técnico, de dominio de la
información que se está transmitiendo, y un
nivel
En muchas ocasiones un dato determinado, por
ejemplo la temperatura media, varia de un
lugar a otro y, a su vez, varia a lo largo del
tiempo en nuestro ejemplo diariamente. Si
consideramos un conjunto de datos ordenados
con algún criterio se tiene un listado, que
informa de una situación. Una tabla consiste en
un esquema que organiza listados de datos
obtenidos sobre criterios o características
diferentes para una misma situación de refe-
rencia.
El País, 31-VIII-90
Así, en la ilustración aparece una tabla
formada por cuatro listados de datos
diferentes, que responden a distintos criterios,
y que en conjunto informan sobre la
implantación de las televisiones privadas en
una serie de ciudades.
Cuando los datos de la tabla relacionan
sucesos con el momento en el que van a
ocurrir tenemos los horarios y calendarios.
Los horarios están referidos a sucesos que
ocurren durante un día y los ejemplos más
conocidos son los horarios de puesta y salida,
del sol, de programas de TV, de llegadas y
salidas de transportes públicos y, en general
de las actividades de cualquier servicio social
relevante en la localidad o localidades de venta
del periódico. Si un diario nacional, o regional,
tiene diversas ediciones regionales, o locales,
los horarios constituyen un dato relevante que
se a apta a la localidad o región y que, por
tanto, varían de un sitio a otro.
Los calendarios relacionan las fechas en las
que van a ir sucediéndose o han sucedido una
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
97
serie de acontecimientos, organizados según
un orden previo o posterior. Los calendarios de
competiciones deportivas, o de los pasos
sucesivos que desarrollan un acuerdo político,
están entre los ejemplos usuales.
Tanto los horarios como los calendarios nos
proporcionan información sobre el desarrollo
temporal de un determinado suceso o
actividad, permitiendo conocer cada una de sus
componentes o etapas, y el momento de
comienzo y, aproximadamente, su duración.
Relacionados también con el tiempo están los
aniversarios o efemérides, que es una sección
en la que se recuerdan sucesos importantes,
ocurridos en el día de la fecha a lo largo de la
historia.
Dentro de este mismo orden de ideas, en los
datos de sociedad suelen incluirse los
aniversarios de nacimiento y muerte de
personalidades relevantes y otras efemérides
importantes.
Los listados de ciudades y de las temperaturas
destacables en ellas a lo largo de un día (a
veces de períodos más amplios) constituyen
una información permanente en la prensa
presentada mediante una tabla. Es costumbre
concluir los datos sobre temperaturas máxima
y mínima de cada localidad, junto con alguna
indicación sobre la situación atmosférica
predominante.
Últimamente se está estableciendo la
costumbre de informar sobre el estado general
de la mar y sobre las mareas.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
98
El listado de teléfonos útiles que incluye los
servicios de policía, bomberos, urgencias
médicas, hospitales, oficinas de información,
transportes y algunos otros servicios públicos
importantes constituyen un tipo de tabla que
tiene un interés local informativo destacado.
También suelen aparecer en cada uno de los
diarios diferentes índices de materias, tratadas
en general o en una sección determinada, que
permiten localizar rápidamente una
información. Estos índices dan una visión de
las secciones contempladas y de cómo está
organizada la información en un determinado
periódico. Los anuncios por palabras llevan
también una clasificación exhaustiva de tópicos
que permiten localizar rápidamente aquello,
que nos interesa.
Los resultados de las competiciones deportivas
y de los juegos de azar más populares
constituyen igualmente parte de la información
que se organiza y transmite mediante tablas.
En el caso de la información deportiva el grado
de sofisticación para permitir el máximo de
comparaciones relativas entre los resultados
actuales, o bien de estos con resultados
anteriores, puede alcanzar una complejidad
considerable, y hay algunas tablas que
permiten acumular nuevas informaciones sobre
la base de los datos disponibles.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
99
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
100
Conviene recordar que los resultados de las
competiciones no se limitan a los de los
partidos de fútbol, sino que abarcan a muchos
otros deportes, pero quizás la riqueza de
relaciones y el nivel de análisis que se realiza
sobre los resultados de fútbol hacen que estas
tablas de resultados destaquen por encima de
las demás, al menos en la prensa de nuestro
país.
La sección de Bolsa constituye una sección fija
en los periódicos, dentro de la información
económica, y hace un empleo sistemático y
casi exclusivo de tablas con datos numéricos y
porcentajes. A su vez, dentro de esta sección,
hay una serie de subsecciones, cada una de las
cuales suele llevar más de una tabla. Entre los
apartados usuales en la información de Bolsa
se encuentran los siguientes:
En cada caso aparece la información
económica relevante y los índices
correspondientes que permiten conocer las
variaciones experimentadas y las tendencias
de esa variación.
De la información de Bolsa suele destacarse el
Índice General de variación, que proporciona el
pulso general de la jornada.
Renta fija. -Valor del ECU.
Renta variable. -Cambio del dólar.
Mercado continuo. - Paridad de la peseta.
Fondos de
inversión.
Futuros
financieros.
- Billetes de banco.
- Interbancario.
Monedas de oro. - Ampliaciones de
capital.
Eurobonos. - Bolsas extranjeras.
Seguro de cambio. - Materias primas.
Divisas. - Metales.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
101
La interpretación de cada una de estas tablas
supone unos conocimientos económicos y
aritméticos considerables, razón por la cual no
se pueden utilizar indistintamente, ni con
cualquier nivel de preparación.
En el currículo actual para la Enseñanza
Obligatoria la posibilidad de utilizar las tablas
económicas corresponde a los niveles de
Secundaria. El trabajo con la mayor parte de
ellas debe estar orientado para adquirir una
formación económica básica, que prepare a los
alumnos como consumidores y permita que
utilicen una serie de cálculos aritméticos para
obtener nuevos datos e interpretar el
significado económico de los existentes.
Con las tablas de la sección de Bolsa se
estudian exhaustivamente las relaciones entre
las principales magnitudes que caracterizan la
situación económica y financiera y su variación
en períodos cortos.
Es muy interesante comparar las secciones de
Bolsa de diferentes periódicos y ver que
epígrafes generales comparten, cuáles son las
tablas en las que coincide la información y
cuáles no. Cuando la información no es
coincidente conviene observar en que
consisten las diferencias, ya que pueden
presentarse variaciones por la mayor o menor
extensión en las listas de datos, por la
aparición de diferentes listas, o por listas que
establezcan nuevas relaciones entre datos
anteriores.
La Bolsa no es la única información que
aparece en la sección de Economía, aunque si
constituye un elemento fijo dentro de ella.
Cualquier información económica suele ir
acompañada de tablas en las que aparecen las
diferentes magnitudes que se consideran, las
distintas situaciones bajo las que se valora
cada magnitud y los valores correspondientes.
Sin pretender ser exhaustivos señalamos que
es usual encontrar tablas en las informaciones
relativas a:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
102
En realidad las diferentes magnitudes
económicas que interesa considerar pare
describir una situación y hacer comparaciones
entre diferentes dependencias administrativas
y localidades, o las mismas dependencias y
localidades en momentos diferentes, dan lugar
a una serie de cantidades y porcentajes cuya
representación mediante una tabla facilita su
comprensión, permite hacer comparaciones y
derivar nuevas relaciones e interpretaciones de
los datos disponibles.
Aunque el predominio de las tablas en la
información de Economía es obvio, su empleo
no queda reducido a esta sección informativo.
Los Resultados Electorales y las Encuestas de
Opinión son dos tipos de noticias que hacen un
uso obligado de tablas para informar de los
resultados de una consulta, expresar
variaciones en los resultados y proporcionar un
método rápido de hacer comparaciones entre
los resultados y sus diferencias.
La utilidad de la elaboración y aplicación de
encuestas, con la obtención de resultados y su
tratamiento para la iniciación escolar a la
Estadística, es suficientemente conocida como
para que no necesite de más comentarios.
Los resultados de unas elecciones permiten
emplear nociones y conceptos matemáticos
dentro del Área Social, y sirven para explicitar
cuál es la formulación matemática de cada uno
de los sistemas electorales más difundidos.
Suele ser un ejercicio interesante comparar los
resultados diferentes que pueden obtenerse
según el sistema electoral considerado y para
unos mismos datos de votación. El trabajo
“Fórmulas electorales basadas en sucesiones
de divisores”, (Ramírez, 1989), presenta un
desarrollo, detallado de estas ideas y plantea
cuestiones interesantes, en la que se conjuga
el uso y aplicación de las matemáticas con las
implicaciones sociales de esta utilización.
De nuevo la sistematización y claridad que
ofrecen las tablas para apreciar los datos y
relaciones destacables de una situación se
ponen aquel de manifiesto.
Tanto las Encuestas como los resultados de
unas Elecciones no son más que ocasiones
especialmente importantes en las que se ponen
de manifiesto las costumbres y preferencias
sociales, y esto se realiza presentando varias
opciones a una misma población para que haga
la elección de una de ellas.
La cuantificación de la elección para cada una
de esas opciones permite obtener unos
porcentajes de aceptación y a partir de ahí, y
de acuerdo con una reglamentación previa,
derivar unas consecuencias que pueden ser
normativas o simplemente descriptivas.
Otras veces los datos no se obtienen por
expresión de una elección entre varias
opciones sino contabilizando los sucesos
producidos en un determinado ámbito y
respecto de unos criterios previamente
establecidos. De esta forma diversos
organismos administrativos elaboran
estadísticas que organizan en forma de tablas.
Ejemplos relevantes son los relativos a
Enfermedades y Epidemias, Delincuencia,
prestación de Servicios Públicos, cambios en
los hábitos y costumbres sociales, en los
sistemas de producción, transporte o
comunicación, evolución de poblaciones y
muchos otros parámetros importantes para
conocer el desarrollo de una sociedad en una
variedad de aspectos relevantes.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
103
El uso de tablas para transmitir información es
prácticamente ilimitado.
Las tablas son un recurso para proporcionar de
forma resumida los datos más destacables de
un suceso, convirtiéndolo de este modo en
información. La tabla ofrece una técnica
sencilla para organizar una ficha con lo más
significativo de un acontecimiento, de un
proceso o un resultado; por ello las tablas no
se limitan a información económica, ni siquiera
a información cuantitativa, sino que su empleo
puede llevarse a cabo con cualquier unidad de
información en la Prensa escrita.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
104
Como caso extremo tenemos el use de una
tabla para hacer un poco de Numerología en la
sección de Pasatiempos.
La comprensión e interpretación de tablas
encuentra en el material de Prensa un campo
muy amplio, con ejemplos que abarcan la
práctica totalidad de usos y aplicaciones de las
tablas como sistema de organización de
información y técnica para expresar relaciones
entre datos. La mayor o menor belleza y
habilidad técnica en el diseño y presentación
puede resultar, en ocasiones, un elemento útil
para la comprensión de los datos que se
presentan mediante una tabla.
Por otra parte, cualquiera de las Noticias de
Prensa, como vimos en su momento, se puede
adaptar y dar lugar a una tabla con la
información más relevante. Aprender a
construir una tabla que organice los datos más
significativos de un determinado núcleo
informativo es una de las actividades más
productivas que puede aprenderse a partir del
material de Prensa.
Como complemento de las tablas aparecen las
Gráficas, que sirven para expresar relaciones
entre dos variables mediante la disposición en
un cuadrante. Las gráficas más usuales son
aquellas en las que se relaciona la variable
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
105
tiempo con otra magnitud distinta: Índice de la
bolsa, IPC, precio de un producto determinado,
etc.
Aunque los valores que toma la variable son
discretos la representación se hace continua,
razón por la cual la gráfica tiene un trazado
poligonal, que técnicamente se denomina
polígono de frecuencias.
En multitud de ocasiones se representan sobre
un mismo cuadrante dos o más gráficos que
permiten comparar la evolución de las distintas
magnitudes.
Con este tipo de gráficas se visualiza
claramente la evolución de una magnitud
determinada en un período de tiempo
establecido. Esa evolución viene caracterizada
por unos aumentos y unas disminuciones, que
suceden en espacios de tiempo concretos,
teniendo en cuenta además que los cambios se
pueden producir con mayor o menor rapidez.
Los aumentos y disminuciones son fácilmente
reconocibles en los tramos crecientes y
decrecientes de las gráficas, junto con los
máximos y mínimos de la representación,
mientras que la velocidad del cambio viene
dada por el gradiente en cada uno de los
tramos de la representación.
Las gráficas suponen un modelo para
representar la relación entre dos variables con
carácter general, una de cuyas aplicaciones
prácticas más frecuentes se presenta al
estudiar una variable a lo largo del tiempo. Es
precisamente el hecho de que una de las
magnitudes consideradas sea el tiempo lo que
lleva a una representación continua.
Un segundo tipo de gráficas usuales en la
Prensa son los diagramas de barras en los que
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
106
suelen representarse la frecuencias, u otros
valores cuantitativos de una variable discreta,
que no tiene por que depender del tiempo.
Sobre cada uno de los valores de la variable se
levanta un rectángulo de altura proporcional a
su frecuencia, o al valor numérico
correspondiente. La variación de unos valores
a otros se puede enfatizar o disminuir tomando
la unidad, con la que se expresan las
frecuencias, mayor o menor; esto es lo que
hace que una misma información pueda
presentar unos rasgos más o menos acusados,
según convenga o no destacar las diferencias
entre los distintos valores de la variable.
Otras veces las barras se representan
horizontalmente, por necesidades de
composición o para destacar algún dato de la
variable.
Los diagramas de barras y los histogramas son
técnicas de representación gráfica procedentes
de la Estadística, cuyo origen está en la
necesidad de visualizar fácilmente las
frecuencias absolutas o relativas de una
variable discreta cualesquiera. Los ejemplos
que aparecen en la Prensa recorren la misma
gama de situaciones que ya hemos comentado
para el caso de las tablas.
Resulta un ejercicio muy práctico pedir a los
alumnos de los primeros cursos de Secundaria
que recorten las gráficas que encuentren en el
periódico de casa durante una semana. La
cantidad de material que se obtiene por este
procedimiento es muy considerable, y suele
abarcar la mayor parte de los diagramas de
barras, polígonos de frecuencias y otros
sistemas de representación. Una primera
actividad consiste en clasificar las gráficas
obtenidas y distinguir entre los distintos tipos
que aparecen, estableciendo criterios que
permitan diferenciar unos de otros; más
adelante se podrán determinar las variaciones
posibles dentro de una misma clase, e incluso
las alternativas más utilizadas para expresar
una relación particular.
Los Pictogramas, Diagramas de Sectores y
Cartogramas son otras tantas normas de
representar las frecuencias u otros índices
numéricos de una variable cualitativa.
Los Pictogramas son una variante de los
diagramas de barras, en los que cada valor
numérico no queda visualizado por un
rectángulo de altura proporcional al número
que representa sino por una figura o dibujo
que esquematiza la variable considerada.
En los pictogramas que expresan datos sobre
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
107
poblaciones suele ser el dibujo esquematizado
de un hombre o una mujer el que representa la
frecuencia; cuando se trata de un determinado
producto se emplea un logotipo reconocible del
mismo; en el caso de la ilustración los
rectángulos se convierten en chimeneas
contaminantes, y así sucesivamente.
Los alumnos pueden inventar pictogramas
adecuados para expresar informaciones que
vengan dadas mediante diagramas de barras y
comparar los resultados obtenidos por cada
uno do ellos a partir de una misma información
de partida.
Recíprocamente, pueden expresar en
diagramas de barras representaciones que
aparezcan mediante pictogramas. Aunque
parezcan muy similares hay algunas
diferencias. Las frecuencias influyen solamente
en las alturas de los rectángulos de los
diagramas de barras, es decir, afectan a una
sola dimensión. Sin embargo, con relación a
los pictogramas las frecuencias influyen sobre
dos dimensiones, ya que se mantiene la forma
del dibujo con el que se representan las
frecuencias variando su tamaño; muchas veces
no está claro si la frecuencia corresponde a la
altura, a la anchura o a la superficie del dibujo,
pudiendo prestarse a equívocos, ya que la
representación será distinta según se tenga en
cuenta una u otra opción.
Los Diagramas de Sectores son un método
muy empleado en la representación de los
porcentajes relativos de los diferentes valores
de una variable discreta.
La forma usual consiste en dividir un círculo en
sectores proporcionales a los diferentes
porcentajes considerados, coloreando cada uno
de ellos de un modo distinto. Es un sistema
muy empleado con algunas variables geográfi-
cas, políticas, demográficas o económicas. En
este caso el valor numérico de cada variable es
proporcional con un ángulo, siendo el valor
total el del ángulo completo.
Una variante es la que se emplea para dar los
resultados de unas elecciones políticas, en los
que el círculo queda reemplazado por una
semicorona circular, que representa la
disposición física de los escaños en la cámara
correspondiente.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
108
Un cartograma combina un mapa o piano y
tramas diferentes, que indican frecuencias
distintas de una variable determinada, que
depende o tiene en cuenta las diferentes partes
o secciones del plano o mapa en cuestión.
Los cartogramas no son un recurso muy
frecuente en la información de prensa, pero si
tienen importancia y, en algunos casos,
ofrecen una imagen visual muy clara de la
distribución territorial de un determinado
producto o de la densidad de una población.
Todos estos sistemas de representación
implican el dominio de determinados
convenios, el empleo de diversas técnicas y la
elección de unos códigos para expresar las
variables en juego. Por eso mismo las
actividades didácticas dirigidas al
conocimiento, interpretación y utilización de los
distintos modelos gráficos deben estar bien
diseñadas y convenientemente escalonadas
como para que el dominio por parte de los
alumnos quede garantizado.
Las representaciones gráficas son un medio
frecuente de presentar información de carácter
general, por ello mismo es importante que el
ciudadano medio disponga de los
conocimientos generales que garantizan una
interpretación correcta de estos recursos.
Los cuadros de doble entrada son, igualmente,
una forma usual de organizar información
relativa a dos variables discretas; en este
sentido son una variante más de las tablas.
Cuando una relación entre dos variables se
hace compleja, la tabla simplifica su expresión
y permite localizar los datos con rapidez y
precisión.
En la sección de Pasatiempos el uso de tablas
es muy frecuente para presentar gran parte de
los juegos que allí aparecen.
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
109
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
110
Las diferentes versiones emplean un sistema
de coordenadas, en el que algunos cuadros no
se utilizan. La letra que corresponde a cada
casilla queda controlada por la coincidencia
entre su valor en la palabra horizontal (absci-
sas) y la palabra vertical (ordenadas).
También los juegos de ajedrez emplean un
sistema de coordenadas para indicar la
posición y el movimiento de cada una de las
piezas.
Hay muchas otras variantes de juegos que
utilizan como marco de presentación un
diagrama cartesiano de cuadriculas, bien
añadiendo datos o bien realizando movimientos
a partir de los datos disponibles. La ubicación
de los nuevos datos o la posición que deben
ocupar después del movimiento se expresa
mediante cualquier variante que permita
emplear un sistema de coordenadas.
Existen versiones infantiles de estos tipos de
juegos, menos complicadas y que proporcionan
una rápida familiarización con su empleo, como
ocurre con el conocido juego de “hundir la
flota” o “los barcos”.
Todas estas variantes de juegos suponen una
primera aproximación al diagrama cartesiano,
permiten realizar actividades de identificación
de elementos o de posiciones a partir de las
coordenadas correspondientes.
De todos modos conviene tener en cuenta que
estos juegos no están pensados para aprender
a trabajar con las relaciones entre conjuntos y
sus propiedades sino que, simplemente,
utilizan los mismos convenios básicos.
Tanto las tablas como las gráficas y cuadros de
doble entrada son métodos empleados
sistemáticamente en matemáticas y que, por
tanto, llevan implícitos conceptos y
procedimientos que las matemáticas han
desarrollado exhaustivamente. En el caso de
las gráficas es donde esto se aprecia con
mayor nitidez, ya que todos los medios de
representación utilizados proceden de la
Estadística, que los ha estudiado y
sistematizado.
Aunque estos métodos tengan una
fundamentación matemática precisa conviene
tener en cuenta que esto no se hace explícito
cuando se emplean en la Prensa. La utilización
en Prensa de tablas, gráficas y cuadros es,
usualmente, un recurso para identificar con
claridad los elementos claves de una
información, organizarla y transmitirla de la
forma más rápida y precisa posible.
Estos métodos no son un fin en la Prensa
escrita, sino sólo un medio, pero no cabe duda
de que se trata de medios muy potentes y que
tienen un empleo sistemático en el tratamiento
de la información.
Quizás se trate de los conocimientos conceptos
y procedimientos matemáticos más explícitos
que tienen un uso permanente en la Prensa.
Por ello mismo ofrecen una posibilidad
indudable de iniciar y organizar el trabajo en
matemáticas a partir de los contenidos de
prensa.
4.1 1. SIGNOS, SEÑALES, SIMBOLOS
Para muchos autores los signos son objetos
reales, configuraciones gráficas o expresiones
verbales, por medio de los cuales se quiere
evocar, visualizar o representar alguna idea o
concepto.
La noción de signo es fundamental dentro del
ámbito de la comunicación, pero la variedad de
contextos en los que aparece hace difícil su
manejo y permite que se preste a cierta
ambigüedad, Muchos de los comentarios que
hemos hecho en las secciones anteriores se
refieren a distintos tipos de signos que
aparecen en la prensa.
En términos generales, son tres los elementos
que estructuran la noción de signo:
POTENCIALIDAD MATEMÁTICA DE LAS DIFERENTES UNIDADES DE CONTENIDO EN LOS TEXTOS DE
PRENSA ESCRITA___________________________________________________________________
111
a) Una base sensible, que da cuerpo al signo.
b) Una conexión con otra entidad, que es
aquella a la que se supone da expresión el
signo.
c) El reconocimiento por parte de uno o varios
sujetos de la conexión.
La estructura anterior se resume, según
Saussure, en:
Signo = significante + significado,
en donde el objeto o la imagen acústica o
gráfica es el significante, el concepto que se
expresa es el significado, y el signo es la
conjunción de ambos.
La noción de signo se ha entendido a lo largo
de la historia del pensamiento en varios
sentidos. Podía tratarse de un signo que,
simplemente, representase a la cosa
designada; podía tratarse también de un signo
que condujera al conocimiento por medio de
una similitud; pero también un signo puede
conducir al conocimiento de otra cosa
mediante un tipo de conexión distinta.
Diversos autores (Peirce, Reichembach) han
admitido una clasificación general de los signos
en tres grandes tipos:
• Los signos-Índices, que adquieren su función
mediante una conexión causal, como ocurre
con el humo como signo del fuego.
• Los signos icónicos, que tienen su
fundamento en una similitud del signo con lo
que significan, tal y como ocurre con las
fotografías o los dibujos, en tanto que signos
de los objetos reproducidos.
• Los signos convencionales o símbolos, en los
que la coordinación del signo con el objeto se
determina mediante reglas que establecen la
aceptación cultural del símbolo como
representación de un determinado ámbito de la
realidad.
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
112
“En las matemáticas todo es un juego de
niños, porque en ellas todo está disponible. Sin
embargo, como con cualquier juego de niños,
se podía perecer también con las
matemáticas.”
T. Bernhard. Helada.
Hasta ahora hemos analizado las relaciones
entre matemáticas y prensa teniendo en
cuenta las cinco grandes categorías
informativas y la organización usual de las
unidades de información en diferentes
unidades de contenido. Creemos que esta
aproximación se ajusta mejor a la estructura
del material que nos proporciona cualquier
periódico y, por otra parte, nos ha permitido
poner de manifiesto los valores educativos de
los distintos componentes de un periódico.
También hemos podido comprobar que, en
todos los casos, hay consideraciones
matemáticas pertinentes sobre cualquier
unidad de contenido de Prensa, aparezcan o no
explícitamente, ya que las matemáticas no son
solamente unos términos, símbolos y
operaciones que se utilizan en determinados
momentos, cuanto una forma de organizar
nuestros conocimientos y trabajar sobre ellos.
Sin embargo, es cierto y evidente que hay
determinados tópicos matemáticos que se
emplean de forma explícita en Prensa, como
hemos visto en el análisis de tablas y gráficas.
Este uso de las matemáticas es amplio y
extenso y, observando con detalle, abarca más
contenidos de los que se aprecian en una
visión superficial.
A continuación presentamos una serie de
ejemplos de elementos matemáticos que
aparecen explícitamente en la prensa escrita,
que hemos seleccionado a partir de un vaciado
exhaustivo de periódicos. Estos ejemplos los
tenemos organizado de acuerdo con los dos
tipos de criterios que presentamos en el
Capítulo 3, el criterio cognitivo y al criterio de
la disciplina, cada uno de los cuales daba lugar
a categorías diferentes. Aparece así una
clasificación de materiales de prensa mediante
categorías que se derivan del tipo de
conocimiento matemático.
Por este motivo, los ejemplos que presentamos
los organizamos según los seis grandes
bloques de contenidos, que señalamos en su
momento; en cada caso indicamos el tópico
matemático concreto al que se ajusta el
material de prensa y el tipo de conocimiento
matemático que puede utilizarse o desarro-
llarse con el mismo.
Presentamos esta información en una serie de
tablas, con tres columnas cada una
Tópico matemático/Conocimiento que se
transmite-utiliza/Unidad de contenido y
referencias en textos de prensa.
A continuación de cada tabla aparecen uno o
varios ejemplos tomados de la prensa diaria,
como se ve en los siguientes apartados.
ELEMENTOS MATEMÁTICOS EXPLÍCITOS EN LA PRENSA ESCRITA
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
113
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
114
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
115
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
116
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
117
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
118
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
119
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
120
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
121
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
122
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
123
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
124
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
125
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
126
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
127
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
128
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
129
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
130
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
131
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
132
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
133
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
134
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
135
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
136
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
137
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
138
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
139
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
140
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
141
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
142
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
143
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
144
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
145
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
146
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
147
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
148
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
149
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
150
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
151
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
152
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
153
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
154
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
155
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
156
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
157
ELEMENTOS MATEMATICOS EXPLICITOS EN LA PRENSA ESCRITA_____________________________
158
5.7. PASATIEMPOS MATEMÁTICOS EN
PRENSA
La clasificación del material de Prensa realizada
en base a los seis grandes bloques de
contenidos anteriores no agota nuestro
análisis. Esto es lo que ocurre cuando
consideramos la sección de pasatiempos que,
con mayor menor regularidad, aparece en
todos los periódicos. Esta sección puede
comprender desde el popular y tradicional
crucigrama hasta otros ejercicios más
sofisticados, entre los que recientemente
vienen apareciendo pasatiempos de contenido
y orientación claramente, matemáticos.
El empleo de pasatiempos en educación
matemática no ha sido nunca extraño, y se ha
visto incrementado en los últimos tiempos. En
el Informe Teckcroft, punto 7, se insiste en que
“los intentos de resolver tales pasatiempos
producen un divertido placer y también en
muchos casos conducen a una mayor
comprensión matemática. Para algunas
personas, también, el atractivo de las
matemáticas puede ser incluso mayor y más
intenso”.
La utilización escolar de pasatiempos
matemáticos se ha visto incrementada con la
difusión de las calculadoras electrónicas, que
han aliviado los cálculos largos y tediosos que,
a veces, llevaban ciertos pasatiempos.
En la tradición británica del desarrollo
curricular se presentan las “situaciones” como
uno de los elementos claves en el modelo de
construcción del currículo (contenidos,
procesos y situaciones) de las matemáticas
escolares.
Shuard (1986) habla de situaciones de la vida
real, como aquellas que ya son parte de la
experiencia personal del alumno, distinguiendo
diversos ámbitos entre los que señala los
siguientes:
a) Matemáticas a través del currículo, como
disciplina auxiliar a otras áreas de
conocimiento.
b) Matemáticas para la vida diaria,
relacionadas con actividades de economía
doméstica.
c) Juegos, deportes, puzzles, investigaciones y
pasatiempos.
d) Situaciones matemáticas especialmente
diseñadas.
Cada una de estas situaciones necesitan
trabajarse en profundidad para conocer cómo
afectan en detalle, a los procedimientos
generales de resolución de problemas y como
deben integrarse en el contenido.
Podemos distinguir tres grandes bloques en los
pasatiempos matemáticos que aparecen en la
Prensa, según el núcleo temático al que se
refieren. Estos toques son: Numérico, Lógico y
Geométrico/Topológico. Dentro de cada bloque
podemos diferenciar distintos componentes o
variantes, diversificadas según la presentación
y según las destrezas o contenidos
matemáticos que se quiere utilizar.
Presentamos a continuación la clasificación
realizada por nosotros, en la que organizamos
un vaciado de pasatiempos localizados en
diferentes periódicos.
ESTADISTICA ELEMENTAL__________________________________:__________________________
159
BLOQUE II
PRESENTACIÓN DE
DATOS ESTADÍTICA ELEMENTAL
ESTADISTICA __________________________________________:__________________________
160
ESTADISTICA __________________________________________:__________________________
161
ESTADISTICA __________________________________________:__________________________
162
ESTADISTICA __________________________________________:__________________________
163
ESTADISTICA __________________________________________:__________________________
164
ESTADISTICA __________________________________________:__________________________
165
ESTADISTICA __________________________________________:__________________________
166
ESTADISTICA __________________________________________:__________________________
167
ESTADISTICA __________________________________________:__________________________
168
ESTADISTICA __________________________________________:__________________________
169
ESTADISTICA __________________________________________:__________________________
170
ESTADISTICA __________________________________________:__________________________
171
ESTADISTICA __________________________________________:__________________________
172
ESTADISTICA __________________________________________:__________________________
173
ESTADISTICA __________________________________________:__________________________
174
ESTADISTICA __________________________________________:__________________________
175
ESTADISTICA __________________________________________:__________________________
176
ESTADISTICA __________________________________________:__________________________
177
ESTADISTICA __________________________________________:__________________________
178
ESTADISTICA __________________________________________:__________________________
179
ESTADISTICA __________________________________________:__________________________
180
ESTADISTICA __________________________________________:__________________________
181
ESTADISTICA __________________________________________:__________________________
182
ESTADISTICA __________________________________________:__________________________
183
ESTADISTICA __________________________________________:__________________________
184
ESTADISTICA __________________________________________:__________________________
185
ESTADISTICA __________________________________________:__________________________
186
ESTADISTICA __________________________________________:__________________________
187
ESTADISTICA __________________________________________:__________________________
188
ESTADISTICA __________________________________________:__________________________
189
ESTADISTICA __________________________________________:__________________________
190
ESTADISTICA __________________________________________:__________________________
191
ESTADISTICA __________________________________________:__________________________
192
ESTADISTICA __________________________________________:__________________________
193
ESTADISTICA __________________________________________:__________________________
194
ESTADISTICA __________________________________________:__________________________
195
ESTADISTICA __________________________________________:__________________________
196
ESTADISTICA __________________________________________:__________________________
197
ESTADISTICA __________________________________________:__________________________
198
ESTADISTICA __________________________________________:__________________________
199
ESTADISTICA __________________________________________:__________________________
200
ESTADISTICA __________________________________________:__________________________
201
ESTADISTICA __________________________________________:__________________________
202
ESTADISTICA __________________________________________:__________________________
203
ESTADISTICA __________________________________________:__________________________
204
ESTADISTICA __________________________________________:__________________________
205
ESTADISTICA __________________________________________:__________________________
206
ESTADISTICA __________________________________________:__________________________
207
ESTADISTICA __________________________________________:__________________________
208
ESTADISTICA __________________________________________:__________________________
209
ESTADISTICA __________________________________________:__________________________
210
ESTADISTICA __________________________________________:__________________________
211
ESTADISTICA __________________________________________:__________________________
212
ESTADISTICA __________________________________________:__________________________
213
ESTADISTICA __________________________________________:__________________________
214
ESTADISTICA __________________________________________:__________________________
215
ESTADISTICA __________________________________________:__________________________
216
ESTADISTICA __________________________________________:__________________________
217
ESTADISTICA __________________________________________:__________________________
218
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
219
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
220
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
221
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
222
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
223
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
224
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
225
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
226
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
227
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
228
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
229
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
230
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
231
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
232
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
233
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
234
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
235
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
236
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
237
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
238
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
239
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
240
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
241
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
242
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
243
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
244
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
245
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
246
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
247
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
248
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS UNIVARIADOS___________________________
249
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
250
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
251
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
252
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
253
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
254
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
255
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
256
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
257
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
258
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
259
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
260
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
261
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
262
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
263
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
264
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
265
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
266
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
267
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
268
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
269
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
270
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
271
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
272
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
273
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
274
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
275
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
276
1.
ANALISIS DESCRIPTIVO Y PRESENTACION DE DATOS BIVARIADOS____________________________
277
PARAMETROS CENTRALES_____________________________________________________________
278
BLOQUE III
PARAMETROS
CENTRALES Y
DISPERSIÓN
Se estudia la Estadística para aplicar sus
conceptos como ayuda en la toma de
decisiones ante situaciones de incertidumbre,
en el gobierno, en los negocios, en la industria
y, también, en el ámbito de las ciencias
sociales, biológicas y físicas. La estadística se
presta para las aplicaciones operacionales e
investigativas, siendo efectiva no solamente en
los experimentos de laboratorio sino que
también lo es en los estudios fuera de él. La
Estadística incluye la planeación y ejecución de
las encuestas, la descripción y el análisis de los
resultados y la formulación de predicciones con
base en esos resultados.
"La estadística no es más que el sentido común
expresado numéricamente.”1
“Ninguna persona que se mezcle con ella es
normal.”2justificándola científicamente. Los
principios estadísticos se emplean en una gran
variedad de situaciones
“Antes se hacían estadísticas con los
habitantes. Ahora se hace con los
desempleados.
Cuanto más aumenta el número de listas, más
empleos habrá para los estadísticos."3
EL COMIENZO DE TODD: DETERMINACIÓN
DE LO QUE SE DEBE SABER
El método estadístico es un proceso para
obtener, representar y analizar las
características o los valores numéricos para
una mejor toma de decisiones en situaciones
de incertidumbre. Los pasos para seguir una
metodología estadística son los siguientes:
• Definición cuidadosa del problema;
• Definición de un plan para la recolección de
información de las unidades de observación;
• Recolección, resumen y representación de las
observaciones o de sus valores numéricos;
• Análisis de los resultados;
• Divulgación escrita de las conclusiones, de
modo que éstas sean fácilmente comprensibles
por quien las vaya a utilizar en la toma de
decisiones.
La Agencia Nacional de Telecomunicaciones de
Brasil, (Anatel) realizó, en enero de 19994, una
Audiencia Pública para discutir las condiciones
generales del edicto de licitación para la
contratación de la institución que desarrollará
la metodología para verificar el grado de
satisfacción de la comunidad con el Servicio
Telefónico Fijo de Conmutación. En la
Audiencia
PARAMETROS CENTRALES
PARAMETROS CENTRALES_____________________________________________________________
279
Pública, fueron tratados los siguientes tópicos:
• Proceso de identificación del grado de
satisfacción;
• Lineamiento general del plan muestral de las
encuestas;
•Procedimiento para la recolección de datos en
todo el territorio nacional;
• Procedimiento de codificación y tabulación de
datos;
• Análisis que serian realizados;
• Identificación priorización de las cualidades
valorizadas por la comunidad y por Anatel
• Presentación de los resultados.
Entre las características del método estadístico,
se mencionan:
• es la única manera de tratar con una gran
cantidad de observaciones o de valores;
• se aplica solamente a las observaciones
reducibles a una forma cuantitativa;
• sucede lo mismo tanto para las ciencias
humanas y sociales como para las ciencias
tecnológicas;
• es objetivo; aunque los resultados están
influenciados (no debiera ser) por la
inescapable interpretación subjetiva.
La encuesta es fría, afirma la secretaría. El
asesor parlamentario de la Secretaría del
Estado para la Seguridad pública (...) afirma
que la encuesta del ISER (Instituto Superior de
los Estudios Religiosos) “es fría”, pues los
análisis fueron hechos "lejos del momento
ardiente de las confrontaciones.”
"Esta es la peor cifra del gobierno.”
A la Estadística no le interesa sacar
conclusiones con respecto a las unidades
individuales de observación, sino sobre grupos,
conjuntos o agregados, porque su objetivo es
el estudio de la
llamada población (también llamada universo)
la cuál puede ser finita o infinita.
Población finita es aquella en la cual el número
de unidades de observación puede ser contado
y es limitado.
• Ejemplos de población finita
• Alumnos matriculados en las escuelas
públicas estatales;
• Todas las declaraciones de Impuesto sobre la
Renta para el Ministerio de Hacienda;
• Todas las personas que compran teléfono
celular,
• Todos los delitos denunciados por las
Secretarias de Seguridad Pública.
Una población es infinita si la cantidad de
unidades observables es limitada o su
composición es tal, que las unidades de la
población no pueden ser contadas.
• Ejemplos de población infinita
• El conjunto de medidas de un experimento
repetido indefinidamente, puesto que no hay
límite para el número de veces que se pueda
medir;
• Los gases, los líquidos y algunos sólidos tales
como el talco, puesto que las unidades no
pueden identificarse ni contarse.
El número de unidades de la población se
denomina el tamaño y, en el caso finito, ese
tamaño se designa con la letra N.
"Con todo, la red estatal registrada en 1998,
con un total de 6´024.166 alumnos.
En una población se realiza una encuesta
observando a todas las unidades sobre una o
más características factibles de estudio;
también se identifica un área de cobertura que
es aquella que, físicamente, limita a las
unidades de observación que se desea
estudiar.
• Ejemplos de áreas de cobertura
• Alumnos matriculados en las escuelas
PARAMETROS CENTRALES_____________________________________________________________
280
públicas estatales en 1999;
• Todas las declaraciones de Impuestos sobre
la Renta recibidas por el Ministerio de Hacienda
en 1999;
• Todas las personas que compran teléfono en
la región Sudeste de Brasil;
• Todos los delitos denunciados, en los meses
de diciembre, desde 1990, por las Secretarías
de Seguridad Pública.
Al describir una población se deben diferenciar
las unidades de observación de las
características de esa población. Una unidad de
observación es un objeto (o grupo de objetos)
del cual se recolectan datos y que puede tener
muchas características, aunque el interés
recaiga usualmente sobre apenas una o
algunas de ellas, cuyos valores se anotan y
sobre los cuales se aplican principios
estadísticos.
• Ejemplo de unidad de observación y
características
En un universo de municipios, una unidad de
observación es el municipio, el cual presenta
muchas características entre las que están el
área, el número de habitantes y la renta por
capita.
El instituto Brasileño de Geografía y Estadística
(IBGE) acaba de lanzar un CD-ROM (Banco de
Observaciones Municipales) que integra los
datos esenciales de los cerca de 5.000
municipios del peso, e intenta ampliarlo pares
incluir características tales como el folclor, la
culinaria y la cultura de todos ellos.
EVALUACIÓN NUMÉRICA DE LAS
UNIDADES DE OBSERVACIÓN CON LA
AYUDA DE LAS ESCALAS DE MEDIDAS
Hay dos tipos básicos de datos:
• los obtenidos de una población cualitativa;
• los obtenidos de una población cuantitativa.
CLASES DE VARIABLES
En Estadística, la variable es la atribución de
un valor (numérico o alfanumérico) a cada
característica de una unidad de observación, es
decir, es una función de las observaciones
(mediciones) realizadas.
Cuando una característica o variable no es
numérica, se denomina variable
Cualitativa o atributo
• Ejemplos de variable cualitativa
• Sexo:
• Religión;
• Origen;
• Color de los ojos;
• Intervalos de edad.
Una variable cualitativa se expresa en
categorías.
•Ejemplos de categorías de variables
cualitativas
• En el sexo: masculino o femenino;
• En la religión: católica, presbiteriana,
bautista, anglicana, etc.;
• En el origen: brasilero, peruano, colombiano;
• En el color de los ojos: castaños, verdes,
azules;
• En los intervalos de edad: hasta 25 años, de
los 26 a los 49 años y mayores de 50 años.
Cuando los datos son cualitativos, el interés se
concentra normalmente en la cantidad o en la
proporción de toda categoría en relación con el
total.
"Los Colegios Militares tienen un 42% de
alumnas. "9
Cuando puede ser expresada numéricamente,
la variable estudiada se denomina variable
cuantitativa.
Ejemplos de variables cuantitativas
• Cantidad de billetes de cada denominación de
una moneda;
PARAMETROS CENTRALES_____________________________________________________________
281
• Cantidad de sabores de una bebida
refrescante;
• Valor del patrimonio de un ciudadano;
• Duración de una batería de un teléfono
celular.
Las variables cuantitativas pueden ser
discretas o continuas
• Ejemplos de variables cuantitativas
discretas
• Valores de las monedas: 5, 10, 20, 50, 100,
200 y 500.
El euro comenzó a circular con 13 billones de
billetes de siete denominaciones (5, 10, 20,
50, 100, 200y 500). Se acuñaron 76 billones
de monedas de 1 y 2 euros y de 1, 2, 5, 10, 20
y 50 centavos de euro, lo cual implicará un
cambio completo de máquinas y equipos de
ventas de periódicos, café y refrescos.” 10
O Navegando en Internet
"Los sistemas de 75 millones de computadores
en Europa tuvieron que ser actualizados. ¿Al
final, dónde se escondió el símbolo 0 (de Euro)
en el teclado? ¿Cómo imprimirlo? La Microsoft
esta distribuyendo un miniprograma especial
para el euro en
http://www.microsoft.com/windows/euro.asp.”
Cantidad de sabores de un refresco
En ocho deliciosos sabores mandarina,
naranja, maracuyá, lima-limón, cereza, ananá,
manzana verde y pomelo rosado.
Variables discretas
Las variables discretas sólo pueden tomar
determinados valores y son el resultado de un conteo
(es decir, son aquellas variables cuyo conjunto de
valor posibles es finito o infinito enumerable.)
Variables continuas
Pueden tomar cualquier valor dentro de
determinado rango de valores y son el resultado de
una medición.
Obsérvese que no se puede hablar de 5,4
valores de los billetes, ni de 3,8 sabores de
refrescos. Los números fueron obtenidos a
partir de un conteo.
“…los escasos 110 m2 del salón de gimnasia
localizado en la Academia ABC son ocupados
por casi 60 muchachos, lo cual da…0.545454…
muchachas por cada (sic) m2del salón. Esto
dicen las matemáticas. En la práctica, es
diferente, Allí no hay mujeres partida por la
mitad y tampoco ninguna fracción periódica
que se extienda hasta el infinito.”
Por otro lado, las variables continuas son
aquellas cuyo conjunto de valores posibles
están en un intervalo de números reales,
resultado de una medición con cualquier grado
de exactitud. En la práctica, entre tanto, los
mecanismos de medición tienen una precisión
limitada, en tal forma que los datos recogidos
de las variables continuas son, en muchos
casos, necesariamente discretos. Es decir,
existe solamente un conjunto finito (cal vez
muy grande) de valores posibles que
realmente pueden ser medidos.
Ejemplos de variables cuantitativas
continuos
• Valor del patrimonio de un ciudadano
brasileño: U$ 15.000.000, U$ 147.000,oo, U$
4'675.778,95.
A partir de 1999, las declaraciones de Renta de
los contribuyentes con patrimonio de hasta U$
20.000, podrán ser hechas telefónicamente".14
Para la duración de una batería de un teléfono
celular: 60, 46h37 min 12s ó34h 13 min
(dependiendo del tipo de batería o del tipo de
uso).
“Batería vibrante con 3h15 min de
conversación y 200h de espera”,”Batería con
1h30 min de conversación y 24h de
espera”,”Batería con 2h de conversación y 38h
PARAMETROS CENTRALES_____________________________________________________________
282
de espera”, “Batería con 3h de conversación
57h de espera”,”Batería con 2h30 min de
conversación y 47 h de espera” y “hasta 5h y
10 minutos de conversación.”
La Figura 1.1 muestra, en forma esquemática,
la clasificación de las variables.
O NAVEGANDO EN INTERNET
Un paso vital en el análisis estadístico y en la
interpretación de los resultados es el valor de
los daros empleados. En Brasil y en Colombia,
varias agencias gubernamentales ejercen un
papel importante en la producción de datos en
diferentes áreas. En este párrafo se
recomienda visitar dos lugares imperantes
(site) en Internet, el del Instituto Brasileño de
Geografía y Estadística (IBGE) y el del
Departamento Administrativo Nacional de
Estadística (DANE) de Colombia. El objetivo es
dar a conocer el primer sitio donde los datos
oficiales de Brasil y Colombia son publicados y
enterarse de una variedad de datos que coda
una de las fuentes pone a disposición del gran
público. En el proceso de la visita, habrá
conexiones (links) hacia sitios donde pueden
ser consultados otros datos; la visita a estos
sites nunca dará una visión completa de todos
los recursos o daros existentes, pero ofrecerá
una introducción estructurada de los vastos
recursos disponibles.
El IBGE tiene las direcciones
http:www.ibge.gov.br y http://ibge.org.br, y la
del dance es http//www.dane.gov.co: Las dos
entidades ponen a disposición de los usuarios
datos territoriales, indicadores coyunturales,
estadísticas básicas de naturaleza demográfica,
social y económica, y los resultados de los
censos, incluyendo los datos sobre los estudios
y encuestas realizados. También facilita la
transferencia de archivos de datos, gráficos en
diferentes formatos, mapas y textos.
•Ejercicio-ejemplo 1.1
Diríjase a las direcciones
http://www.ibge.govbr y
http://www.dane.gov.co y haga lo siguiente:
a. copie las clases de variables (cualitativa y
cuantitativa) disponibles para ser consultadas;
b. identifique el formato de los datos (HTML,
DOC, XLS, etc.);
c. compruebe cómo pueden ser bajados
(download) los archivos de datos hasta su
computador;
d. compruebe si existen restricciones de acceso
para la obtención de los datos (pagos que
deban hacerse a la administración del site o
hay impedimentos de acceso para el público en
general); si esto es así, tome nota de ello;
e. escriba el URL de conexiones interesantes;
PARAMETROS CENTRALES_____________________________________________________________
283
(URL = universal resource locator o
dirección de un sitio de acceso, generalmente
identificado con http://www)
f mencione cinco clases de datos disponibles en
IBGE y DANE;
g. haga una lista de sitios de la red para las
cuales el IBGE y el DANE suministra
conexiones;
h. identifique como IBGE y DANE facilitan su
atención a los usuarios.
LAS ESCALAS QUE CARACTERIZAN LAS
UNIDADES DE OBSERVACIÓN
Pueden usarse cuatro escalas de medidas para
caracterizar las unidades de una población.
Ellas son: nominal, ordinal, intervalar y
proporcional
ESCALA NOMINAL
En la escala nominal, Las características se
clasifican en varias categorías, en las cuales un
valor numérico asociado con la característica
no tiene un significado real.
•Ejemplo de escala nominal
La variable sexo tiene las categorías masculino
y femenino, las cuales pueden ser clasificadas
numéricamente asignándole el número 1 al
sexo femenino y el 2 al sexo masculino. "Tabla
de códigos de la declaración de bienes y
derechos de inmuebles: 11- Apartamentos; 12-
Casas, 13- Terrenos; 14- Tierra virgen; 15-
Salones o tiendas; 16-Construcción; 17-
Fundaciones de beneficencia; 19- Otras.
ESCALA ORDINAL
Las características son ordenadas (de manera
creciente o decreciente) en situaciones para las
cuales la posición asociada es importante.
•Ejemplo de escala ordinal
Al verificarse el comportamiento de una
persona o de una actividad, para lo cual hay
cinco categorías, con el fin de facilitar la
codificación se asocia un número a cada
desempeño: (5) óptimo, (4) bueno, (3)
regular, (2) malo y (1) pésimo. Un 4 indica un
mejor desempeño que un 3, pero no implica,
necesariamente, que se tenga un desempeño
dos veces mejor que quien obtuvo 2.
Una evaluación en el plan real, Respuesta
estimulada y típica, en porcentaje los días 10 y
11 de diciembre de 1998: óptimo/bueno, 61;
regular, 28; pésimo, 10; no sabe, 1.”
ESCALA INTERCALAR
Alas características se les atribuyen valores
que no solamente permiten comparar el orden,
sino que también permiten evaluar la variación
numérica entre las características.
•Ejemplo de escala intervalar
En un período de dos horas se hicieron cinco
lecturas de la temperatura: 205, 207, 210, 215
y 220. Después de haberse ordenado, la
variación entre 205 y 215 fue la misma que
para los valores entre 210 y 220. Aunque esos
valores referentes a la temperatura puedan ser
colocados en orden (creciente o decreciente),
la comparación entre ellos solo es posible si
estuvieren en la misma escala; por ejemplo, si
las escalas fueran Celsius y Fahrenheit, la
comparación no sería posible pues los ceros de
esas escalas son diferentes.
“El año 2000...será 2004 de acuerdo con la
fecha real del nacimiento de Cristo en el año 4
a. C, año 2753 del calendario romano, año
2749 según los babilonios, 6236 de acuerdo
con el primer calendario egipcio, 5760 en el
calendario hebreo, 1420 en el calendario
musulmán, 2544 según los budistas, 5115 en
el calendario maya y 208 de acuerdo con el
PARAMETROS CENTRALES_____________________________________________________________
284
calendario cuya base es la Revolución
Francesa.”
ESCALA PROPORCIONAL
Las características se ordenan y la variación
entre ellas puede ser comparada si existe un
cero natural para la escala de medición.
• Ejemplo de escala proporcional
Considere una situación en la cual se
obtuvieron los siguientes pesos, en kilogramos:
5.0, 5.1, 5.3 y5.4. La variación de 5
kilogramos a 5.1 kilogramos es de 0.1 kilogra-
mos, que es la misma variación que hay entre
5.3 kilogramos %, 5.4 kilogramos y existe un
cero natural para la escala, es decir, 0
kilogramos.
• Ejercicio-ejemplo 1.2
La evaluación de los cursos superiores en
Brasil se hace a partir de la llamada Probación.
En 1996, fueron evaluados estudiantes de
administración, derecho e ingeniería civil; en
1997, los mismos del ano anterior y los de
ingeniería química, veterinaria y odontología;
en 1998, los cursos anteriores más los de
ingeniería eléctrica, periodismo, letras y
matemáticas. En 1999, fuera de los anteriores,
se incluyeron los estudiantes de economía,
ingeniería mecánica y medicina. La clasificación
fue hecha por calificaciones desde la A hasta la
E. Identifique el tipo de escala adoptada.
• Ejercicio-ejemplo 1.3
El 28 de diciembre de 1998, la Folha de S.
Paulo publicó la clasificación de los alcaldes de
nueve capitales brasileñas. Las calificaciones,
en una escala de 02 10, fueron las siguientes:
Curitiba, 6.7; Recife, 6.5; Porto Alegre, 6.4;
Florianópolis, 6.4; Salvador, 6.3; Fortaleza,
5.5; Belo Horizonte, 5.4; Río de Janeiro, 5.4 y
Sao Paulo, 3.4. Identifique el tipo de escala
utilizado, justificando su respuesta.
El hecho de que una variable sea expresada
numéricamente no significa que esta sea
necesariamente cuantitativa, pues la
clasificación de la variable depende de como
fue medida y no del modo en el cual se
manifiesta. Por ejemplo, para la variable peso
de un boxeador, si este fuera registrado por el
peso encontrado en la balanza, la variable
seria cuantitativa continua; par otro lado, si el
peso fuera clasificado según las categorías del
boxeo, la variable sería cualitativa ordinal.
COMENZANDO A ESTUDIAR, EN LA
PRÁCTICA, A UNA POBLACION: CENSO Y
MUESTREO
Si la población es pequeña, es razonable
observarla toda y esto se llama censo.
"Los datos iniciales del Censo Demográfico del
año 2000 estarán disponibles en diciembre de
ese año..."
Pero, examinar una población entera no es
siempre viable; en la mayoría de los casos hay
escasez de tiempo y de recursos (humanos o
financieros, por ejemplo o el Censo es
impracticable. Es posible entrevistar y anotar
lo que piensan las personas que están en una
reunión, pero no obtener y registrar, en un
tiempo razonable, la opinión de todos los
seguidores del encuentro final de un
campeonato de fútbol en un gran estadio.
Fuera de esto, el mundo esta cambiando
constantemente y, por lo tanto, nunca las
observaciones reflejarán, de manera
completamente precisa, las condiciones reales
y actuales de todas las unidades de
observación.
"Para el Censo, por ejemplo, su realización
más importante, el IBGE pidió R$600 millones,
diez veces menos de lo que los Estados Unidos
va a gastar en el mismo trabajo... La
recolección de los datos del Censo se efectuará
entre agosto y octubre del 2000 y será
PARAMETROS CENTRALES_____________________________________________________________
285
realizado por 120.000 encuestadores. El país
estará dividido en 170.000 sectores
censales.”20
Por esos motivos, el estudio estadístico se
inicia con la selección de parte de una
población, llamada muestra, constituida por n
unidades de observación y la cual debe tener
las mismas características de la población. Este
proceso recibe el nombre de muestreo, el cual
comprende por lo menos dos etapas: la
selección de las unidades y el registro de las
observaciones. El tamaño de la muestra que
debe ser extraída de la población es el que
minimiza los costos del muestreo, pudiendo ser
hasta de tamaño 1.
"Hay 106'000.000 de electores en Brasil.... no
hay cómo oírlos a todos. Así que se utilizan
métodos estadísticos para deducir la intención
de votar de tal manera que los entrevistados
representen al conjunto del electorado. "21
El muestreo puede hacerse con o sin
reposición; en una muestra sin reposición,
comúnmente empleada en los trabajos
estadísticos, las unidades se seleccionan
apenas una vez; en el muestreo con reposición
se seleccionan las unidades por lo menos una
vez.
•Ejemplo de muestreo sin reposición
En una encuesta electoral, poco antes de una
elección, para que se conozca la intención de
voto de las personas entrevistadas, estas
deben ser escuchadas apenas una sola vez,
pues, en una elección, el voto es individual.
•Ejemplo de muestreo con reposición
Cuando se desea saber cuánto tiempo gasta
una persona haciendo cola en un banco, esta
puede ser observada una o más veces, cada
vez que vuelve al banco.
Se justifica el uso del muestreo porque,
comúnmente, no es viable observar cada
característica de todas las unidades de
observación de la población.
Además de la escasez de tiempo y de recursos,
se pueden mencionar:
• En el caso del examen de enfermedades
contagiosas, el encuestador podría contagiarse
y comenzar a transmitir la enfermedad a otros
encuestados;
• Con relación a las pruebas destructivas, al
final de estas no habría unidad de observación
disponible;
• En el caso de los exámenes clínicos, la
imposibilidad de examinar toda la sangre de
una persona sin causarle la muerte;
• Si el trabajo empleado para obtener los datos
fuera excesivo, se pueden presentar
anotaciones erradas debidas al cansancio del
encuestador después de examinar las últimas
unidades de una extensa población.
Decidido el tamaño de la muestra, la
recolección de daros puede llevarse a cabo de
dos maneras:
• Por observación directa: las unidades de
observación de la población son examinadas
por el propio analista o, automáticamente, por
un instrumento.
• Por observación indirecta: las unidades de
observación son revisadas por otras personas y
no por el analista.
En cuanto a los factores que la influencian, la
muestra puede ser:
• Observacional, en la cual no hay control
sobre los factores estudiados por el analista_
•Ejemplo del muestreo observacional
La muestra
Conjunto de unidades seleccionadas de una
población.
El muestreo
Proceso por el cual una muestra de unidades de
la población es seleccionada y observada.
El muestreo es la parte más importante de la
Estadística.
PARAMETROS CENTRALES_____________________________________________________________
286
Los estudios estadísticos sobre la intención de
voto de los electores.
• De experimento o experimental en el cual se
tiene un control parcial, es decir, la localización
de factores que pueden influenciar los
resultados esta bajo el control del analista; por
ejemplo, un experimento en el que las
observaciones se hacen en un ambiente en el
cual una situación es modificada para
comprobar la influencia de esa variación.
•Ejemplo de experimento de muestreo
Las observaciones hechas a partir de una
experiencia para comprobar la reacción de las
personas sometidas a situaciones sorpresivas.
"...y sabían que serian despertados a Las 6:00
a. m. un día y a Las 9:00 a.m. en los otros días
en los que el estudio fue conducido. En uno de
los días del experimento, en vez de despertar a
los voluntarias a las 9:00 a.m., como se había
convenido, los científicos los despertaron a las
6.00 a.m. para comprobar como el organismo
de esas personas reaccionaria ante la sorpresa
de despertar más temprano de lo previsto.”92
TOMANDO UNA MUESTRA DE LA
POBLACIÓN
Los datos de la muestra relativos a cierta
característica de cada unidad de observación
de la población pueden obtenerse de manera
económica cuando apenas una parte de la
población es examinada.
Unidad muestral es una unidad individual de
observación o una colección de unidades no
coincidentes, tomadas de la población.
Base muestral o marco de muestreo es un
listado de Codas las unidades de observación
seleccionables para la muestra. Por ejemplo,
para un conjunto de piezas producidas por una
empresa en determinado mes, la unidad
muestral es una pieza individual y la base
muestral es el conjunto de todas las piezas
producidas.
El principal objetivo de cualquier plantación de
muestreo es seleccionar la muestra de tal
manera que ésta retrate fielmente a la
población, es decir, que sea representativa de
la población, lo que no siempre ocurre.
"El IBGE define como precaria la residencia
construida con materiales impropios, latón,
chatarra, maderas sin tratar, etc.- lo cual
marginas las casas de albañilería en las
barriadas pobres (favelas), por ejemplo.”23
La preocupación debe ser constante para
mantener dicha representatividad.
“Lo.... hacen los estudios previos para saber
cómo está compuesto el conjunto del electo-
rado. El objetivo es que la muestra sea
representativa del total de Los electores "24
TRES CLASES DE MUESTREO (DE ENTRE
VARIOS EXISTENTES)
MUESTREO SISTEMÁTICO
Hay diferentes maneras por las cuales las
muestras pueden ser seleccionadas, cada una
con ventajas e inconvenientes, y uno de los
problemas asociados al muestreo es la
definición del tamaño de la muestra que debe
tomarse de la población. El tamaño debe
minimizar los costos de la investigación,
pudiendo esta ser hasta de tamaño 1.
Una muestra es sistemática cuando la toma de
las unidades de observación se hace
obedeciendo a un período, siendo calculado el
intervalo de selección para una población
finita, por medio de la división del tamaño de
Unidad muestral
Es una unidad individual de observación o una
colección de unidades no-coincidentes tomadas
de la población.
PARAMETROS CENTRALES_____________________________________________________________
287
la población por el tamaño de la muestra que
va a ser seleccionada.
•Ejemplo de muestreo sistemático
Se desea tomar una muestra de n=10
unidades de observación de una población de
tamaño N=874. El intervalo de selección es,
entonces, 874/10 = 87.4 = 87 (se aproxima
inferiormente, de lo contrario se traspasaría el
orden de la siguiente unidad). Se selecciona
aleatoriamente un arranque aleatorio (AA)
entre 1 y 87, el cual da el # de orden de la
primera unidad seleccionada para la muestra.
A continuación, se van contando las unidades
de observación y se seleccionarían aquellas
que estuvieren en las siguientes posiciones:
AA; AA + 87; AA + 2(87); AA + 3(87); AA
+3(87); hasta completar las 10 unidades.
MUESTREO ALEATORIO SIMPLE
El proceso de toma de la muestra de una
población en la cual cada unidad tiene la
misma probabilidad de ser seleccionada se
llama muestreo aleatorio simple; la muestra
así obtenida se llama muestra aleatoria. El
proceso de toma de muestras aleatorias
simples exige que se atribuyan números
consecutivos a las unidades de población y se
proceda a un sorteo, colocando los números en
un recipiente, por ejemplo, y sacando un
número, situación en la cual cada unidad de
observación tiene la misma probabilidad de ser
seleccionada.
Pero tal procedimiento no es práctico para una
población muy grande; se busca, entonces,
simular tal sorteo, lo cual se hace por medio de
una tabla de dígitos pseudo-aleatorios (Tabla
1.1.) Esta tabla, comúnmente conocida como
tablas de números aleatorios, está compuesta
por un listado de dígitos comprendidos entre 0
y 9 y tiene dos características que la vuelven
particularmente adecuada para las muestras
aleatorias simples: primero, los dígitos están
dispuestos de tal manera que la probabilidad
de que uno de ellos aparezca en determinada
secuencia es la misma de que aparezca en
cualquier otra posición; segundo, cada una de
la totalidad de las combinaciones de dos cifras
tiene la misma oportunidad de aparecer, así
como todas las combinaciones de tres cifras, y
así sucesivamente.
•Ejemplo de un muestreo aleatorio simple
Cuando se quiere seleccionar, aleatoriamente,
diez unidades de una población de tamaño N=
874 unidades, se las puede listar asignándoles
consecutivamente los números desde 001
hasta 874, desde la primera hasta la última.
Como la identificación de las unidades tiene
tres cifras, será necesario leer un conjunto de
tres dígitos en una tabla de dígitos pseudo-
aleatorios, para asegurar la correspondencia
entre los dígitos pseudo-aleatorios y las
unidades de la población. Se selección una
combinación de dígitos pseudo-aleatorios,
tomando de la población la unidad
correspondiente al número leído; si hubiere
repetición o se presentare un número mayor al
tamaño de la población, esta debe ser ignorada
y debe escogerse otra combinación de dígitos.
El procedimiento se continua hasta completar
la muestra de tamaño n=10.
• Ejercicio-ejemplo 1.4
De nuevo con la muestra de tamaño 10 de una
población de tamaño 874; se numeran las
unidades de observación de la población desde
001 hasta 874.
Muestreo aleatorio simple
Proceso de selección de una muestra de
población en la cual cada unidad tiene la misma
probabilidad (chance) de ser seleccionada.
PARAMETROS CENTRALES_____________________________________________________________
288
Los dígitos pseudo-aleatorios pueden ser leídos
aisladamente o en grupo, en cualquier orden,
por columnas o por filas, de izquierda a
derecha o de derecha a izquierda,
diagonalmente de izquierda a derecha, etc.; la
regla para la lectura puede ser cualquiera,
mientras no sea alterada hasta el final de la
muestra. Considere que comenzó la lectura de
arriba hacia abajo, a partir de la primera co-
lumna mirando los tres primeros dígitos. Si es
así, la primera unidad sorteada será la 874*; la
segunda unidad la 855, y así sucesivamente:
422, 257, 706, 362, 434, 338, 365, 922 (el
cual debe ser descartado por ser mayor que
874) y 767. Cualquier secuencia de tres cifras
en una tabla de dígitos pseudo-aleatorios sirve
para identificar las unidades que serán
seleccionadas y el proceso continua hasta que
se haya obtenido diez números diferentes (lo
cual es equivalente a una muestra sin reposi-
ción, usualmente utilizada) los cuales
corresponderán a las unidades de la población
que serán estudiadas.
Es común el empleo de la expresión tabla de
números aleatorios, pero lo más correcto es
hablar de tabla de números pseudo-aleatorios,
pues estos son generados a partir de una
expresión matemática y de un conjunto inicial
de dígitos; si ese conjunto fuera generado de
nuevo, los dígitos subsiguientes podrían ser
previstos y, entonces, la tabla ya no seria
aleatoria. Como el conjunto de dígitos se
asemeja a un número porque las tablas
publicadas incluyen espacios entre grupos de
dígitos (generalmente un espacio cada cinco
dígitos) para facilitar su lectura, se induce,
erradamente, a que se lean los números y no
los dígitos. Para usar una tabla de dígitos
pseudo-aleatorios se deben seguir los siguien-
tes pasos:
• Paso 1: hacer un listado de las unidades de la
población;
• Paso 2: numerar consecutivamente las
unidades comenzando por el 1;' (*Se puede
comenzar por 0, 00 o 000, etc., pero,
usualmente, los números generados por las
PARAMETROS CENTRALES_____________________________________________________________
289
calculadoras electrónicas y los computadores
no incluyen el valor 0).
• Paso 3: leer los números en la tabla de
dígitos pseudo-aleatorios de manera que el
total de Las cifras en cada uno de ellos sea
igual al Total
metal, o hierro; nada vimos... Aguas hay muchas;
infinitas. Es de tal manera bella que, queriéndola
aprovechar, dariaosla del todo; a causa de las aguas
que tiene
...Es de esta manera que relato a Vuestra Alteza
cuanto de esta, Vuestra tierra, vi.” 30
Como las informaciones provienen de un
conjunto menor que la población, se cometen
errores al hacer una inferencia. Estos errores
pueden ser cuantificados, así como la
probabilidad de cometerlos, la cual, además de
tratar con situaciones influenciadas por
factores no controlados por el analista, propor-
ciona un modelo racional para tratar con la
variabilidad inherente a la naturaleza y
también con las situaciones relacionadas con el
azar. El conocimiento de las probabilidades
relacionadas con una situación, suministra la
base para el desarrollo de las técnicas de la
toma de decisiones, explica el funcionamiento
de esas técnicas, e indica la manera en que las
conclusiones pueden ser presentadas e
interpretadas correctamente.
"Covas tiene una probabilidad de un 80% de
curarse.” 31
Es importante enfatizar que la estadística
descriptiva y las probabilidades son
herramientas para la inferencia estadística, la
cual interpreta de dos maneras los resultados
obtenidos a partir de la muestra tomada de
una población: o haciendo una estimación con
respecto al valor desconocido de una
característica de la población, o realizando una
verificación de esa característica sobre la cual
se afirma tener un determinado valor.
Así, el nombre Estadística tiene varios
significados: en este libro, por ejemplo, la
Estadística puede considerarse como
constituida por las tres áreas siguientes: la
estadística descriptiva, el calculo de Las
probabilidades y la inferencia estadístico. Una
visión sistémica de lo que se estudia en lo que
se conoce como Estadística está en la Figura
1.2
• Ejercicio-ejemplo 1.6
"El Termómetro Empresarial, encuesta cuyos
resultados serán divulgados hoy por la....
escuchó a las 500 mejores empresas del país y
constato que el 76% considera el paquete
fiscal como recesivo, aunque necesario."32 A
partir de esta noticia, puede afirmarse que el
tamaño de la muestra es grande y que el 76%
(más del 50%) de las empresas consideran
como recesivo al paquete fiscal; se concluye,
entonces, que la mayoría de las empresas
colombianas considera recesivo el paquete
fiscal. ¿Esta afirmación es verdadera o falsa?
Las explicaciones técnicas sobre la metodología
de las encuestas, cuando aparecen junto con la
PARAMETROS CENTRALES_____________________________________________________________
290
divulgación de los resultados, vienen en pie de
página, con letra menuda y en un lenguaje
ininteligible para el lego. Por otro lado, en los
titulares principales todo aparece como
concluyente y lleno de certezas. "33
COMO REALIZAR LOS CALCULOS A PARTIR
DE LOS DATOS TOMADOS
Desde el comienzo de los estudios estadísticos
las operaciones matemáticas son realizadas
manualmente. Sin embargo, con la aparición
de las calculadoras electrónicas el trabajo se
hizo más fácil, pues se eliminan los cálculos
monótonos y se economiza tiempo para el
modelaje de los problemas, para la recolección
de los sectores y para el análisis de los resulta-
dos. Diversas empresas desarrollan productos
ligados directamente con el mercado escolar y
es creciente el número de estudiantes y
profesores que hacen uso de las calculadoras
electrónicas. Este interés se debe al
reconocimiento de la accesibilidad de la
tecnología, factor clave en la respuesta a las
mudanzas tecnológicas.
Conviene destacar que la tecnología mudo
radicalmente la manera de enseñar y de
aprender Estadística, así como la manera de
resolver problemas. A causa de esto, el libro
tiene varios ejemplos y ejercicios elaborados
en lenguaje natural, muchos otros basados en
las calculadoras científicas HP 48G, Casio CFX-
9850G/995OG Texas T1-83 y en el programa
Microsoft-Excel. En caso de que no se tenga
experiencia en esos recursos electrónicos,
acuda al Apéndice 2. Principios del uso de las
calculadoras científicas y al Apéndice 3.
Introducción al Microsoft-Excel.
LA GENERACIÓN DE LOS DIGITOS
PSEUDO-ALEATORIOS
La selección de las unidades para componer
una muestra fue hecha por medio del empleo
de la tabla de dígitos pseudo-aleatorios que
comúnmente aparece en los libros de
Estadística. Sin embargo, tal selección puede
hacerse más rápidamente, con el uso de las
calculadoras científicas. En las calculadoras se
genera una combinación de dígitos pseudo-
aleatorios en el rango comprendido entre 0 y I
empleando una semilla aleatoria.
Empleo de la calculadora electrónica
• Empleo de la calculadora electrónica HP 48G
• Paso 1: enciéndala;
• Paso 2: si la pantalla no fuera la inicial,
oprima la tecla morada identificada con la
flecha a la izquierda y después la tecla [DEL]
(tercera tecla a la derecha de [ENTER]), lo que
equivale a la función CLEAR;
• Paso 3: a partir del menú inicial, presione, en
orden, las teclas [MTH] (primera recta de la de
la segunda fila), [NXT] (última de la segunda
fila) y la primera tecla, totalmente blanca, de
la primera fila de teclas (identificada con la
letra A) para entrar en el menú PROB; observe
que existe una relación entre las teclas blancas
y las grises que aparecen en la última fila de la
pantalla: en el caso de la primera tecla blanca,
A, el nuevo menú corresponde a COMB,
mientras que el anterior correspondía a PROB.
En la última fila de la pantalla aparece una
serie de opciones y, para que aparezca un
número real incluyendo al 0 y excluyendo al 1,
de una sucesión de números pseudo-
aleatorios, oprima ahora la tecla blanca D.
Aparece ahora un número pseudo-aleatorio,
que se convierte en la semilla del numero
siguiente. Para generar otros números,
Heregía
Afirmar que cualquier información pública con base en una muestra es validad
para toda la población.
Si Los valores no son digitados correctamente, la calculadora o el computador
suministran
informaciones inútiles. Siendo así, compruebe siempre, antes de comenzar los
cálculos, si los
datos son correctos.
PARAMETROS CENTRALES_____________________________________________________________
291
continúe apretando la tecla blanca D; si
aparece un número mayor que 1, observe si
termina con E-2 o- con E-3, queriéndose decir
que el valor presentado debe dividirse por 100
o por 1000.
• Empleo de la calculadora electrónica
Casio CFX-9850G/995OG
Para generar un número pseudo-aleatorio que
incluye al 0 y excluye al 1, los pasos son los
siguientes:
• Paso 1: después de encenderla, seleccione en
el Main Menu (menú principal), la opción RUN
(comúnmente ya destacada), con la recta que
tiene la flecha hacia la izquierda [←] del
conjunto de flechas [→] [←] [↑] [↓] ;
• Paso 2 teclee [EXE], en el extremo inferior
derecho; aparece una pantalla en blanco
• Paso 3: pulse la tecla [SHIFT] (tecla amarilla)
y después la tecla [MENU], tercera tecla a la
derecha de [SHIFT] que activa la opción SETUP
Aparecen en la última línea de la pantalla,
cinco opciones, la primera de las cuales es
Comp, equivalente a la tecla azul [F1 ]
(primera tecla de la primera fila de teclas);
• Paso 4: presione la teda [F1) y teclee [EXE];
aparece una pantalla en blanco;
• Paso 5: presione la tecla [OPTN], a la
derecha de la tecla amarilla [SHIFT),
apareciendo en la parte inferior de la pantalla
una serie de 6 opciones;
• Paso 6: oprima la teda azul [F6], en la
primera fila de teclas y aparecen más opciones
en la fila inferior, oprima ahora la tecla [F3]
(selecciona PROB) y, a continuación [F4]
(selecciona Ran#) cuando aparece en el menú
Ran#. Al oprimir la tecla [EYE], aparece un
número pseudo-aleatorio. Para generar otros
números pseudo-aleatorios, basta apretar,
continuamente, [F4] y [EXE].
•Empleo de la calculadora electrónica
Texas TI-83
Antes de efectuar una operación, limpie la
calculadora de cualquier información anterior,
después pulse la teda [CLEAR], última tecla de
la fila de teclas que comienza con [MATH].
Para generar números pseudo-aleatorios
comprendidos entre 0 excluido e incluyendo al
1, los pasos son los siguientes, una vez que la
máquina esta encendida:
•Paso 1: oprima la teda [MATH], situada en la
primera columna de teclas, la cuarta tecla.
Observe que, en la pantalla de la calculadora,
aparecen, en la primera fila, [MATH]
(destacada), NUM, CPX y PRB;
•Paso 2: oprima la teda azul (del conjunto de
dichas teclas con flechas hacia la izquierda,
derecha, arriba y abajo, a la derecha de la
calculadora [→] [←] [↑] y [↓]) relativa a la
flecha hacia la derecha [→], tres veces, hasta
que aparezcan en la primera fila de la pantalla,
las letras PRB cuando aparecen las siguientes
opciones:
• Paso 3: oprima la tecla [ENTER), situada en
el extremo inferior derecho, para ejecutar el
programa; aparece el cursor intermitente a la
derecha de la palabra rand. Oprima de nuevo
la tecla [ENTER] y aparecerá el resultado. Para
generar otros números pseudo-aleatorios, es
suficiente continuar presionando la tecla
[ENTER].
La TI-33 también genera un número pseudo-
aleatorio entero dentro, de un rango
Semilla aleatoria
Valor a partir del cual pueden ser generadas los
dígitos pseudo-aleatorios.
PARAMETROS CENTRALES_____________________________________________________________
292
especificado por un límite inferior y uno
superior. Los pasos son los siguientes
• Paso 4: igual al Paso 1;
• Paso 5: igual al paso 2;
• Paso 6: oprima cuatro veces la tecla azul
relacionada con la flecha hacia abajo hasta que
se destaque 5: randlnt,
• Paso 7: oprima [ENTER] y aparecerá randlnt;
para especificar un límite inferior, un límite
superior y la cantidad deseada de números
pseudo aleatorios, digite el límite inferior, el
límite superior y el número deseado de valores
a ser generados, separados por una coma (te-
cla que está sobre la tecla con el número 7) y
terminando con un paréntesis (tecla superior
con el número 9);
• Paso 8: oprima la tecla [ENTER] y aparecerá
el resultado. Para generar la misma cantidad
de números enteros pseudo-aleatorios en el
mismo intervalo, hasta continuar presionando
la tecla [ENTER].
•Ejemplo de generación de números
pseudo-aleatorios en la calculadora TI-83
Para generar seis números enteros pseudo-
aleatorios, el comando es randlnt (2, 15, 6).
Cuando se oprime la tecla [ENTER] los
resultados aparecen.
EMPLEO DEL EXCEL
- La función ALEATORIOENTRE
• Paso 1: ir a la barra de herramientas, en el
icono f (en el Excel 97, al ser posicionada la
flecha del mouse encima de este icono aparece
la identificación Colocar función);
• Paso 2: teclee dos veces sobre el icono, para
que aparezca en la pantalla Colocar función;
• Paso 3: en la columna de la izquierda, Clase
de función, oprima encima de la categoría
Matemática y trigonométrica, la cual aparecerá
destacada;
• Paso 4: oprima, en la columna derecha,
Nombre de la función: la función
[ALEATORIOENTRE] (Figura 1.3);
• Paso 5: teclee OK en la parte inferior de la
pantalla y aparecerá en esta la Figura 1.4;
• Paso 6: el número pseudo-aleatorio deseado
se presenta al llenar los valores Inferior y
Superior con el primero y el último de los
índices, respectivamente, de las unidades de
observación de la población.
• Ejemplo de generación de un número
pseudo-aleatorio en Excel
Siendo 001 el mínimo y 874 el máximo de la
lista de la población, el número generado fue
307 (en el resultado de la formula, en la parte
inferior del cuadro). Teniendo en cuenta que
son pseudo-aleatorios los números, reproducir
este ejemplo puede suministrar otros números
en otras repeticiones, con resultados diferentes
a los presentados en la Figura 1.5.
PARAMETROS CENTRALES_____________________________________________________________
293
Para generar más números pseudo-aleatorios
con la misma función, debe activarse la celda
con el número generado y llevar el mouse
hasta el extremo inferior derecho de la celda;
cuando la flecha cuadrada blanca del mouse se
transforma en una cruz, se aprieta el botón
izquierdo del mouse y, sin dejar de presionarlo,
se lleva hacia abajo hasta donde se desee;
varios números pseudo-aleatorios se
presentaran cuando se suelta el botón del
mouse.
La herramienta de análisis: Generación de
número aleatorio
• Paso 1: ir al menu de Herramientas y
escoger Análisis de datos; aparece la
respectiva pantalla (Figura 1.6);
• Paso 2: por medio de la barra de la derecha,
consiga entre las Herramientas de análisis, la
marcada con Generación de número aleatorio
(Figura 1.6):
• Paso 3: pulse OK en el extremo superior
derecho del cuadro, apareciendo en la pantalla
Generación de números aleatorios (Figura
1.7);
• Paso 4: en esa pantalla (Figura 1.7), en el
Número de variables, digite la cantidad de
columnas de valores que desea en la tabla de
salida, usualmente 1 (para generar una
columna). En Número de números aleatorios,
digite el total de números pseudo-aleatorios
deseado; cada valor generado aparecerá en
una línea de la planilla de salida. En
Distribución, seleccione el modelo que desea;
en el caso de muestras aleatorias simples, y en
la Uniforme, cuyo nombre se ve pulsando en la
flecha a la derecha de la palabra Discreta; en
ese momento aparece una lista de opciones.
Ahora se escoge la palabra uniforme,
apareciendo la figura1.8
PARAMETROS CENTRALES_____________________________________________________________
294
En la pantalla correspondiente a la Figura 1.8
deben ser escritos previamente los valores
inicial, 001, y final, 847, como el primero y el
último de los índices de las unidades de
población, así como la semilla aleatoria -en
este ejemplo, 1999. Si diferentes personas
usaran la misma semilla en el Excel, pero en
computadores diferentes, serán generados los
mismos dígitos, presumiblemente aleatorios.
La explicación es la de que, en Excel, existe
una regla para la generación de esos dígitos, la
cual, siendo la misma para codas las
máquinas, produce los mismos valores. Por
esto, siempre se debe comenzar con una
semilla aleatoria diferente en cada máquina. El
aspecto es el de la Figura 1.9.
• Paso 5: oprima OK en la parte superior de la
pantalla; aparecen todos los números pseudo-
aleatorios generados.
• Ejercicio-ejemplo 1.9
Digite en Excel, a partir de la pantalla de la
Figura 1.8, los valores 001 y 874 en los
espacios Entre.... Y.... y, con la semilla
aleatoria 1999, observe el número generado.
Cada combinación de resultados de dígitos
pseudo-aleatorios se vuelve semilla para el
siguiente; debe tenerse cuidado porque, si la
semilla es la misma, se repite la secesión de
dígitos pseudo-aleatorios, lo que quita el
carácter de aleatoriedad. Se garantiza, en la
práctica, la generación de dígitos pseudo
aleatorios usando una función matemática,
denominada generadora de dígitos pseudo-
aleatorios, de tal manera que, en caso de una
repetición de la semilla aleatoria, esta se
presenta después de tanto tiempo que, en el
intervalo entre un digito (o conjunto de ellos) y
su repetición, los dígitos generados pueden ser
considerados aleatorios.
ERROR ES EN EL MUESTREO
Generalmente, las causas de los errores en el
muestreo son las siguientes:
• Falta de aleatoriedad en la selección de las
unidades de la población que constituyen una
muestra aleatoria simple;
• Falta de representatividad de la muestra
respecto a la población;
"estadísticas” ¡Ah! Está en algunos periódicos
la estadística sobre el número de creyentes en
todo el mundo... Comprobarán con menos
precisión, cii-een-tííí-fica quien cree en la
madera, la piedra o el argot. Son los medios -
ah, los medios - los que repiten eso sin la
menor crítica. Confeso una cosa: a mi, madre
vino a preguntarme. Le consultaron a usted,
lector amigo? ...Y, dígame todo el mundo
estará "enmarcado" religiosamente? Nadie es
indiferente? Nadie tiene un más o menos o un
así, así? El cristiano es cristiano las 24 horas
Mito
En el muestreo, pensar que solamente existe una
generación única de dígitos pseudo aleatorios en
la cual cada uno de ellos tiene la misma
probabilidad de aparecer, olvidando
que hay diferentes modelos matemáticos para
generar dígitos pseudo-aleatorios.
PARAMETROS CENTRALES_____________________________________________________________
295
del día?"34
• falta de especificación o determinación de la
población, lo que puede suceder en un listado
incorrecto del marco muestral;
"Misterio. Los técnicos de IIBGE se llevaron
algunas sorpresas durante la elaboración del
Banco do Informaciones Municipales. Una de
ellas fue una cierta clase de nota de deceso, la
muerte por mal de ojo y afines: El problema,
restringido a la ciudad de Sao Paulo, registro
seis victimas. De qué se trate ese mal nadie
tiene la más remota idea. "
• Variación aleatoria, causada por la
variabilidad inherente a las diferentes
muestras;
"En lugares como Río Grande de Sul y Brasilia,
muy politizados, esas variaciones ya son
tradicionales."
“Hoy, la proporción de mujeres analfabetas
mayor que la de los hombres entre las
personas con más de 40 años que pasaran por
la escuela hace por lo menos más de 20 años.
La mayor diferencia se presenta entre Las
personas con más de 50 años. En ate grupo de
edad, el 28% de los hombres y el 34% de las
mujeres son analfabetas, según Los datos del
IBGE. "57
"Ya en la segunda feria, cuando el conteo de la
urnas mal se iniciara, el PT divulgó un
documento mencionando una docena de
diferencias entre los votos reales y las
investigaciones... y sugirió la creación de una
CPI. "38
“No inviten a la misma urna a luisa Erundina y
a los institutos de investigación. En 1988, al
ser elegida alcaldesa de Sao Paulo, ella
demostró que la encuesta no es una profecía.
En esta campaña, dijo que no votaría por
Francisco Rossi cuando el candidato iba
adelante en Las encuestas. Erundinas
verdaderamente una ranura de urna."39 "Esa
confusión se evidencia en los resultados de una
encuesta exclusiva encomendada por.... el
Instituto y llevada a cabo en cinco capitales del
país.” 38
INFORMACIONES ADICIONALES
UN TRABAJO EN EQUIPO
La mayoría de los problemas no es resuelta
únicamente por el estadístico, sino por un
grupo de personas que los conocen en detalle;
al estadístico le corresponde seleccionar las
herramientas estadísticas que ayudaran a
resolverlos. Debe hacerse énfasis en que el
espíritu de grupo es fundamental en cualquier
estudio; de ese modo, cada persona envuelta
en la investigación estadística tiene
importancia, porque, a primera vista, muchos
problemas pueden parecer vagos y con
definiciones complejas. Todos deben reunirse
para discutir detalladamente la naturaleza del
problema, las posibles opciones de solución y
las consecuencias de cada una de las posibles
decisiones. Al final, resulta un discernimiento
del problema y la percepción de los detalles,
pudiendo el equipo decidir si el problema es,
de hecho, estadístico; en caso de ser así, se
tiene un punto de partida para decidir sobre el
mejor modelo que debe ser adoptado.
UNA PALABRA DE ADVERTENCIA
La cantidad de información estadística que
llega al público es tan grande, que pudiera
desearse conocer la diferencia entre las buenas
y las malas estadísticas. Dicho esto, la emisión
de conclusiones erradas que salen de obser-
vaciones y valores absolutamente correctos
constituye un problema. Pero, además, a veces
sucede que, con los mismos valores, se
herejía
La estadística demuestra cualquier teoría
PARAMETROS CENTRALES_____________________________________________________________
296
generan decisiones conflictivas. Conviene
aclarar que el adecuado tratamiento estadístico
de un problema consiste en llevar a cabo una
serie de observaciones, realizar algunos
cálculos y llegar a una conclusión. Sin
embargo, es de fundamental importancia
preguntar primero, como se planeo la encuesta
y de que manera se anotaron las
observaciones. Como ocurre en cualquier área
del conocimiento, nada se consigue en
Estadística si no se tiene cuidado en el estudio
correcto de las fases de la investigación, desde
el concepto y el enunciado del problema,
pasando por el planeamiento del mismo, por la
etapa de recolección de las observaciones y
por el análisis y la interpretación de los resulta-
dos, hasta llegar a una conclusión valida. De
modo general, no hay cálculo matemático ni
manipulación estadística que pueda dar
resultados confiables, partiendo de
observaciones mal hechas o muestras mal
planeadas.
1. Se estudia la Estadística para aplicar sus
conceptos como soporte en la toma de deci-
siones ante situaciones de incertidumbre,
justificando las decisiones científicamente.
2. El método estadístico es un proceso utilizado
para obtener, presentar y analizar
características o valores numéricos para una
mejor toma de decisiones en situaciones de
incertidumbre.
3. El objetivo de la Estadística es el estudio de
la llamada población, la cual consiste de todas
las unidades de observación (comúnmente
personas, objetos o eventos) para las cuales se
desea tomar una decisión.
4. Al describirse una población estadística, se
deben diferenciar las unidades de observación
de las características de esa población. Una
unidad de observación es un objeto (o grupo
de objetos) sobre el cual se recogen datos y
que puede tener muchas características, a
pesar-de que el interés recaiga, generalmente,
sobre unas pocas de dichas características.
5. En Estadística, la variable atribuye un valor
a cada característica de la unidad de
observación, es decir, es una función ma-
temática que se define sobre la población. La
variable puede ser cualitativa o cuantitativa y,
esta última puede ser discreta o continua.
6. Cuatro escalas de medidas pueden ser usa-
das para caracterizar las unidades de una
población: nominal, ordinal, intervalar y
proporcional. El hecho de que una variable sea
expresada numéricamente no significa que
esta sea necesariamente cuantitativa, pues la
clasificación de la variable depende de la forma
como fue medida y no de la manera como se
manifiesta.
7. El estudio estadístico inicia con la
recolección de datos de una población o de una
muestra, constituida esta por n unidades de
observación y la cual debe tener las mismas
características de la población. El método por
el cual se obtiene una muestra de la población
en estudio se denomina muestreo.
8. El principal objetivo de cualquier plan de
muestreo es el de seleccionar la muestra de tal
manera que esta retrate fielmente a la
No hay justicia para que se llame estadística
aquellos estudios que no siguen las reglas
estadísticas
PARAMETROS CENTRALES_____________________________________________________________
297
población de la cual fue tomada, es decir, que
la muestra sea representativa de la población.
9. Entre las varias Bases de muestreo, se des-
tacan tres: sistemático, aleatorio simple y
estratificado.
10. El método de muestreo aleatorio simple
exige la simulación de un sorteo, lo cual se
hace a través de una selección de dígitos
pseudo-aleatorios.
11. Generalizar para la población lo que se
observó en la muestra caracteriza a la infe-
rencia estadística, la cual es la parte de la
Estadística que utiliza una muestra para
deducir generalidades con respecto a los as-
pectos importantes de una población.
.12. Como las informaciones provienen de un
subconjunto de la población, se cometen
errores al deducir una inferencia. Esos errores
pueden ser cuantificados matemáticamente,
así como la probabilidad de cometerlos, la
cual, además de tratar con situaciones
influenciadas por factores no controlados por el
analista, proporciona un modelo racional para
tratar con la variabilidad inherente a la
naturaleza, así como con las situaciones
aleatorias.
13. Con la aparición de las calculadoras
electrónicas y los computadores, el trabajo
estadístico se hizo más fácil pues se facilitan
los círculos interactivos y se economiza tiempo
para la modelación de los problemas, para la
recolección de los datos y para el análisis de
los resultados.
14. La tecnología modifico radicalmente la ma-
nera de enseñar y aprender la Estadística, así
como la manera de resolver problemas.
15. Generalmente las causas de los errores en
el muestreo son la falta de aleatoriedad en la
selección de las unidades de la población en
muestreo aleatorio simple, la ausencia de
representatividad de la muestra respecto a la
población, la especificación errónea de una
población y la variación aleatoria.
16. La mayoría de los problemas no es resuelta
solamente por el estadístico sino por un grupo
de personas que conoce los detalles; al
estadístico le corresponde seleccionar las
herramientas estadísticas que ayudan a re-
solver los problemas; el espíritu de grupo es
fundamental en cualquier estudio.
17. La cantidad de informaciones estadísticas
que llega al público es tan grande que se
puede distinguir entre las buenas y las malas
estadísticas. Otro problema es el de emitir
conclusiones erradas a partir de observaciones
y valores absolutamente correctos. Pero a
pesar de todo, a veces sucede que, con los
mismos valores, se producen decisiones
conflictivas. Por esto, es fundamental
preguntar, primero, como se planeó la
encuesta y cómo se anotaron las
observaciones.
EJERCICIOS PROPUESTOS
1. La Tabla 1.2 da un listado de las 30 mayores
empresas privadas del Brasil por concepto de
ventas, y los países que tienen la mayoría de
acciones en ellas (revista Exame, Maiores e
Melhores, Julio de 1998?
a. Uso la tabla de dígitos pseudo-aleatorios
(Tabla 1.1) para seleccionar ocho de esas
empresas para ser entrevistadas y pregun-
tarles los detalles con respecto a sus estrate-
gias de crecimiento. Comenzando con el
extremo superior derecho y moviéndose hacia
abajo en las dos últimas columnas de la
derecha, observe que los primeros números de
dos dígitos obtenidos son 64, 06 y 75;
determine las demás empresas siguiendo la
misma indicación. b. Identifique el tipo de
escala de control accionario de esas empresas.
2. Los resultados del SAEB (Sistema de
Evaluación de la Educación Básica) en 1997, se
basaron sobre una muestra de 167.196
estudiantes de las 27 unidades de la federación
PARAMETROS CENTRALES_____________________________________________________________
298
de escuelas públicas y privadas del Brasil.
Estos resultados generaron polémicas, porque
mientras los estados que tuvieron una buena
evaluación festejaban los resultados, la
secretaria de Educación de un estado afirmaba
que había salido perjudicado porque la
evaluación excluyó a los alumnos de las
escuelas técnicas estatales, los cuales "tienen
un desempeño mejor".41
a. Identifique la clase de escala utilizada en la
frase "tienen un desempeño mejor".
b. Justifique su aprobación o desaprobación en
referencia a la afirmación de esa secretaria de
Educación.
3. En la Ingeniería de Evaluaciones, se
consideran diversas características de un
inmueble para el cálculo de los precios de
venta y de alquiler de los inmuebles
comerciales y residenciales. a. Identifique el
tipo de escala que se utilizaría para las
siguientes características: área, área
construida, y localización.42 b. Explique como
cuantificaría la existencia o inexistencias de un
garaje en el predio. Un articulo de la revista
Professor de Matemática, n° 3, del segundo
semestre de
1983, explica cómo un genio puede salir
reprobado en un examen de inteligencia,
porque la mayoría de las pruebas exige in-
tuición y no deducción, palpitos en vez de
raciocinio lógico. Con los conocimientos que ya
tiene de Estadística, responda la siguiente
pregunta: ¿qué número falta en la siguiente
sucesión 1, 2, 4, 5?
5. Identifique las clases de escala utilizadas en
cada una de las siguientes características de
las unidades de observación, tomadas de una
tabla de la Guía del Usuario del programa de
Microsoft-Excel: mes, clase de producto, ven-
dedor, región del país, unidades vendidas y
total de ventas.
6. Identifique el tipo de muestreo empleado en
esta encuesta: "La encuesta investigó a
mujeres de todas las clases sociales, con eda-
des que fluctúan entre los 25 y los 70 años. En
ese universo, 66% afirmo que el Viagra puede
mejorar el desempeño sexual de su pareja." `
7. En el libro "Las buenas prácticas de los la-
boratorios clínicos y listas de verificación",
utilizado en brasil, consta que el registro del
paciente debe contener, entre otras, las
siguientes informaciones:
a. nombre;
b. edad;
c. sexo;
d. procedencia u origen (por ejemplo, puesto
de consulta, convenio, etc.);
e. fecha de nacimiento;
f. número de registro;
g. teléfono del paciente o del solicitante (si no
lo tiene, es obligatoria la dirección):
h. nombre del responsable del paciente (si
fuere el caso);
i. teléfono del responsable (si no lo tiene, es
obligatoria la dirección).
Con base en esas informaciones, construya una
tabla en la cual todas estas características
puedan ser registradas.
8. Un articulista afirma que "cerca del 33% de
la población brasileña afirma tener una o dos
PARAMETROS CENTRALES_____________________________________________________________
299
malas noches semanalmente, lo cual altera la
calidad de vida de la persona." Discuta esta
afirmación.
9. Según la edición especial de la revista " Vea-
30 años", de 1998, cada ejemplar es leído por
cuatro personas. Son 4,5 millones de lectores
por semana". Comente como llego la revista a
ese resultado.
10. "Los almacenes de artículos deportivos
pretenden reforzar en el consumidor en espe-
cial en el joven entre 15 y 29 años que gusta
de deportes tales como el surf y el patinaje - la
idea de que esos deportes son la imagen de su
estilo de vida".46 Identifique el tipo de
muestreo realizado.
11. "Es más: los lectores pedirán y nosotros los
atenderemos". Ester frase del publicista de la
revista Internet World, de diciembre de1998,
expresa una decisión tomada con base en
informaciones recibidas. Explique como
pudieron ser consultadas las opiniones de los
lectores, indicando los puntos posibles donde
hubo fallas en el muestreo.
12. Para la revista Internet Business de diciem-
bre de 1998, los grandes hospitales montan
redes de atención a los pacientes y de
intercambio de informaciones basadas en la
Web. Sin embargo, según un médico, "la red
aún no está lista para transmitir grandes
volúmenes de información en poco tiempo".
Identifique en este párrafo del artículo "salud a
distancia', la población de la que se habla y la
tendencia del empleo de muestreos a medida
que la capacidad de almacenamiento de la
información se haga mayor.
13. Considere la siguiente noticia: "Los ingle-
ses prefieren la novia a la TV" Una encuesta
realizada entre los ingleses con edades
comprendidas entre 18 y 30 años, demostró
que el 24% escogería a la novia si los pusieran
en la disyuntiva de optar por ella o la TV.""
Indique la importancia de la estadística en la
interpretación de las afirmaciones divulgadas
por la prensa.
14. Después de una encuesta, se hace una
crítica inicial de las observaciones para verificar
la exactitud de cada respuesta. El objetivo es,
si es necesario, repetir alguna entrevista,
rectificar los valores dudosos y preparar el
material para ser ubicado en una escala
numérica.
a. Justifique la necesidad de la crítica.
b. Explique sobre la necesidad de dar en-
trenamiento a los encuestadores para evitar
ese trabajo de depuración.
15. La creación de estereotipos con relación a
los pueblos del mundo se basa en opiniones
emitidas por pocas personas y acaban
diseminándose. En un reportaje sobre
estereotipos48, se publicó que "el personaje
humorístico Gardelón, de Jô Soares, es res-
ponsable de la muletilla muy amigo", sin duda
la más popular de todas ellas. "Fue basada en
un empresario artístico argentino que él
conocía”, relata el humorista. Exponga, con
base en los conceptos de muestreo, las causas
posibles de la aparición de los estereotipos.
16. Un ex ministro de Plantación afirma en un
artículo49 que, "en los Estados Unidos, en el
censo de población, me preguntaban si era
caucásico, mejicano, ario, asiático, mongólico y
otras tantas clasificaciones cuyo significado no
conocía.”
a. Identifique la clase de escala utilizada para
clasificar la nacionalidad de una persona.
b. Argumente sobre la precisión de las in-
formaciones obtenidas en un censo demo-
gráfico.
c. -Indique las consecuencias posibles debidas
al hecho de que un entrevistado no conozca el
significado de algunos términos contenidos en
Las preguntas que le son hechas.
17. Considere el artículo periodistico50 que
afirma, con respecto a las encuestas realizadas
antes de las elecciones de 1998, en Brasil:
PARAMETROS CENTRALES_____________________________________________________________
300
a. "Nadie duda del poder de inducción que
tienen las encuestas electorales.”
Comente esta afirmación con base en su propia
apreciación.
b. "¿...sería una fantasía sospechar que las
encuestas son manipuladas? ¿Y especialmente
si, una vez abiertas las urnas, las divergencias
entre los resultados y las previsiones son
significativas, o que se puede pensar? ¿O serán
apenas errores inocentes de los institutos-que,
por cierto, nunca yerran en sus apariciones
ante las audiencias de la TV, o en las
encuestas de mercado para el lanzamiento
comercial de productos? Discuta estas
afirmaciones.
18. Anuncio de la empresa de teléfonos: "La
encuesta... muestra que, siete meses después
de entrar en operación en la ciudad, la celular
XYZ recibe una calificación de 7.3 contra 6.4
de la competencia. Luego, a continuación de
esta noticia, el comentario "En la evaluación
de... la telefónica XYZ tiene el mejor servicio
de telefonía celular con un 63% de
satisfacción. "
Comente con respecto a esas cifras.
19. Comente la siguiente noticia: "Según la
encuesta realizada telefónicamente, el fin de
semana pasado, con una muestra de 961
personas, el 32% de los entrevistados dijeron
que votarían por Chile. Otro 17% afirmó no
conocer la respuesta."52
20. "Cómo se llevó a cabo la encuesta: el
trabajo se llevó a cabo por medio de
entrevistas personales en un grupo de más de
500 millonarios y de encuestas con mas de
11.000 personas de ingresos altos o con un
alto patrimonio liquido. Cada una respondió
249 preguntas sobre los más diversos tópicos
relacionados con el dinero". "Esta noticia fue
publicada en la revista Voce de diciembre de
1998, en el artículo "El millonario vive al lado".
Sucede que los resultados se refieren a los
Estados Unidos. En caso de que usted deseare
hacer la misma encuesta, describa brevemente
cómo la realizaría y cuales serían sus fuentes
de consulta así como las posibles dificultades.
SOLUCIONES DE LOS EJERCICIOS-
EJEMPLO
1.2 La escala adoptada es la ordinal.
1.3 Las notas pueden ser ordenadas y una vez
hecho esto, determinadas las diferencias entre
si, constantes y conocidas, tienen un cero en
común. La nota 6.5 es 0.1 mayor que 6.4, la
misma diferencia que hay entre 6.4 y 6.3; la
escala es proporcional.
1.5 a. Con base en una muestra de 8.548 per-
sonas, se estima que la marca de jabón a favor
de ABC es recordada por (683/8.548) x 100 =
7.99% del total de consumidores; el periódico
informó de un 8%;
b. Inferencia estadística, pues fue utilizada una
muestra para sacar una conclusión con
respecto al porcentaje de consumidores que
recuerda la marca del jabón.
1.6 Falso; siempre hay un chance de que los
datos presentados por la muestra no reflejen
adecuadamente las características de la
población.
FUENTES DE NOTICIAS Y CITAS
1. Pierre Simon, marques de Laplace,
matemático francés del siglo XVIII.
2. Iván Soter, especialista en informática quien
almacena en un computador los valores sobre
la selección y sobre las personas que se
dedican a hacer estadísticas sobre esa selec-
ción. Folha de S Paulo, 24/12/1995.
3. Carlos Drummond de Andrade. Jornal do
Brasil, 29/8/1981.
4. Anuncio del Jornal do BrasiL 4/l/1999
5. Folha de S. Paulo, 9/12/1998.
6. Revista Época, Año 1 # 21, 12/12/1998.
PARAMETROS CENTRALES_____________________________________________________________
301
7. Folha de S Paulo, 4/1/1999.
8. Folha de S Paulo, 4/l/1999.
9. Folha de S. Paulo, 2/1/1999.
10. Revista Época, Afio 1, # 33, 4/1/1999.
11. Revista Época, Ano 1, # 33, 4/1/1999.
12. Anuncio sobre una preparación sólida ar-
tificial para un refresco.
13. Revista Domingo, Jornal do Brasil, # 1.
185,
17/1/1999.
14. Revista Época, Año 1, # 33, 4/1/1999.
15. Anuncios de aparatos telefonicos celulares.
16. Declaración del Impuesto Anual, Instruc-
ciones para su diligenciamiento; Impuesto
sobre la Renta- Personas naturales, 1999.
17. Folha de S Paulo, 27/12/1998.
18. Suplemento "Un año para o año 2000",
Folha de S. Paulo, 1 /I/ 1999.
19. Folha de S. Paulo, 4/1/1999.
20. Folha de S. Paulo, 4/111999.
21. Folha de S Paulo, 18/10/1998.
22. Folha de S. Paulo, 7/1/1999.
23. Folha de S. Paulo, 10/ 12/1998.
24. Folha de S Paulo, 18/10/1998.
25. Folha de S. Paulo, 18/10/1998.
26. Folha de S. Paulo, Suplemento especial, I /
12/ 19')8.
27. Folha de S. Paulo, 6/1/1999.
28. Tolha de S. Paulo, 18/10/1998.
29. Folha de S. Paulo, 1 / 12/1998, Cuaderno
especial Top of Mind.
30. Desde este Puerto Seguro, de Vuestra Isla
de Veracruz, hoy, sexta feria, primero de mayo
de 1500, Pedro Vaz de Camina.
31. Jornal do Brasil, 22/12/1998.
32. Jornal do Brasil, Informe Economico,
10/12/1998.
33. Observaciones de un lector. Folha de S.
Paulo, 27/12/1998.
34. Millôr Fernández, en el periódico "O Día",
17/1/1999
35. Folha de S Paulo, 13/12/1998.
36. Revista Época, Año 1, #21, 12/12/1998.
37. Folha de S Paulo, 13/11/1998.
38. Revista Época, Año 1, #21, 12/12/1998.
39. Revista Época, Año 1, #21, 12/12/1998.
40. Revista Época, Año 1, #21, 12/12/1998.
41. Folha de S Paulo, 26/ 11 / 1998.
42. Cuaderno Brasilero de Avaliacoes e
Pericias, año X, #111, Septiembre de 1998.
43. Revista Época, Año 1, #21, 12/12/1998.
44. Inmetro - Instituto Nacional de Metrología,
Normalización y Calidad Industrial, ISBN
857303/735 Qualitymark Editora 1997.
45. Revista Boa Fama Homem, Afio 1, edition
3, diciembre de 1997.
46. Revista Isto E Dinheiro, 2/9/1998.
47. Folha de S. Paulo, 10/ 12/1998.
48. Folha de S. Paulo, 27/11/1998.
49. Folha de S. Paulo, 30/11/1998.
50. Hello Amorim, El arte de inducir, Jornal de
Brasil, 13/11/1998.
51. Folha de S. Paulo, 10/ 12/1998.
5 2. Folha de S. Paulo, 2/12/1998.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
302
El análisis exploratorio de los datos es la fase
inicial del proceso de estudio de los elementos
recolectados en las muestras. En esta etapa de
la evaluación, se emplean técnicas que
resumen y clasifican al conjunto de datos
recogidos para obtener las informaciones
pertinentes que serán utilizadas en la fase final
del proceso, la llamada inferencia estadística
(ver Capítulo 4), también conocida como
análisis confirmatorio de los datos. La
exploración o evaluación analítica de los datos
de la muestra es un enfoque (o filosofía) para
el análisis de los mismos, utilizando una
variedad de técnicas gráficas, con los
siguientes objetivos:
• tener el mejor conocimiento posible sobre un
conjunto de datos de una muestra;
• descubrir las estructuras básicas de la
organización de la población;
• identificar anomalías y datos dispersos;
• desarrollar modelos matemáticos adecuados
para el calculo de probabilidades y la inferencia
estadística.
Una vez recolectados los datos de todas las
variables contenidas en determinado estudio,
el paso siguiente consiste en descubrir lo que
esos datos tienen que decir con respecto a lo
que se esta investigando. Hojear una larga
lista de datos no permite extraer ninguna
conclusión; es preciso usar mediciones- tablas
o gráficos que resuman y muestren el
comportamiento de las variables, permitiendo
interpretaciones prácticas. En otras palabras,
deben emplearse técnicas que muestren las
informaciones contenidas en las variables.
En la vida diaria, vemos que los periódicos, las
revistas y los artículos técnicos publican,
frecuentemente, noticias relacionadas con
porcentajes, medias aritméticas, tablas y
gráficos, que son recursos destinados a
complementar la presentación de un hecho o
justificar un argumento.
Un gráfico relativo a la noticia "El cambio
vuelve a caer con la devaluación del real"
ilustra el "valor del real en dólares" a lo largo
de quince días.
O Navegando en Internet
Trate, en el índice de búsqueda Cadê
(www.cade.com.br), las direcciones de los
periódicos brasileños y localice las secciones
que contienen gráficos estadísticas
.
DESCRIPCIÓN DE LA MUESTRA:
ESTADÍSTICA DESCRIPTIVA
Como su nombre lo indica, la Estadística
Descriptiva tiene como finalidad describir las
unidades de observación recolectados en la
muestra. Ésta permite hacer comentarios
sencillos, de la manera más informativa
posible, empleando métodos numéricos y
gráficos. La interpretación de los resultados no
está incluida en el ámbito de la estadística
descriptiva; ella es función de la inferencia
estadística, la cual abordaremos con mayor
profundidad en el Capítulo 4.
ANALISIS EXPLORATORIO DE LOS DATOS
Informaciones
Son los datos que pasaron algún tipo de análisis
de tal manera que se vuelven útiles
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
303
COMENZANDO A ORGANIZAR LOS
VALORES DE LAS UNIDADES MUESTRALES
En la revista EXAME- Maiores e Melhores de
julio de 1998, no todas las entidades
relacionadas en una muestra de las 100
empresas privadas más grandes, en términos
de ventas, mencionaron su número de
empleados. De las 100 primeras, sólo 80
dieron los datos completos, los cuales
aparecen en la Tabla 2.1 (Note la ausencia de
los números 6, 14, 20, etc.). Cuando se
colocan en forma de lista o tabular, los valores
de la muestra son llamados los datos brutos de
la muestra. Pero aún si estuvieran agrupados
de la manera en la que fueron recolectados,
sería difícil, por ejemplo, localizar los valores
menor y mayor, o decidir si los valores están
concentrados o dispersos. Basta, por ejemplo,
colocarlos en orden creciente (o decreciente)
para tener una primera idea de la posición
relativa de esos valores. Esa lista ordenada se
llama la lista de la muestra.
Aunque, como es obvio, sea posible crear a
mano la lista de las muestras, esto requiere
mucho trabajo. Es más fácil hacerlo con una
calculadora científica o con la ayuda del Excel.
EMPLEO DE LA CALCULADORA PARA
ORDENAR LOS VALORES
• Con la calculadora HP 486
• Paso 1: introduzca los datos en una lista, la
cual estará en el nivel 1;
• Paso 2: teclee [MTH] (primera tecla de la
segunda fila de teclas) y las teclas blancas [C],
(LIST) y [D] (SORT); aparecen la lista
ordenada.
• Con la calculadora Casio CFX-
9850G/995OG
• Paso 1: inserte los datos en una lista, por
ejemplo lista 1; aparece un menú con la tecla
SRT.A (orden creciente), SRT D (orden
decreciente), DEL (elimina un solo dato) DEL.A
(elimina todos los datos), y la tecla INS
(incluye un nuevo dato); para cada uno de
estos comandos corresponden las teclas [F1],
[F2], [F3], [F4] Y [F5] respectivamente.
,
• Paso 2: teclee [F1] (SRT.A) para ordenarlos
en forma creciente o [F2] (SRT.D) para
ordenarlos en forma decreciente. Surge una
pregunta: ¿Cuántas listas?; teclee [1] [EXE];
aparece seleccionar lista [C]; tecleé [1] y
[EXE] y la lista aparece ordenada.
Tabla 2.1 cantidad de empleados en las 100
mayores empresas privadas del brasil,
clasificadas por ventas
Lista de muestra
es el conjunto de los valores de muestra,
dispuesto en orden creciente o decreciente.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
304
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
305
• Con la calculadora Texas TI-83
• Paso 1: teclee [2nd][STAT] (List). Aparece
NAMES OPS MATH:
• Paso 2: con la tecla que tiene la flecha hacia
la derecha, selección OPS,1 : destacado,
equivalente a Sort Al (orden ascendente);
• Paso 3: teclee [ENTER] [2nd] [1] [equivale a
Lista 1] [)] [ENTER]; aparece Done y, para
encontrar el resultado, teclee [2nd] [1]
[ENTER] y aparecerá la Lista 1, ahora
ordenada.
EMPLEO DEL EXCEL PARA ORDENAR LOS
VALORES
•Paso 1: digite los valores en la columna A
(puede ser cualquier otra), un valor en cada
celda;
•Paso 2: seleccione las celdas que tienen los
valores (tecleando en la primera celda con el
botón izquierdo del mouse y arrastrando el
puntero, sin soltar el botón del mouse, hasta la
última celda); todos los valores aparecen
agrupados;
• Paso 3: en la Barra de Menús, en Datos...,
escoja Clasificar...; se abre una pantalla en la
cual se teclea Creciente en Clasificar, por,
teclee OK; en la columna A, en la cual los
valores fueron digitados originalmente,
aparecen los números ordenados.
• Ejercicio-ejemplo 2.1
Construya en EXCEL la lista de las medidas de
la muestra de la Tabla 2.1 (Guarde esta
plantilla: se usará en otros ejercicios).
UN NÚMERO QUE LOS REPRESENTA A T
ODOS: LAS LLAMADAS MEDIDAS DE
TENDENCIA CENTRAL
Para caracterizar a un conjunto de valores de
una muestra, es preciso escoger un valor único
que represente a todos los demás valores de la
muestra. Podrían escogerse innumerables
medidas, pero existen algunas que sugieren
una concentración a su alrededor, siendo por
esto llamadas medidas de tendencia central.
Para una muestra, las tres medidas más
conocidas son la media aritmética, la mediana
y la moda de la muestra.
Entendiendo el concepto de la media
La media de un conjunto de números es un
valor que, teniendo en cuenta la totalidad de
los elementos del conjunto, los puede sustituir
sin alterar determinada característica de ese
conjunto.
Hay dos clases comunes do media:
• Si la característica del conjunto es la suma de
sus elementos, se tiene la más sencilla de
todas Las medias: la media aritmética.
• Si la característica del conjunto es el
producto de sus elementos, se tendría la
medida geométrica.
DETERMINACIÓN DE LA MEDIA
ARITMÉTICA DE LA MUESTRA
•En lenguaje familiar
La media aritmética de una muestra es un
número que, teniendo en cuenta al total de los
elementos de la muestra, los puede
representar a todos sin alterar la suma de sus
componentes. Como la suma de los n
elementos debe ser igual a n veces la media
aritmética, para determinar la media aritmética
(simple) de la muestra (o, sencillamente,
media de la muestra), calculada a partir de un
conjunto de valores, se suman todos los
valores y esta suma se divide por la cantidad
de valores.
La media aritmética de la muestra puede no
pertenecer al conjunto original de valores, y
tampoco tiene que tener un significado real.
“El número de miembros de las familias
brasileñas está disminuyendo. En cinco años
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
306
(desde 1992 hasta 1997), el número promedio
de personas en cada casa cayó de 3.8 a 3.5,
según la Encuesta Nacional para la Muestra
Domiciliar (PNAD), divulgada por el IBGE. "2
"La tasa de natalidad- de 4.3 hijos por coda
mujer en 1980, llegó a 2.5 hijos por mujer en
1997 "3
• Ejercicio-ejemplo 2.2
Determine la media aritmética de la muestra
de la Tabla 2.1.
• Con las fórmulas
De manera general, el valor es representado
por una letra, comúnmente la X, y cada valor
esta identificado con un índice, comúnmente la
letra i escrita en la parte inferior de la; es
decir, cada valor está representado por X,
Pueden ser empleadas
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
307
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
308
[F3](Mean) [F6], (flecha hacia la derecha),
[F6] (flecha hacia la derecha) [F1] (List) [I] (si
fuera la Lista 1) [)] (marca paréntesis) y
[EXE]. Aparece en la pantalla el valor de la
media de la Lista 1, Mean (List 1).
• Con la calculadora Texas TI-83
• Paso 1: introduzca los datos en una lista;
• Paso 2: teclee [2nd] [STAT)(LIST); escoja
MATH y digite [3], apareciendo mean:;
• Paso 3: teclee [2nd) [1] [ENTER].
• Con el Excel
Para el cálculo de la media aritmética con el
Excel, se emplea Colocar Función con los
siguientes pasos:
• Paso 1: primero, escoja una celda
(volviéndola activa) donde desea colocar el
resultado deseado;
• Paso 2: oprima dos veces en el icono Colocar
Función, abriéndose la pantalla
correspondiente a la Figura 2.1;
• Paso 3: oprima en el cuadro de la izquierda,
en la categoría Estadística y, en el cuadro de la
derecha, en MEDIA (la cual debe encontrarse
accionando la barra de deslizamiento lateral) y,
en la parte inferior, en OK; aparece la pantalla
de la Figura 2.2.
• Paso 4: digite en el rectángulo Num 1 (que
ahora tiene una señal vertical intermitente),
las celdas inicial y final del conjunto de valores
para los cuales desea determinar la media
aritmética de la muestra, separadas por dos
puntos o, si no, seleccione el conjunto de
valores oprimiendo en la primera celda y
llevando el puntero del mouse (sin soltar el
botón izquierdo) hasta la última celda (sin
preocuparse por la notación, incluyendo el
signo $); en este último caso, obsérvese que
en Num 1 aparecen las columnas inicial y final
donde fueron digitados los valores y, a la
derecha, aparece una parte de la lista de estos,
a continuación aparece Num 1 (el resultado de
la media aritmética de la muestra aparece en
el extremo inferior izquierdo, Resultado de la
formula).
• Paso 5: haga click en OK; cierre la pantalla y
el resultado aparece en la celda tornada activa
en el Paso 1.
• Ejercicio-ejemplo 2,3
Usando el Excel, determine la media aritmética
del número de empleados de las empresas
mencionadas en la Tabla 2.1.
DETERMINACIÓN DE LA MEDIA
ARITMÉTICA PONDERADA DE LA MUESTRA
La media ponderada de una muestra es la
resultante de un conjunto de valores de los
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
309
cuales algunos tienen más importancia (o
frecuencia de presentarse) que los otros.
“El Instituto Brasileño de Geografía y
Estadística (IBGE) va a revisar el cálculo del
índice de inflación (INPC) para que refleje más
fácilmente el costo de vida... El sector del
vestuario, con un peso del 10% en la
conformación del índice, debe quedar con una
producción entre el 5% y el 6%. "4
• Con el lenguaje familiar
Debe multiplicarse cada valor por el número
atribuido a su importancia en el conjunto de
datos (el número es llamado el peso o
ponderación), sumar todos los productos así
obtenidos y dividir el total por la suma de los
pesos.
"El examen oral y la redacción tienen peso dos.
Queremos un alumno que sepa expresarse;
por esto, nuestros exámenes orales y de
redacción tienen peso dos."5
• Ejercicio-ejemplo 2.4
En la Tabla 2.2 se relaciona la puntuación de
los 20 primeros puestos en el ranking del
fútbol brasileño - versión 1998 - y la cantidad
de campeonatos y sub-campeonatos ganados
en diferentes torneos por esos equipos. La
puntuación de cada equipo se relaciona en la
Tabla 2.3. Con base en esas informaciones,
encuentre la puntuación de los que ocupan los
dos primeros lugares.
• Con la calculadora HP 48G
Este procedimiento emplea dos listados: uno
que contiene los valores y otro que contiene la
frecuencia con la que se ha presentado ese
valor. La frecuencia de los datos en la celda 1
del primer listado, esta indicada por el valor de
la celda 1 de la segunda lista, etc. Los dos
listados, deben contener la misma cantidad de
datos; en caso contrario, aparece un mensaje
de error.
•Paso 1: escriba los datos en las dos columnas
en ΣDAT, la primera con los valores y la
segunda con las frecuencias de los valores,
respectivamente;
• Paso 2: oprima las tedas verde y [5]; se abre
una pantalla con opciones;
• Paso 3: escoja Summary Sats... y tedee [F];
• Paso 4: marque ΣXY y oprima la tecla blanca
[F] (OK); aparece el resultado de la sumatoria
de los productos;
• Paso 5: digite el total de los números; teclee
[÷] y aparece la media ponderada.
• Con la calculadora Casio CFX-9850GI9
95OG
Este procedimiento emplea dos listados: uno
que contiene los valores y otro que contiene la
frecuencia con la que se presenta cada valor.
La frecuencia del dato de la celda 1 en la
primera lista, esta indicada por el valor de la
celda 1 del segundo listado, etc. Los dos
listados deben contener la misma cantidad de
datos pues, en caso contrario, aparece un
mensaje de error.
• Paso 1: inserte los datos de los dos listados:
el primero con los valores y el segundo con las
frecuencias de los valores respectivamente;
• Paso 2: tedee [MENU] para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción RUN y
teclee [EYE];
• Paso 4: oprima, en orden, las teclas [OPTN],
[F1] (LIST), [F6] (flecha hacia la derecha) [F3]
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
310
(Mean) [F6], (flecha hacia la derecha), [F6]
(flecha hacia la derecha) [F 1) (list) [1] (si es
la lista 1), teclee [,] (localizada sobre la tecla
[DEL)), [F 1 ] (list) [2] (si es la lista 2) [) ]
(flecha de paréntesis) y [EYE]; aparece en la
pantalla el valor de la media ponderada de los
valores del listado 1 que tiene los pesos del
listado 2.
• Con la calculadora Texas TI-83
• Paso 1: cree las dos lista, la primera con los
valores (Lista 1) y la segunda (lista 2) con los
pasos.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
311
• Paso 2: teclee [2nd] [STAT] (LIST); escoja
MATH y digite [3], y aparece mean;
•Paso 3: teclee [2nd] [1] [,] [2"d] [2] [ENTER].
• Con el Excel
Para el cálculo de la media aritmética
ponderada de la muestra, emplee la función
Colocar Función con los siguientes pasos:
• Paso 1: digite en una columna los valores
para los cuales se desea la media aritmética
ponderada; en la columna A, por ejemplo, de
Al hasta A5, y en la columna B, los respectivos
pesos desde B 1 hasta B5;
• Paso 2: escoja una celda donde quiera que
aparezca el resultado, volviéndola activa;
• Paso 3: tedee dos veces en la celda activada
y digite:
=SUMAR PRODUCTO (A1:A5; B 1:B5)/SUMA (B
1:B5);
• Paso 4: teclee ENTER y el resultado aparece
en la celda activada.
Excelencia Empresarial Indicador creado par
Maiores e Melhores. Es obtenido por medio de
la suma de los pesos ponderados conseguidos
por las empresas en cada uno de los seis
indicadores de desempeño: liderazgo en el
mercado (peso 10), crecimiento en ventas
(peso 20), rentabilidad de patrimonio (peso
25), activos corrientes (peso 20), inversiones
no inmovilizadas (peso 15) y valor agregado
por empleado (peso 10). Observar que, a la
rentabilidad y a las inversiones no
inmovilizadas apenas les son atribuidos puntos
cuyos índices son positivos. En cada indicador,
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
312
la escala de los puntos iniciales ya desde 10
para el primer lugar, hasta I para el décimo.
Así, el primer lugar en rentabilidad obtiene 250
puntos, 10 veces los puntos iniciales de peso
25.6
Determinación de la media geométrica de la
muestra
• En lenguaje familiar
La media geométrica de una muestra es un
número que, teniendo en cuenta la totalidad de
los elementos de la muestra, los representa a
todos, sin alterar el
Medida geométrica de la muestra
resultado de tomar la raíz de orden n del
producto de todos los valores de la
muestra.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
313
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
314
•Paso 3: haga click en el cuadro de la
izquierda, en la categoría Estadística y, en el
cuadro de la derecha, MEDIA.GEOMETRICA
(que se alcanza con la barra de rotación
lateral); en la parte inferior, pulse OK y
aparece la Figura 2.5;
• Paso 4: digite, en el rectángulo Num. I (que
muestra una señal vertical intermitente), las
celdas inicial y final del conjunto de valores
para los cuales desea calcular la media
geométrica de la muestra, separadas por dos
puntos y entonces, registre el conjunto de
valores pulsando y llevando el puntero del
mouse (sin soltar el botón); en este último
caso, observe que en Num I aparecen las
columnas inicial y final donde fueron digitados
los valores y, a la derecha, parte de ese
listado; una vez llenado Num I, el resultado de
la media geométrica aparece en el extremo
inferior izquierdo (Resultado de la formula);
• Paso 5: pulse OK; cierre la pantalla y el
resultado aparece en la celda activada en el
paso 1.
"El estimativo de IBGE para la labranza del
arroz irrigado en la zafra de 198/99 es de un
área de 895.088 hectáreas, (una hectárea
equivale a 10.000 m2.) con una producción de
4.629.361 toneladas (una tonelada equivale a
1000 kilos), y una productividad inicial de 5. ;
72 kilos por hectárea. "
• Ejercicio-ejemplo 2.5
a. La, importaciones brasileñas durante 1998
fueron las siguientes, en billones de dólares:
enero 4.577; febrero, 3.799; marzo, 5.038;
abril, 4.779; mayo, 4.913; junio, 4.844; Julio,
5.329; agosto, 4.634, septiembre, 5.338,
octubre, 5.039, noviembre, 4.709, diciembre,
4.538.8 Determine la media de las
importaciones brasileñas en 1998.
b. El crecimiento del Brasil fue del 2.8% en
1996, 3.7% en 1997 y 0.5% en 1998.9
Determine la tasa media de crecimiento del
Brasil en esos tres años.
Entendiendo el concepto de la mediana
La mediana de una muestra es el valor que
ocupa la posición central de la lista, cuando los
valores están colocados en orden creciente o
decreciente e incluyendo también los valores
repetidos, individualmente, en la lista orde-
nada. La mediana de la muestra divide al
conjunto total en dos partes iguales, con la
mitad de los valores sobre la mediana de la
muestra y la otra mitad debajo de ella. La
mediana de la muestra puede no pertenecer a
un conjunto original de valores.
Cuando la cantidad de valores es impar, la
mediana de la muestra es el valor que ocupa la
posición central, la cual, es única.
Cuando la cantidad de valores es par, hay dos
posiciones centrales en la lista ordenada;
entonces, la mediana de la muestra es la
media aritmética de esos dos valores que
ocupan las posiciones centrales.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
315
DETERMINACIÓN DE LA MEDIANA DE LA
MUESTRA
• En lenguaje familiar
Haga una lista de la muestra y compruebe cual
es el valor que ocupa la posición central; si hay
un número par de valores, hay dos posiciones
centrales y, en ese caso, la mediana de la
muestra es la media aritmética de los valores
que ocupan esas posiciones.
•Ejercicio-ejemplo 2.6
Determine la mediana del comportamiento de
la Bolsa de Valores de Río de Janeiro en la
primera semana de enero de 1999, con base
en el 0%: 2a ronda: +i.4%; 3a ronda. +2.4%;
4a ronda: +2%, 5a ronda: -3.1% y 6a ronda: -
1.2%. 10
• Ejercicio-ejemplo 2.7
Determine la mediana de los siguientes índices
de reajuste de alquileres: IPCA, 1.76%; IGP,
1.41%; INPC, 2.64%; e IGP-M, 2.18%."
•Con las formulas
Haga una lista con los n valores de la muestra;
si hay un número impar de valores, la mediana
de la muestra es el valor que ocupa la (n +
1)/2-ésima posición a partir del comienzo de la
lista.
•Ejercicio-ejemplo 2.8
Determine la mediana del comportamiento de
la Bolsa de Valores de Río de Janeiro en la
primera semana de enero de 1999, con base
en el 0%: 2a ronda: +1.4%; 3a ronda: +2.4%;
4a ronda: +2%; 5a ronda: -3.1 %; y 6a ronda:
-1.2% 12
Si hay un número par de observaciones,
(n+I)/2 no es un número entero, sino un
número de la forma (entero + 0.5). Entonces
la mediana de la muestra es la media
aritmética de los valores que están en las
posiciones (entero) .y (entero + 1) a partir del
comienzo de la lista.
• Ejercicio-ejemplo 2.9
Determine la mediana de los siguientes índices
de reajuste de alquileres: IPCA, 1.76%; IGP,
1.41%; INPC, 2.64%; e IGP-M, 2.18%.13
• Con la calculadora HP 48G
•Paso 1: digite los valores en una columna de
la matriz;
•Paso 2: en la primera fila de la pantalla
principal aparece [HOME EXAMPLES PRGS];
tedee [VAR] y [C] (Media); aparece el
resultado.
• Con la calculadora Casio CFX-
9850G/995OG
• Paso 1: digite los daros en una de las listas;
• Paso 2: teclee [MENU] para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción RUN y
teclee (EYE];
•Paso 4: oprima, en orden, las tedas [OPTNJ,
[F1] (LIST), [F6] (flecha hacia la derecha) [F4]
(Med) (F6], (flecha a la derecha), [F6] (flecha
hacia la derecha) [F1] (list) [1] (si es la Lista
1) D] (flecha entre paréntesis) y [EXE].
Aparece en la pantalla el valor de la mediana
de la Lista 1: Median (List 1).
• Con la calculadora Texas TI-83
• Paso 1: almacene los valores en la Lista 1;
•Paso 2: teclee [2"d] [STAT] (List) MATH 4:
median;
•Paso 3: teclee [2"d] [11 [L1] [ENTER].
•Con el Excel
• Paso 1: en primer lugar, escoja una celda en
la cual quiera colocar el resultado deseado,
Medida de una muestra
En un listado ordenado creciente o decreciente
con respecto a la magnitud de los valores de una
muestra, es el valor(o la medida aritmética de los
valores) que ocupa(n) la posición central de la
lista
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
316
volviéndola activa;
• Paso 2: haga click dos veces en Colocar
Función y escoja la función MED, apareciendo
una pantalla como la de la Figura 2.6:
•Paso 3: haga click en el cuadro a la derecha,
MED y, en la parte inferior, OK; aparece una
pantalla como la de la Figura 2.7;
•Paso 4: digite, en el rectángulo Num I (que
ahora muestra una señal vertical intermitente),
las celdas inicial y final del conjunto de valores
para los cuales quiere determinar la mediana
de la muestra, separados "por dos puntos" (en
el Ejercicio-ejemplo 2.1; A1:A80); a continua-
ción, seleccione el conjunto de valores
haciendo click en Al y llevando el cursor del
ratón (sin soltar el botón izquierdo) hasta la
celda A80 (no se preocupe por la notación
$A$1: $A$80); en este último caso, observe
que en Num I aparecen las columnas inicial y
final donde fueron digitados los valores y, a la
derecha, parte de un listado de los mismos;
• Paso 5: una vez llenada Num I, oprima en
OK, cierre la pantalla y el resultado aparece en
la celda activada en el Paso 1.
La revista EXAME- Maiores e Melhores de julio
de 1998, mostró la rentabilidad de las 10
mejores empresas en el sector de la
electrónica en función del retorno de la
inversión obtenido en el año, expresado en %
(Tabla 2.4).
fuente revista:EXAME-maiores e melhores,Julio
de 1998
La mediana de las 22 empresas es igual a 6.5,
la media aritmética de los retornos de la
inversión de las empresas que se encuentran
en las posiciones
11 y 12 (y que no están en la tabla). Observar
que todos los retornos tabulados son mayores
que la mediana.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
317
• Ejercicio-ejemplo 2.10
Determinar la median de los valores de la
Tabla 2.1
O NAVEGANDO EN INTERNET
La aparición del lenguaje JAVA como lenguaje
de programación con aplicación en la Web,
independientemente del sistema operacional
utilizado, estimuló el desarrollo de aplicaciones
para las demostraciones interactivas vía
Internet. Diríjase al sitio
http://www.ruf.rice.edu/-lane/stat-
sim/index.htm/ o al http://www.ruf.rice.edul-
lane/stat...sim/descriptive/index.html y mire
una serie de simulaciones, entre las cuales
están Mean and Median, que demuestran las
propiedades básicas de la medida aritmética y
la mediana.
Instrucciones: un botón, Begín, (comenzar)
aparecerá a la izquierda cuando el apples
acaba de ser cargado, lo cual toma
aproximadamente dos minutos, a la velocidad
de 33.4 kBps. Si el botón no aparece,
probablemente su browser no soporta el
lenguaje JAVA. Es posible conectarse a
cualquiera de esas direcciones,
independientemente del browser, pero para
que las demostraciones funcionen, es
necesario que el browser tenga capacidad para
ejecutar los applets.
ENTENDIENDO EL CONCEPTO DE LA MODA
La moda de la muestra es el valor que más
aparece en la muestra. Cuando sólo hay una
moda, la muestra se denomina unimodal; con
dos modas, bimodal; con tres modas, trimodal
y con cuatro o mas modas, se llama polimodal
o multimodal. Si todos los valores se presentan
la misma cantidad de veces, la muestra se
llama amodal. La moda de la muestra siempre
pertenece al conjunto original de valores.
DETERMINACIÓN DE (A MODA DE LA
MUESTRA
• En lenguaje familiar
Para determinar la moda de la muestra, es
suficiente encontrar el valor que más veces
ocurre.
• Ejercicio-ejemplo 2.11
Determine la moda de las primeras marcas
comerciales que se le ocurran:14 OMO, 8%;
Coca-Cola, 5%; Bombril, Natura, Phillips y
Avon, 1%.
• Ejercicio-ejemplo 2.12
Determine la moda de las marcas de tenis mis
recordadas por usted, exceptuando a
Olympicus, 15%15; Rainha, 14%; Nike, 14%;
Adidas, 7% y Reebok, 4%.
• Con las formulas
No hay fórmulas para determinar la moda, si la
variable es discreta. No obstante, para
variables continuas muchos textos presentan
formulaciones para su cálculo aproximado.
•Con la calculadora
Generalmente, no se encuentra la moda con la
calculadora.
•Con el Excel
El Excel no calcula correctamente la moda de
una muestra, excepto si ésta es unimodal; en
caso de que haya más de una moda en la
muestra, el Excel solamente reconoce el valor
más frecuente que aparece de primero en la
lista ignorando cualquier otra moda existente.
Dicho ésto, en Colocar Función se tradujo
erradamente la palabra inglesa mode por modo
cuando la más correcta y más usada
Moda
Valor que con mayor frecuencia se presenta en la
muestra
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
318
extensivamente es moda.
Aunque no se recomienda calcular una moda
en el Excel los pasos son semejantes a los del
cálculo de la media aritmética de la muestra y
de la median de la muestra, pero empleando
ahora la función MODO, tal como aparece en la
Figura 2.8
∎ Ejercicio-ejemplo 2.13
Determinar la moda de los valores de la Tabla
2.1
“Perfil. El turista brasileño tiene entre 30y 40
años, una renta promedio de R$ 1800."
escuela secundaria completa. Viaja dos veces
al año en bus. Su objetivo principal es el de
visitar a sus parientes y amigos. La mayoría -
70%- viaja en la estación alta. Los viajes
duran, en promedio, 12 días. Este es el perfil,
trazado por la Fundación Instituto de
Investigaciones Económicas, de la USP, del
turista brasileño en 1998. Los datos figuran en
la publicación Datos Estadísticos de Turismo -
1998.”16
O NAVEGANDO EN INTERNET
Visite la dirección de Embratur- Empresa
Brasileña de Turismo (www.embratur.gov.br) y
actualícese en cuanto a los datos sobre el
turismo en el Brasil.
UN NÚMERO PARE MOSTRAR LA
VARIABILIDAD DE LOS DATOS: LAS
LLAMADAS MEDIDAS DE DISPERSIÓN
Se comprobó, a lo largo de la historia de la
Estadística, que la mejor y más usada medida
de tendencia central es la media aritmética de
la muestra. Sin embargo, la media aritmética
de la muestra, por si sola, no suministra toda
la información necesaria para describir
adecuadamente los valores de las unidades
observadas. Considere, por ejemplo, los
valores, en kilómetros, de las dos muestras A y
B:
• Muestra A: 30 Km, 30 Km, 30 Km.
• Muestra B: 20 km, 30km, 40 km.
Aunque cada muestra tiene la misma media
aritmética, 30 km, se observa que hay mayor
variabilidad en la muestra B que en la muestra
A.
De esa manera, para describir adecuadamente
una muestra es necesaria otra medida que,
además de la información sobre el valor
representativo del conjunto de valores de la
muestra (dado por la medida de tendencia
central), exprese la variabilidad de esos
valores en relación con una determinada refe-
rencia. Cuanto mayor sea esa medida de
variabilidad, mayor es la dispersión del
conjunto de valores de la muestra.
DEDUCCIÓN INTUITIVA DE LAS MEDIDAS
DE VARIABILIDAD EN LENGUAJE
FAMILIAR
La forma más sencilla y natural para medir la
dispersión de una muestra es calcular la
diferencia entre los valores mayor y menor;
esa diferencia se llama la amplitud total o
rango de la muestra.
Continuando con el ejemplo anterior, la
amplitud total para la muestra A es 0 km (30
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
319
km menos 30 km) y para la muestra B, 20 km
(40 km menos 20 km), por lo cual se concluye
que la muestra B tiene mayor variabilidad,
es decir, es mas dispersa que la muestra A.
Entre mayor sea la amplitud total, mayor es la
variabilidad entre los extremos de los valores
ordenados. Esta primera medida de dispersión
sería útil si no tuviese la característica de
considerar únicamente los valores extremos,
ignorando los demás valores, lo que pudiera
conducir a una conclusión errada con respecto
al conjunto. Por esta razón, la conclusión
racional inmediata fue la de tratar de encontrar
otra medida que tuviese en cuenta todos los
valores y no sólo los extremos. Estudios
sistemáticos a lo largo del tiempo demostraron
la necesidad de tener un valor de referencia, y
la media aritmética de la muestra se revelo
como el punto de referencia más adecuado. De
esa forma, a partir de la media aritmética de la
muestras se calculan las más usuales medidas
de dispersión. Teniéndose ahora un punto de
referencia, la forma más natural de medir la
dispersión es calcular las diferencias de cada
valor con respecto a ese punto de referencia y
sumarlas para obtener un total general.
Ahora consideremos las muestras A y B: para
la muestra A,
(30 km - 30 km) + (30 km - 30 km) + (30 km
- 30 km) = 0 km+0 km+0 km=0 km
y para la muestra B,
(20 km – 30 km) + (30 km – 30 km) + (40 km
– 30 km)= - 10 km + 0 km +10 km = 0
km.
Aunque sea una medida intuitiva, esa suma de
diferencias será siempre igual a 0, pues el total
de las diferencias negativas es igual al total de
las diferencias positivas. Por esta razón, se
continuó la investigación para encontrar una
medida de dispersión que indicase que la
muestra B es más dispersa que la muestra A.
Observando los sumandos, se comprueba que
el signo que indica la diferencia entre cada
valor y la media aritmética de la muestra hace
que la suma de todos esos elementos sea igual
a cero. Siendo así, la segunda tentativa consis-
tió en ignorar los signos, es decir, tomar el
valor absoluto* y /5/ = 5). Hecho esto, se
obtiene para la muestra A
/30 km - 30 km/ + /30 km - 30 km/ + /30 km
- 30 km/ = /0 km/ + /0 km/ +/0km/= 10km+
0km +0km= 0km
y, para la muestra B,
/20 km - 30 km/ + /30 km -30 km/ + /40 km -
30 km/ = /-10 km/ + /0 km/ + / 10 km/ = 10
km + 0 km + 10 km = 20 km, encontrándose
de nuevo que la muestra B es más dispersa
que la muestra A.
Sucede que, en Matemáticas, efectuar
operaciones con valores absolutos de funciones
es, usualmente, difícil. La solución de eliminar
el signo, tomando el valor absoluto de los
valores y sumar todas esas diferencias, ahora
positivas,
“El valor absoluto o módulo de un número es
independiente del signo; se representa al valor
absoluto de un número y colocándolo entre dos
barras verticales. Por ejemplo, I-51 = 5
aunque indique cuál es la muestra más
dispersa con relación a una referencia, no es
práctica cuando se pasa a una formulación
herejía
En las interpretaciones de los datos,
considerar solamente las medidas de
tenencia central.
Amplitud total o rango de la muestra
Es la diferencia entre los valores mayor y
menor conjunto de números de la muestra
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
320
algebraica, sin valores numéricos. Se encontró
una medida adecuada para la variabilidad, pero
surgió el problema de su desarrollo algebraico.
La idea siguiente consistió en tratar de eliminar
el signo de cada diferencia sin emplear el valor
absoluto; la solución natural es la de elevar al
cuadrado cada una de las diferencias y
sumarlas de manera similar a la ya hecha. En-
tonces, para la muestra A,
(30km -30 km)2 + (30 km-30 km)2 + (30 km-
30 km)2 = (0 km)2 + (0 km)2+ (0 km)2 = 0
km2,
y para la muestra B,
(20 km - 30 km)2 + (30 km - 30 km)2 + (40
km - 30 km)2 = (-10 km)2 + (0 km)2 + (10
km)2= 100 km2 + 0 km2 + 100 km2 = 200 km2
comprobándose una vez más, que la muestra B
es más dispersa que la muestra A.
Como la variabilidad debe ser expresada como
una síntesis, se desea un valor único que
teniendo en cuenta todos los elementos del
listado no altere su característica, que es la
suma de esas diferencias al cuadrado. Tal
como se vio, ese valor único es la media
aritmética, pues la característica que la media
aritmética no altera es la suma. Además,
obsérvese que se está calculando el cuadrado
de la diferencia entre cada valor y la media
aritmética de esos mismos valores,
presentándose una redundancia; para
compensar esa situación, se divide la suma
final por (n - 1) en vez de n.
Este valor, resultante de la división por (n-1)
de la suma de las diferencias al cuadrado entre
cada valor de la muestra y la media de la
muestra, se llama varianza maestral.
Para la muestra A,
Varianza muestral
Medida de variabilidad resultante de la división (n-1)
de la suma de las diferencias al cuadrado entre cada
valor de la muestra y la medida de la muestra.
Vimos en el Capítulo 1 que, usualmente, se
desea estudiar cierta característica numérica
de un conjunto de elementos de una población.
Por ejemplo, en una población de carros (en la
cual cada carro es un elemento de la
población), puede desearse conocer el
kilometraje promedio por cada litro de
combustible. Esta medida característica de la
población es llamada un parámetro. Al tomarse
una muestra de la población, de los elementos
de está se obtiene una medida de la
característica que está siendo observada con el
fin de sacar una inferencia con respecto a la
población.
Cualquier operación matemática realizada con
esas medidas de la muestra, es llamada
estadística y el valor obtenido para esa
estadística se llama un estimativo del
parámetro de la población.
Se justifica la división por (n-1) porque, si hay
pocos valores disponibles, el estimativo de la
varianza de la población, así como la media, es
de poca precisión. Para la media de la muestra,
la precisión depende de la cantidad de
resultados utilizados en su cálculo, pero para la
varianza muestral, la precisión esta
subordinada a la cantidad de diferencias
independientes entre los valores a partir de los
cuales la varianza de la muestra es calculada.
Generalmente, las medidas se toman en una
muestra tomada de una población de la cual se
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
321
desconocen la media y la varianza. Si se hace
una medición y se encuentra que ´X = 193, se
tiene un estimativo de la media verdadera `X
= 193, igual a su propio valor X, pero no se
tiene una idea de la precisión de esa medida.
Si el cálculo de la varianza se hiciese
dividiendo por n igual a 1, la varianza sería
lo cual no es cierto, porque esta es
indeterminada, ya que no existen valores
suficientes para su cálculo. Siendo esto así, la
varianza muestral debe ser calculada con la
expresión
lo cual es una indeterminación, tal como debe
ser.
Si se hace una segunda medida, por ejemplo
183, se tiene un mejor estimativo de la media,
y también una comparación o diferencia sobre
la cual basarse para un estimativo de la
varianza de la muestra.
Nótese que las diferencias de cada una de las
observaciones a partir de la media no son
independientes, pues la media fue calculada a
partir de esos mismos valores; Como ´X = 188
y x1 = 193, entonces x2 es necesariamente
igual a 183; se dice, entonces, que el
estimativo tiene 1 grado de liberal. El divisor (n
- 1) representa lo que se llama grados de
libertad, es decir, la cantidad de
comparaciones independientes que pueden
hacerse entre las n unidades de la muestra. Si
hay n unidades de observación, hay n valores
(valor 1, valor 2,……, valor n) representados
por x1,………., xn y pueden hacerse (n - I)
comparaciones independientes de la clase de
un valor menos el otro, (xi - xi ) porque la
media aritmética de la muestra, ´X, es
calculada a partir de las n observaciones; silos
valores ´X y (n - 1) son dados, el último queda
determinado. Por ejemplo, si la media muestral
de 4 números es 9 y son conocidos los valores
6, 8 y 12, el último valor debe ser
necesariamente 10.
Otro ejemplo: si tres observaciones tienen
solamente dos comparaciones independientes,
y si se hacen dos comparaciones, por ejemplo,
el valor I menos el valor 2, (x1 – x2) y el valor
1 menos el valor 3, (x1 – x2), la tercera
comparación será conocida, porque el valor 2
menos el valor 3 = (valor 1 menos valor 3)
menos (valor I menos valor 2), es decir, (x2 -
x3) _ (x1 – x3) -( x1 - x2).
Sucede que, en el cálculo de la varianza
muestral, al elevarse al cuadrado la diferencia
entre cada valor y la media aritmética de la
muestra, la unidad de medida de los valores
originales también se eleva al cuadrado. Es
decir, se resuelve un problema de desarrollo
algebraico sin usar el valor absoluto de los
valores, pero se creó un problema con las
unidades de medida, existiendo una para la
medida de tendencia central y otra para la
dispersión, pero esta aparece ahora elevada al
cuadrado. Para que las unidades vuelvan a sus
dimensiones originales, es necesario extraer la
raíz cuadrada de la varianza de la muestra.
Cuando esto se hace, se define la medida de
dispersión más importante para una muestra:
la llamada desviación típica muestral que es la
raíz cuadrada positiva de la varianza de la
muestra. Para la muestra A, se tiene que la
desviación típica muestral es igual a
MITO
La desviación típica es una medida que sirve
únicamente para resolver problemas en las
cuáles ellas es conocida.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
322
y, para la muestra B, la desviación típica
muestral es =
Desviación típica muestral
La desviación típica muestral de n valores esta
simbolizada por s y se calcula con la fórmula
Determinación de las medidas de
variabilidad con las calculadoras
• Con la calculadora HP 48G
Amplitud total de la muestra
• Paso 1: determine el máximo y el mínimo de
los datos en SINGLEVARIABLE STATISTICS;
• Paso 2: calcule la amplitud total, restando el
mínimo del máximo.
Varianza de la muestra
• Pasos 1, 2, 3, y 4: iguales al cálculo de la
media aritmética;
• Pasos 5: escoja Sample en TYPE;;
• Paso 6: en SINGLE-VARIABLE STATISTICS,
escoja VARIANCE (varianza), en la, primera fila
debajo de TYPE:, oprima la tercera tecla
blanca, [C] (equivalente a √ CHK, check, que
significa verificar). El nombre VARIANCE
aparecerá con el símbolo √ a su lado.
• Paso 7: oprima la última tecla blanca, [F];
aparecerá en la pila el resultado de la varianza
muestral, Variante___.
Desviación típica de la muestra
• Pasos 1,2, 3 y 4: iguales al cálculo de la
media aritmética;
• Paso 5: escoja Sample en TYPE:;
• Paso 6: en SINGLE-VARIABLE STATISTICS,
escoja STD DEV (Standard deviation,
desviación típica), en la primera fila debajo de
TYPE:, oprima la tercera tecla blanca, [C]
(equivalente a -1 CHK, check, que significa
verificar). El nombre STD DEV aparecerá con el
símbolo √ a su lado;
•Paso 7 oprima la última tecla blanca, [F];
aparecerá en la pila el resultado de la
desviación típica, Std Dev:___.
•Con la calculadora Casio CFX-
9850GI995OG
Amplitud total de la muestra
• Paso 1: escriba los datos en una de las listas;
•Paso 2: teclee [MENU] para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción SEAT y
teclee [ EXE] [F2] y [F 1];
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
323
• Paso 4: en I-VAR, teclee en la flecha dirigida
hacia abajo y anote MinX y MaxX.
•Paso 5: calcule la amplitud tomando la
diferencia entre MinX y MaxX.
Varianza de La muestra
• Paso 1: escriba los datos en una de las listas;
• Paso 2: teclee [MENU] para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción STAT y
tedee [EXE];
• Paso 4: teclee [F6] y [F2] (CALC- para
cálculos estadísticos);
• Paso 5: teclee [F1] (1 - VAR) y la desviación
típica x" aparecerá;
• Paso 6: eleve al cuadrado la desviación típica
para obtener la varianza muestral.
Desviación típica
• Paso 1: escriba los datos en una de las listas;
•Paso 2: teclee [MENU] para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción STAT y
teclee [EYE], [F6] y
[F2]: CALC para cálculos estadisticos;
• Paso 4: teclee [F6] y [F2] (CALC para
cálculos estadísticos);
•Paso 5: teclee [F 1] (1 - VAR) y la desviación
típica xn-1aparecera.
•Con la calculadora Texas TI-83
Amplitud total de la muestra
• Paso 1: coloque los valores en una lista, por
ejemplo, en la Lista 1;
• Paso 2: determine el máximo: [2nd] [STAT]
MATH 2: max [2nd] [1] (si los datos están en la
Lista 1);
• Paso 3: determine el mínimo: [2nd] [STAT]
MATH 1: min [2nd] [1];
• Paso 4: reste el mínimo del máximo.
Varianza de la muestra
• Paso 1: coloque los valores en una lista, por
ejemplo, en la Lista 1;
• Paso 2: teclee [2nd] [STAT] MATH 8: variance
[2nd] [ 1 ] [ENTER] ;
Desviación típica
• Paso 1: coloque los valores en una lista, por
ejemplo, en la Lista 1;
•Paso 2: teclee [2nd] [STAT]MATH 7: stdDev
[2nd] [1] [ENTER].
Determinación de las medidas de
variabilidad con la ayuda del Excel
Amplitud total de la muestra
No es posible, con la función Colocar Función,
calcular directamente la amplitud de toda la
muestra.
Varianza de la muestra
Los dos primeros pasos son semejantes al
cálculo de la media aritmética de la muestra y
de la mediana de la misma, escogiéndose
ahora la función VAR en el Paso 3 (Figura 2.9).
∎ Ejercicio-ejemplo 2.14
Determine con el Excel la varianza muestral de
la Tabla 2.1.
Desviación típica muestral
Los pasos son semejantes a los del cálculo de
la media aritmética de la muestra y de la
mediana de la misma, escogiéndose ahora a la
función DESVPAD, en el Paso 3 (Figura 2.10).
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
324
∎ Ejercicio-ejemplo 2.15
Determine, con el Excel, la desviación típica de
la Tabla 2.1.
HABLANDO DE NUEVO SORE LA POBLACIÓN
Conceptos semejantes
Hasta este momento hemos hecho énfasis en
el estudio de las muestras y el desarrollo de las
medidas que las caracterizan. Entre tanto,
puede haber situaciones, aunque de rara
ocurrencia, en las cuales se estudian
poblaciones finitas de tamaño N; en esos casos
se emplean los siguientes conceptos:
Datos brutos listas
• Los datos brutos de la población: son
semejantes a los datos brutos de la muestra;
• Lista de la población: semejante a la lista de
la muestra.
Tanto un concepto como el otro son conocidos,
sencillamente, como los datos brutos y la lista.
Medidas de tendencia central
a. Media aritmética de una población finita de
tamaño N: se encuentra la media aritmética
sumando todos los valores de la población y
dividiéndola por el tamaño N de la misma; se
representa la media aritmética de la población
por la letra griega µ (se pronuncia mǐ) y, de
este modo,
b. La media aritmética ponderada de una
población finita de tamaño N: se determina la
media aritmética ponderada sumando todos los
grupos definidos al efectuar el producto de
cada valor por su peso y dividiendo el total por
la suma de los pesos; se representa la media
aritmética ponderada también por la letra µ y,
así,
El proceso de cálculo de la media aritmética es
el mismo tanto para una muestra como para
una población finita, y ambas son llamadas,
sencillamente, media aritmética.
c. Media geométrica de una población finita de
tamaño N se encuentra la media geométrica
multiplicando todos los valores de la población
de tamaño N y extrayendo la raíz N-ésima y
así, la media geométrica estará dada por
d Mediana de una población finita de tamaño N
la determinación de la mediana es la misma
canto para una muestra como para una
población finita, y ambas se llaman,
sencillamente, la median.
e. Moda de una población finita de tamaño N la
determinación de la moda es la misma Canto
para una muestra como para una población
finita y ambas se llaman, sencillamente, la
moda.
MEDIDAS DE VARIABILIDAD
a. Amplitud total de una población finita de
tamaño N: la determinación de la amplitud
total es la misma tanto para una muestra como
para una población finita, y ambas se
denominan, sencillamente, la amplitud total.
b. Varianza de una población finita de tamaño
N: como ahora puede calcularse la media
aritmética exacta de la población, la situación
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
325
es diferente de aquella en la cual se estudiaba
una muestra. Por este motivo para la varianza
de la población se divide por N la suma de los
cuadrados de las diferencias entre cada valor
de la población y la media aritmética de la
misma. La expresión para la varianza de la
población simbolizada por o2 (se lee sigma al
cuadrado) y 02 es
Las comparaciones hechas entre los valores,
así como la diferencia de cada valor de la
población y la media aritmética de la población,
son tales que la cantidad de grados de libertad
es igual al total de los valores. La varianza de
una población finita de tamaño N es conocida
como la varianza poblacional.
c. Desviación típica de una población finita de
tamaño N la expresión de la desviación típica
de la población finita, simbolizada por 0 (se lee
sigma), es
La desviación típica de una población finita de
tamaño N es conocida como la desviación típica
de la población.
Obsérvese la notación estadística: los
parámetros de la población son, generalmente,
representados por letras del alfabeto griego y
las estadísticas muestrales, calculadas a partir
de la muestra, con caracteres latinos (en
mayúsculas).
CÁLCULOS SEMEJANTES
CON LA CALCULADORA CIENTÍFICA
• Con la calculadora HP 48G
Los pasos son semejantes a los cálculos para
las muestras, exceptuando el cálculo de la
varianza y la desviación típica poblacionales:
seleccione, con la tecla [↓] del conjunto de
teclas con las cuatro flechas, [→][←][↑] y [↓],
Populación en pues se desean los parámetros
de la población (Population).
• Con la calculadora Casio CFX-
9850G/995OG
Los cálculos son semejantes a los de las
muestras, exceptuando el cálculo de la
varianza y la desviación típica poblacionales.
La desviación típica poblacional esta dada
directamente por x 0 n. Para la varianza
poblacional, se eleva al cuadrado el valor de x
0 n.
•Con la calculadora Texas TI-83
Los pasos son semejantes a los cálculos para
las muestras, exceptuando el cálculo para la
varianza y la desviación típica poblacionales.
La desviación típica poblacional se calcula
extrayendo la raíz cuadrada positiva de la
varianza, tecleando (2nd) (x2) se obtiene la
varianza de la población.
• Con el Excel
Los pasos son semejantes al cálculo con las
muestras de la función Colocar Función, con
dos excepciones:
- Para la varianza de la población, la función es
VARP;
- Para la desviación típica, la función es
DESVPADP
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
326
CALCULANDO, DE UNA VEZ, LAS MEDIDAS
MÁS IMPORTANTES
• Con la calculadora cientifica HP 48G
Además de que el programa SINGLE-VARIABLE
STATISTICS permite encontrar la suma total
(TOT) del máximo (MAXIMUM) y del mínimo
(MINIMUM) de los valores, se pueden calcular
de una vez todas las variables de los datos
actuales. Los pasos son los siguientes, después
de escribir los datos en ∑DAT:
• Paso 1: oprima la tecla roja, [5] (STAT) y la
tercera blanca, [C], equivalente a 1 VAR en la
etiqueta del menú;
• Paso 2: optima las siguientes teclas blancas:
- la primera, TOT, para obtener la suma total
- la segunda, MEAN, para la media aritmética
- la tercera, SDEV, para la desviación típica de
la muestra
- la cuarta, MAX∑, para el máximo de los
valores
- la quinta, MIN∑, para el mínimo de los
valores
Los resultados aparecerán en la pila
correspondiente.
• Con la calculadora Casio CF X-9850GI995OG
• Paso 1: inserte los datos en una de las listas;
• Paso 2: teclee (MENU) para ir a la pantalla
principal;
• Paso 3: coloque el cursor en la opción STAT y
teclee (EYE);
• Paso 4: teclee [F2) (CALC), y aparece la
pantalla con la lista de datos;
• Paso 5: teclee [F1) (1 VAR) y aparecerán los
siguientes resultados:
- x (barra): media aritmética
- ∑X: suma de los valores de la lista
-∑X2: suma de los cuadrados de los valores de
la lista
- xσ n: desviación típica de la población
- xσ n-I: desviación típica de la muestra
- n: total del primero de valores en la lista
• Paso 6 oprima la tecla [↓] seis veces, en el
conjunto con las flechas, apareciendo los
resultados:
- minX: mínimo de los valores del listado;
- Q1: valor del primer cuartil;
- Med: valor de la mediana;
- Q3: valor del tercer cuartil;
- X-X σ n: la media menos la desviación típica
poblacional;
- X+ X σ n: la media más la desviación típica
poblacional;
• Paso 7: oprima la teda [↓] dos veces, en el
conjunto con las flechas, apareciendo los
resultados:
- maxX: máximo de los valores del listado;
-Mod: la moda (cuyo resultado debe ser
examinado con cuidado, porque la calculadora
presenta, en un listado amodal, al mayor valor
como si fuera la moda).
• Con la calculadora Texas TI-83
• Paso 1: coloque los datos en la Lista L;
• Paso 2: teclee [STAT], escoja CALC, teclee
[1] y aparecerá I-Var Stats....
La pantalla debe mostrar I-Var Stan y el cursor
titilando a su lado;
• Paso 3: introduzca la lista deseada apretando
[2nd] y 1 para L1 y 2 para L2, etc.;
• Paso 4: teclee [ENTER].Aparecen los
siguientes resultados:
- x, la media aritmética de los valores;
- ∑X, suma de los valores;
- ∑X2, suma de los cuadrados de los valores;
- Sx, desviación típica de la muestra;
- -x, desviación típica de la población;
- σ x, cantidad de datos.
La primera pantalla tiene una flecha a la
izquierda del último resultado, indicando que la
pantalla continúa. Para ver los demás
resultados, reclee la flecha azul cinco veces
hasta que todos los datos sean presentados.
- MinX, mínimo de los valores X:
- QI, Valor del primer cuartil:
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
327
- Med, mediana;
- Q3, valor del tercer cuartil;
- MaxX, máximo de los valores x.
Con el Excel
Las medidas de tendencia central y de
dispersión calculadas una a una con el Excel
pueden también ser obtenidas de una sola vez,
por medio de la herramienta Estadística
descriptiva:
• Paso 1: después de digitados los valores en
la pantalla, ir a la Barra de Menús y
seleccionar Herramientas (Figura 2.11)
• Paso 2: escoja, en la última fila de
Herramientas, Análisis de datos....; si en la
última línea aparece escrito Actualizar vínculos
de suplementos..., haga click en el mismo
menú, Suplementos ...; se abre otra pantalla,
en la cual se debe hacer click sobre los
cuadrados referentes a Herramientas de
Análisis y a Herramientas de Análisis-VBA, y
después en el botón OK; vuelva a
Herramientas y pulse en Análisis de Datos ...,
ahora en la última línea (Figuras 2.12 y 2.13);
• Paso 3: después de que aparezca el cuadro
de Análisis de Datos (con el subtítulo
Herramientas de Análisis), haga click en
Estadística descriptiva, que fijara a las
seleccionadas con color diferente al de las
demás opciones (Figura 2.14);
• Paso 4: haga click en el botón [OK] y retírelo
cuando aparezca el cuadro Estadística
descriptiva (Fig. 2.15);
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
328
La herramienta Estadística descriptiva crea una
relación con los valores colocados en la
plantilla, dando informaciones sobre la
tendencia central y la variabilidad de los
valores seleccionados, generando dos
columnas de información: a la izquierda con los
nombres de las estadísticas y a la derecha con
los resultados. Para los conceptos estudiados
hasta ahora, el uso de esa herramienta es el
siguiente:
1) En el bloque Entrada"
a. Intervalo de entrada. Digite las celdas donde
se encuentran los valores que se quieren
analizar. En el caso del Ejercicio-ejemplo 2.1,
A1:A80.
b. Agrupado por. Seleccione (haciendo click en
el respectivo cuadrado, cuando aparezca una
"x") el botón de opción "Líneas" o "Columnas"
para indicar si los valores del intervalo de
entrada fueron digitados por filas o por
columnas; en el caso del Ejercicio-ejemplo 2.1,
corno los valores están en la primera columna,
se selecciona "Columnas".
2) En el bloque de "Opciones de salida".
Escoger Nueva plantilla para que los resultados
aparezcan en una nueva plantilla con el mismo
formato de la plantilla actual; digite "Ejemplo I
" en la caja del texto para darle un nombre a la
nueva plantilla.
3) Haga click en la opción Resumen estadístico,
para que el Excel presente, en la plantilla de
resultados, las siguientes estadísticas:
- media: media aritmética;
- error típico (de la media);
- mediana;
- modo (es la moda);
- desviación típica: desviación típica muestral;
- varianza de la muestra;
- curtosis;
- asimetría;
- intervalo: amplitud total;
- mínimo: valor mínimo del conjunto de
números;
- máximo: valor máximo del conjunto de
números;
- suma: suma de todos los valores;
- conteo: cantidad de valores ingresados
- mayor (#)
- menor (#)
- nivel de confianza: concepto que se verá en
el Capítulo 4.
Los resultados de todas las estadísticas
relativas al Ejercicio-ejemplo 2.1 aparecen en
la Figura 2.16.
COMPARACION DE MEDIAS Y
DESVIACIONES TÍPICAS: EL COEFICIENTE
DE VARIACIÓN
No se debe comparar directamente dos o más
medidas de dispersión. ¿Cómo se puede
afirmar que una variabilidad, medida por la
desviación típica de 3"C para una temperatura,
es mayor que una variabilidad, también
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
329
medida por una desviación típica, de 6.5 m.
para una determinada longitud? Es evidente
que no se puede comparar la temperatura con
la medida y, para volver comprensible una
comparación entre estas magnitudes con
relación a la variabilidad, es necesario
convertirlas para tener un valor relativo. Karl
Pearson, matemático inglés (1857-1936),
quien contribuyó significativamente en la
ciencia estadística, desarrollo una medida
relativa, llamada coeficiente de variación (CV),
calculado por la expresión
• Ejercicio-ejemplo 2.16
Determine el coeficiente de variación de los
datos de la tabla 2.1
Para su uso en la Inferencia Estadística, el
material hasta aquí presentado es suficiente,
porque los conceptos más importantes son la
media aritmética y la desviación típica
muestrales.
Sin embargo, muchas veces es necesario
mostrar, de manera rápida, especialmente
para una gran cantidad de personas, el
comportamiento de las unidades de
observación de la muestra, así como, de
manera sencilla, extraer una inferencia sobre
la población. Esto se consigue por medio de las
tablas y los gráficos.
RESUMEN TABULAR DEL CONJUNTO DE
VALORES
Las Tablas resumen informaciones de las
muestras o de la población y son presentadas
en un formato que permite sacar conclusiones
más fácilmente, aunque de manera limitada,
con respecto al conjunto total de categorías o
valores. Las tablas pueden formarse sin
perdida o con perdida de la información.
TABLA DE FRECUENCIAS SIN PÉRDIDA DE
LA INFORMACIÓN
Para que no se pierda la información, se hace
un listado de todos los valores o categorías de
la muestra o de la población, una en cada
línea, enumerándose las veces que aparecen,
incluyendo las repeticiones, y se cuenta la can-
tidad de veces que aparece cada valor;
“Para algunos autores de lengua inglesa, también
conocido como RSD (relativa standard deviation),
desviación típica relativa.
"El CV es razonable cuando la desviación típica es
estrictamente proporcional a la medida aritmética. Si
la desviación típica es constante en un intervalo
grande de los niveles de la propiedad que está
siendo investigado, el CV es, en ese caso, ilusorio.
Otra desventaja es la que su valor no es muy útil
cuando la medida no es aproximadamente cero
Coeficiente de variación
magnitud relativa de la desviación típica cuando
ésta es comparada con la media aritmética.
Herejía
Presentar los resultados del coeficiente de
variación sin decir si el número ésta expresando
en porcentaje
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
330
esta entidad recibe el nombre de frecuencia
absoluta. Por esta razón, las tablas presentan
valores o categorías y sus frecuencias y se
llaman tablas de frecuencias.
Para construir manualmente o en el
computador una tabla de frecuencias sin
pérdida de información, se dan los siguientes
pasos:
• Paso 1: escriba, en la parte superior de la
tabla, el título del fenómeno observado;
• Paso 2: trace una línea horizontal de doble
espesor;
• Paso 3: escriba en el renglón siguiente y, a la
izquierda, valores (o categorías);
• Paso 4: trace una línea divisoria sencilla;
• Paso 5: escriba cada valor o categoría en los
renglones siguientes;
• Paso 6: trace una línea vertical, a partir del
nombre valor o categoría, para crear una
segunda columna;
• Paso 7: escriba, en la primera línea de esa
columna, la palabra conteo;
• Paso 8: identifique con algún símbolo, en esa
segunda columna, cada vez que el valor o la
categoría escrito(a) en esa línea aparece;
• Paso 9: trace otra línea vertical, al lado de
conteo, para formar otra columna;
• Paso 10: escriba, en el primer renglón de
esta tercera columna, frecuencia absoluta;
• Paso 11: cuente, en cada renglón, la cantidad
de marcaciones registradas en el paso 8 y
escriba su total en la tercera columna;
• Paso 12: después del último valor o
categoría, trace otro renglón;
• Paso 13: después del último renglón, escriba,
en la primera columna,
Total, resaltado, así como en la tercera
columna, el total de las frecuencias absolutas,
también en forma resaltada;
•Paso 14. Termine la tabla, trazando una línea
horizontal gruesa y completando las líneas
verticales; ahora cierre las partes laterales de
la tabla;
•Paso 15: coloque bajo el último renglón la
palabra Fuente, seguida de dos puntos y
escriba la referencia de donde fueron tomados
los datos.
El aspecto inicial de una tabla de frecuencias
sin pérdida de información es el de la Tabla
2.5. La columna de conteo se usa, en general,
al comienzo del proceso de construcción de la
tabla; el resultado final es el que se ve en la
Tabla 2.6.
Tabla de frecuencia
Reorganización de los valores en orden
creciente o decreciente de magnitud, en tal
forma que una característica de la
población es subdividida en clases o
categorías indicándose la cantidad e veces
en las que se presentan cada clase y
relación el valor (o clase de valores )con la
frecuencia de su aparición.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
331
Ejercicio ejemplo 2.17
Basándose en los datos de la tabla 2.7,
construya una tabla de frecuencia sin pérdida
de información.
TABLA DE FRECUENCIAS CON PÉRDIDA DE
INFORMACIÓN
Cuando hay una gran cantidad de categorías o
valores individuales con gran amplitud total, la
tabla sin perdida de información puede ser
Frecuencia absoluta de una categoría o de
un valor.
número de veces que una categoría o valor
aparece en un conjunto de datos: también
llamada frecuencia.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
332
muy grande, siendo entonces necesario un
resumen de los datos, para los cuales el inter-
valo de los posibles valores está dividido en
subintervalos, conocidos como clases, con un
límite inferior y uno superior (llamados límite
inferior de clase y limite superior de clase), lo
que dará como resultado una pérdida de
información, pues los valores originales ya no
aparecen individualmente. Para cada clase, la
cantidad de datos en esta es anotada; esta es
la llamada frecuencia absoluta de la clase.
Un requisito esencial para una tabla de
frecuencias es que las clases sean mutuamente
excluyentes y exhaustivas. Es decir, cada valor
en el conjunto de datos debe pertenecer a una
y solamente a una de las clases. Una
característica deseable, pero no esencial, es
que las clases tengan la misma amplitud de
clase, es decir, que todos los intervalos de
clase tengan igual amplitud o extensión.
En una tabla con k clases, la frecuencia de la i-
ésima clase está denotada por ƒi para i = 1, 2,
3,….., k. Si las clases son mutuamente
excluyentes y exhaustivas, ƒ1 + ƒ2 + + ƒn =
n.
La construcción de una tabla de frecuencias
con pérdida de información necesita de las
siguientes etapas:
• Paso 1: determinar la amplitud total de los
valores;
• Paso 2: definir la cantidad de clases,
generalmente entre 5 y 15 (el número exacto
depende de quien-haga la tabla y del problema
en cuestión, de tal manera que los valores no
queden demasiado resumidos o demasiado
dispersos);
•Paso 3: calcular la amplitud de cada clase (es
decir, la amplitud del intervalo de clase),
dividiendo la amplitud total por el numero
escogido de Bases (redondeando generalmente
el resultado para tener un número entero o
múltiplo de 10, para facilitar la interpretación
de los valores);
•Paso 4: establezca los límites de cada clase, a
partir del primer valor (o de un entero
inmediatamente inferior), sumando a cada
límite inferior de clase el valor de la amplitud
de la clase:
- Primera clase: límite inferior de la 1a clase y
límite superior de la 1a clase =límite inferior de
la 1a clase + amplitud del intervalo de clase;
-Segunda clase: límite superior de la 1a clase y
límite superior de la 2a clase = limite superior
de la 1a clase + amplitud del intervalo de
clase, y así sucesivamente;
• Paso 5: escriba, en la parte superior de la
tabla, el título de la situación observada;
•Paso 6: trace una línea gruesa en la parte
superior de la tabla;
• Paso 7: escriba en el primer reglón y a la
izquierda, el título clase:
• Paso 8: trace una línea horizontal sencilla;
• Paso 9: escriba en cada renglón,
sucesivamente, el limite superior, el símbolo I-
es el límite superior de cada clase (para evitar
cualquier duda en cuanto a la posible inclusión
de determinado valor en más de una clase, se
adopta la siguiente notación para los límites
superior e inferior de cada clase: una barra
vertical seguida de una horizontal, queriéndose
decir con esto que esa clase incluyo el valor del
límite inferior pero excluyo el valor del límite
superior);
• Paso 10: trace una línea vertical, a partir del
primer renglón, para formar una segunda
columna;
• Paso 11: escriba en esa segunda columna el
título conteo;
• Paso 12: registre, con algún símbolo, en esa
segunda columna, cada vez que el valor o la
característica de esa línea aparece;
• Paso 13: trace otra vertical, a partir del
primer renglón, para formar una tercera
columna;
• Paso 14: escriba, en el primero renglón de
esta tercera columna, el título frecuencia
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
333
absoluta;
• Paso 15: cuente, en cada renglón, las
marcaciones y anote su total en la tercera
columna;
•Paso 16- después de la última clase, trace
una línea horizontal;
•Paso 17: después de la última clase escriba,
en la primera columna, Total, resaltado, así
como en la tercera columna, el total de las fre-
cuencias absolutas encontradas, también
resaltado;
• Paso 18: termine la tabla, trazando una
horizontal gruesa; no cierre las partes laterales
de la tabla;
•Paso 19: coloque debajo de la ultima línea, la
palabra Fuente, seguida de dos puntos, y
escriba la referencia de donde fueron extraídos
los datos.
• Ejercicio-ejemplo 2.18
Construya una tabla de frecuencias con pérdida
de información para los datos de la Tabla 2.1.
REPASO DE LAS MEDIDAS DE TENDENCIA
CENTRAL Y DE DISPERSIÓN
Todas las tablas de frecuencias, al resumir los
valores de las observaciones originales,
siempre pierden precisión en la información.
Por ejemplo, si hay 30 valores entre 100,
inclusive, y 3600, exclusive, no se sabe si
todos esos valores son iguales a 100, si hay 20
valores iguales a 200, 5 valores iguales a
1.000 y 10 valores iguales 3.000 o
cualesquiera otra distribución de valores que
resumidos , generasen lamisca frecuencia
absoluta para esa clase.
Por este motivo, para el cálculo de las medidas
de tendencia central, se deben usar siempre
los valores originales, cálculo éste que se
facilita mucho en nuestros días por el uso de
las calculadoras y los computadores. Entre
tanto, los libros de Estadística nos presentan
formas diferentes para el cálculo de la media
aritmética (método largo y método resumido),
de la mediana (por medio del empleo de la
proporcionalidad de los valores) y de la moda
(métodos de King y Czuber). De todos modos,
¿para qué emplear los métodos aproximados si
los cálculos pueden hacerse con los valores
originales? Esos métodos aproximados se
justificaban cuando no existían ni las
calculadoras ni los computadores, siendo, en
aquel entonces, una necesidad práctica, per-
diéndose en precisión lo que se ganaba en
tiempo y en el evitar los errores aritméticos al
tratar con gran cantidad de valores.
Los macacos de muestran hechos básicos con
respecto a la humanidad.17
Comience con una jaula que contenga cinco
macacos. En la jaula, cuelgue un banano de
una cuerda y ponga una escalera bajo el
banano. Al poco tiempo, un macaco irá hasta
la escalera y comenzará a subir para agarrar el
banana. En el momento en que va a tocar la
escalera, moje a todos lo macacos con agua
helada. Después de un rato, otro macaco
intentará de nuevo, con el mismo resultado:
todos los macacos mojados con agua helada.
Quité la ducha de agua helada.
Si, más tarde, un macaco trata de subir por la
escalera, los demás macacos tratarán de
impedírselo aún si no se les moja. Ahora, retire
un macaco de la jaula y cámbielo por otro
macaco; este ve el banano y trata de subir por
la escalera. Para su sorpresa, todos los
macacos lo atacan; después de una nueva
MITO
Si método aparentemente extraños aún existen
los libros de estadísticas, debe de haber alguna
razón histórica para esto, la tradición debe de
continuarse, ya que esta resume la experiencia
acumulada a través de los siglos.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
334
tentativa y otro ataque, el aprende que, si
intenta subir por la escalera, será atacado. A
continuación, saque uno de los macacos
iniciales y ponga uno nuevo, el cual tratara de
subir por la escalera y también será atacado;
dos de los cuatro macacos que lo atacaron no
tienen la mínima idea de por qué a ellos no se
les permitió subir por la escalera, o por que
están participando en la agresión al nuevo
integrante del grupo. Después de cambiar al
cuarto y al quinto de los macacos originales,
todos los macacos que han sido mojados con
agua helada serán sustituidos. A pesar de esto,
ningún macaco se aproxima de nuevo a la
escalera. ¿Por qué no? Porque las cosas,
siempre han sido así por acá. Moraleja de la
historia: La tradición no justifica,
necesariamente, el modo de proceder actual
De todos modos, puede haber situaciones en
las que no se tiene acceso a los valores
originales y ni siquiera a las tablas de
frecuencia. Si esto es así, la determinación de
las medidas de tendencia central (y
subsecuentemente, de las medidas de
dispersión) puede hacerse de la siguiente
forma en las tablas de frecuencia con perdida
de información:
Media aritmética. Considere el punto media de
cada clase (semisuma del límite inferior y el
superior) como si fuera el representante de la
clase; para cada una de las clases, multiplique
el punto medio por la frecuencia de la clase;
sume esos productos y divida por el total de
los valores. Los pasos son los siguientes:
• Paso 1: determine el punto medio de cada
clase, dividiendo por 2 la suma de los límites
inferior y superior;
• Paso 2: multiplique cada uno de los puntos
medios de cada clase por la frecuencia
absoluta de la clase respectiva;
• Paso 3: sume todos esos productos;
• Paso 4: divida el total obtenido en el Paso 3
por el total de los valores.
•Ejercicio-ejemplo 2.19
Determine la media aritmética de los valores
de la tabla final del Ejercicio ejemplo 2.17,
obtenida a partir de la Tabla 2.1.
Mediana. Los pasos para el cálculo de la
mediana de los valores de una tabla con
perdida de información, son los siguientes:
• Paso 1: encuentre la posición central,
dividiendo el total de los valores (o total de los
valores más 1) por 2;
•Paso 2: sume la frecuencia absoluta de la
primera clase con la de la segunda clase y así,
sucesivamente; cuando esta suma acumulada
supera al número o números de las posiciones
centrales, deténgase.
La median del conjunto de valores es el punto
medio, de esa primera clase cuya suma
acumulada es inmediatamente superior a la
mitad del total de los valores.
• Ejercicio-ejemplo 2.20
Determine la mediana para los valores de la
tabla final del Ejercicio-ejemplo 2.17, obtenida
de la Tabla 2.1.
En este punto surge el concepto de frecuencia
acumulada de clase. Al sumar a cada
frecuencia de clase el total de los elementos de
todas las clases anteriores, se esta
encontrando la frecuencia acumulada de esa
clase, también conocida como frecuencia
acumulada por debajo de.
Moda. es el punto medio de la clase que tiene
mayor frecuencia.
•Ejercicio-ejemplo 2.21
Encuentre la moda para los valores de la tabla
final del Ejercicio-ejemplo 2.17, obtenida de la
Tabla 2.1.
Amplitud total es la diferencia entre el límite
superior de la última clase menos el límite
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
335
inferior de la primera clase.
• Ejercicio-ejemplo 2.22
Determine la amplitud total para los valores de
la tabla final del Ejercicio-ejemplo 2.17,
obtenida de la Tabla 2.1
Varianza. En el cálculo de la varianza, cada
valor es sustituido por el punto medio de la
clase 1, XMt es la diferencia en relación con la
media, elevada al cuadrado y multiplicada por
la frecuencia de la clase i, f1 para cada una de
las k clases. Las formulas son:
y para la varianza de la población
• Ejercicio-ejemplo 2.23
Determine la varianza para los valores de la
tabla, al final del Ejercicio-ejemplo 2.17,
obtenida de la Tabla 2.1.
HACIENDO UN POCO DE JUSTICIA EN
LAS COMPARACIONES Y LAS
CLASIFICACIONES
La mayoría de los estudios suministra valores
numéricos que no tienen un significado único y
tienen pocas medidas absolutas, si es que
tienen alguna. Sin embargo, la media
aritmética se convirtió en un clásico punto de
referencia, y las diferencias entre los valores
son presentadas con base en las unidades de
una escala que parte de la media aritmética.
De todos modos, se presentan situaciones que
tienen diferentes medias aritméticas y
desviaciones típicas, siendo esencial tener una
forma de convertir los valores brutos,
provenientes de varias poblaciones y medidos
en diferentes escalas, para obtener alguna
escala común, generalizada. El Ejercicio-
ejemplo 2.24 ilustra la necesidad de tener una
escala única para comparar los resultados.
• Ejercicio-ejemplo 2.24
Con base en los resultados de cuarto
evaluaciones, clasifique a las personas A y B de
acuerdo con la Tabla 2.8.
Tabla 2.8 resultado de cuatro
evaluaciones
Analizando los datos brutos, tanto A como B
tienen un total de puntos igual a 200,
existiendo, entonces, un empate. Pero, las
escalas brutas son arbitrarias y absolutas y no
consideran la posición relativa de cada valor en
relación al conjunto al cual pertenece.
Desgraciadamente, no hay escalas comunes
ideales para codas las situaciones con medidas
que informen sobre los parámetros de la
población, la cual puede tener una media alta y
una poca dispersión, o una media baja y una
alta dispersión. A pesar de estas dificultades,
las escalas tipificadas suministran mejores
resultados que los obtenidos a partir de
comparaciones hechas con base solamente en
Frecuencia acumulada por debajo de…
Frecuencia cumulada por debajo de una
clase es le número de los elementos que
tiene un valor menor que límite superior de
esa clase
Para la varianza de la muestra
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
336
los datos brutos. Una de esas escalas se
fundamenta en la desviación de cada uno de
los valores con respecto a la media aritmética,
expresándose esta desviación en unidades de
desviación típica. Esta es la escala tipificada,
denotada por z, llamada variable reducida, que
es una cantidad abstracta (es decir,
independiente de las unidades de medida
originales de los valores). Para el cálculo de la
variable reducida z, correspondiente a un
valor, se resta de este valor la media
aritmética del conjunto y se divide por la
desviación típica del conjunto, es decir,
Suponga que las medidas y las desviaciones
típicas de cada uno de los exámenes sean las
constantes de la tabla 2.9
Tabla 2.9 medidas aritméticas y desviación
típica de cuatro evaluaciones
• Ejercicio-ejemplo 2.25
Basándose en las Tablas 2.8 y 2.9, clasifique a
las personas A y B.
Para que la escala reducida no presente
valores negativos, la mayoría de las veces se
puede hacer un cambio de escala, fijándose,
arbitrariamente, una media y una desviación
típica. Por ejemplo, escoja la media 1.000 y
una desviación típica de 100 para transformar
los valores relativos en los nuevos valores por
medio de la expresión: nuevo valor = nueva
media + nueva desviación típica x, es decir, X
= 1.000 + 100z. De esta manera, los nuevos
valores para la persona A, partiendo de sus
valores relativos z se convierten en:
• En el examen A: X = 1.000 +100(0) =
1.000;
• En el examen B: X = 1.000 +100(-2) = 800;
• En el examen C: X = 1.000 +100(1) =
1.100;
• En el examen D: X = 1.000 +100(-1) = 900;
Haciendo los mismos cálculos para la persona
B, todos los resultados pueden ser resumidos
en la Tabla 2.10.
Tabla 2.10 Valores relativos de los cuatro
exámenes, cambiados a una escala donde la
medida es 1.000 y la desviación típica es 100.
Se concluye que la persona A es la mejor, ya
que tiene, en términos de los valores
calculados basándose en los valores relativos,
una ventaja de 700 puntos en relación con la
persona B (puntos equivalentes a la
multiplicación de la diferencia relativa de 7
puntos, multiplicada por la desviación típica
100).
Herejía
Emplear únicamente tablas de frecuencia y
gráficos para sacar conclusiones con
respecto a una población
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
337
PRESENTACIÓN VISUAL AL PÚBLICO DE
LA MUESTRA 0 LA POBLACIÓN:
CONSTRUCCIÓN DE GRÁFICOS
Los gráficos facilitan la visualización de los
valores y son ampliamente utilizados en la
representación de los datos estadísticos.
Cuando se elabora cualquier clase de gráfico se
pierde información, pues no existen más las
observaciones originales. Sin embargo,
frecuentemente esa perdida de información es
pequeña comparada con la concisión y la
facilidad de interpretación. De todos modos,
cuando se saquen conclusiones sobre una
población a partir de los gráficos, hay que
tener un redoblado cuidado.
O Navegando en Internet
Vaya al site
http://www.math.yorku.caISCS/StatResource.
html, haga click en Gallery/ "Gallery of Data
Visualización -para ver algunos ejemplos de los
mejores y de los peores gráficos estadísticos.
Uno de estos es el gráfico de Minard, referente
a las campañas de Napoleón.
El ingeniero francés Charles Minard ilustro el
desastre de Napoleón en Rusia y muchos
consideran esté gráfico estadístico como el
mejor que hasta ahora se haya hecho;
representa el tamaño del ejercito junto con un
mapa de la campaña en el ataque y en la
retirada, haciendo énfasis en la amplitud del
terreno disponible para el ejército francés,
junto con la temperatura registrada, en un
gráfico de línea en la parte inferior. Aproveche
para explorar otros gráficos en esa dirección de
la Web.
La representación grafica de una serie de datos
permite, al mismo tiempo, una visión general y
alguna caracterización particular de la
población por medio de una correspondencia
entre las categorías o valores y una
determinada figura geométrica, de tal manera
que cada valor o categoría esta
representado(a) proporcionalmente.
• Ejercicio-ejemplo 2.26
Para los valores 5, 15 y 25, haga corresponder
a 5 una altura de 2 cm. Determine las alturas
que corresponden a los valores 15 y 25.
Se debe resaltar que es conveniente, por
motivos estéticos, considerar, en la elaboración
de los gráficos, los siguientes aspectos:
- el grafico, en conjunto, debe encuadrarse en
un rectángulo de dimensiones que lo hagan
agradable a la vista;
- las figuras no deben ser ni muy grandes ni
muy angostas, obedeciendo al gusto estético;
-finalmente, el grafico, por su objetivo de
simplificar, debe contener solamente algunas
divisiones de la escala vertical; las líneas
horizontales deben ser pocas, de tal manera
que lo hagan agradable para la lectura y la
interpretación.
Los elementos complementarios de un gráfico,
son:
- título general que indique la situación
estudiada, la época y el sitio;
- las escalas y las respectivas unidades de
medida;
- la indicación de las convenciones adoptadas
(generalmente cuando representan el resultado
de las observaciones de una misma situación
en dos o más regiones o en fechas diferentes);
- la fuente de la información de donde se
extrajeron los valores.
La estética y la corrección cientifica deben
contribuir para la escogencia de las escalas, de
tal manera que la apariencia del gráfico sea la
adecuada para sacar conclusiones con respecto
a la situación que este siendo analizada.
Generalmente los gráficos deben ser
presentados con la escala de ordenadas
partiendo de cero, con el fin de que la
comparación visual entre las sucesivas
marcaciones en el eje vertical puedan ser
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
338
hechas correctamente. Sin embargo, la escala
puede comenzarse con cualquier otro valor
cuando se desee, pero si de comparar los
datos se trata, hay que resaltar las variaciones
existentes entre estos.
Existe una gran variedad de formas de
presentación de los valores numéricos, todos
destinados a llamar la atención sobre ellos. En
este libro presentaremos apenas los gráficos
más usados comúnmente.
Descripción de los datos cualitativos
Para estas clases de datos, los gráficos más
utilizados son los de barras, o de columnas y
los de sectores.
Gráfico de barras
Un gráfico de barras ilustra comparaciones
entre categorías; estas son organizadas
verticalmente, pues los valores se disponen
horizontalmente para destacar la comparación
de los valores y dar menos énfasis al tiempo.
En el diagrama de barras (Figura 2.17), cada
categoría esta representada por un rectángulo
de área proporcional a su valor (si los
rectángulos tuvieran la mis base, es suficiente
considerar la proporcionalidad en relación con
las alturas).
fuente:folha de sau Paulo.25/3/1999.
Figura 2.17 gráfico de barras
En este gráfico, es indiferente el orden de
presentación de los rectángulos, por tratarse
de una serie ordenada según una característica
cualitativa: en esos casos, no hay, en general,
un orden unto, técnica y lógicamente
admisible, pudiendo existir diversos ordenes,
correspondientes a diferentes criterios. Una
variante de esta clase de gráfico es el de
barras yuxtapuestas (Figura 2.18), que
representa la relación entre los valores o
categorías individuales, y el total.
Figura 2.18
Gráfica de barras yuxtapuesta
Fuente: compañía siderúrgica nacional,
25/3/1999
Gráfico de columnas
Un gráfico de columnas muestra las
alteraciones que sufren los datos en un
intervalo de tiempo o ilustra comparaciones
entre categorías, las cuales son organizadas de
manera horizontal; los valores figuran en la
escala vertical para destacar la variación a lo
largo del tiempo. En el gráfico de columnas
(Figura 2.19), cada categoría esta
representada por un rectángulo de área
proporcional a su valor (si los rectángulos
tuvieran la misma base, es suficiente
considerar la proporcionalidad en relación con
las alturas).
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
339
En el gráfico de columnas, también es
indiferente el orden de presentación de los
rectángulos por tratarse de una serie ordenada
según una característica cualitativa. En esos
casos, no hay, en general, un orden, técnica y
lógicamente admisible, pudiendo presentarse
ordenaciones diferentes, correspondientes a
criterios diferentes.
Una variante de esta clase de gráficos es el de
las columnas yuxtapuestas, el cual representa
la relación que hay entre los valores o
categorías individuales y el total.
Figura 2.20 gráfico de columnas de
yuxtapuestas.
Gráficos por sectores*
Cada categoría corresponderá a una división o
a un sector de un circulo; de allí proviene el
nombre de gráfico por sectores, generalmente
utilizado cuando se intenta comparar el total
de cada categoría con el conjunto total.
Cuando el objetivo de la representación fuere
el análisis de la participación de cada categoría
en relación con el total, la representación por
sectores es la adecuada porque permite
establecer la comparación entre los valores
(sectores) y el total (Figura 2.21)
Descripción de los datos cuantitativos
Los gráficos más utilizados son el gráfico de
puntos y el histograma.
Gráfico de puntos **
El gráfico de puntos (Figura 2.22) es el
adecuado para ilustrar el comportamiento de
los valores individuales en relación con el
conjunto de esos valores. Se traza una línea
horizontal con una escala para la variable
cuantitativa, pues el valor numérico de cada
medida del conjunto de datos esta represen-
tado sobre la escala horizontal por un punto;
cuando los valores se repiten, los puntos son
colocados uno encima del oro, formando una
pila en aquella localización particular, en la
cual se hace una lista de los valores de la
variable que interesa.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
340
Histogramas
El histograma (Figura 2.23) es el adecuado
para ilustrar el comportamiento de los valores
agrupados en clases, siendo, sencillamente, un
gráfico de columnas compuesto por varios
rectángulos adyacentes, que representan a la
tabla de frecuencias con perdida de
información de un conjunto de valores. En la
escala horizontal se marcan los intervalos de
clase, y cada intervalo es la base de cada
rectángulo; en la escala vertical se marcan las
alturas de los rectángulos, las cuales son las
respectivas frecuencias de las clases.
Figura 2.23 historigrama
MOSTRANDO LA RELACIÓN
Diagrama de dispersión
Es la mejor manera de visualizar la relación
entre dos variables cuantitativas. La
representación grafica se hace en el mismo
sistema de coordenadas, en el cual una
variable es colocada en el eje horizontal (el eje
de las x) y la otra en el eje vertical (el eje de
las y) Cuando los valores son ordenados, los
segmentos que representan a esos valores
deben disponerse en orden de valores su-
cesivos, con distancias proporcionales a las
diferencias de dichos valores. En este caso, el
diagrama de dispersión se identifica con la
llamada representación cartesiana de las
funciones.
El diagrama de dispersión es una aplicación del
proceso general de representación de las
funciones en el sistema de coordenadas
cartesianas. En ese sistema, los ejes
coordenados son dos rectas del plano que se
cortan perpendicularmente; su punto de corte
es el origen de una escala de medida para cada
una de las rectas, siendo fijado a partir de ese
origen un sentido positivo y uno negativo. En
general, una de las rectas es tomada
horizontalmente (eje de las abscisas) con
sentido positivo hacia la derecha y negativo
hacia la izquierda del origen; otra, vertical (eje
de Las ordenadas), con sentido positivo hacia
arriba y negativo hacia abajo del origen.
Todo punto P esta determinado de manera
única por la medida de los segmentos
perpendiculares a los dos ejes, trazados desde
el punto dado, siendo llamada abscisa de P,
simbolizada por la letra x, el segmento
perpendicular al eje de las ordenadas (cuya
longitud es medida por la escala del eje de las
abscisas); se llama la ordenada de P,
simbolizada por la letra y, al segmento
perpendicular al eje de las abscisas (cuya
magnitud es medida por la escala del eje de las
ordenadas). La abscisa y la ordenada se llaman
las coordenadas cartesianas de P
El gráfico de dispersión se usa para interpretar
la relación entre dos variables, observándose el
patrón representado, el cual debe informar con
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
341
respecto a la dirección, la forma y la intensidad
de la relación.
La dirección indica una asociación positiva
cuando, a medida que la variable colocada en
el eje de las x aumenta, también aumenta la
variable colocada en el eje de las y, la
dirección indica una asociación negativa
cuando, a medida que la variable colocada en
el eje de las x aumenta, la variable colocada en
el eje de las y, disminuye; tiene una
concentración de puntos en comparación con
un patrón no-uniforme. Un ejemplo de
diagrama de dispersión es el de la Figura 2.24
Figura 2.24
Diagrama de dispersion
Gráfico secuencial o en línea
Cuando una de las variables es el tiempo, ésta
se coloca en el eje horizontal el diagrama de
dispersión se llama gráfico secuencial o de
línea (Figura 2.25)
Aunque no pueda resumir cualquier
información, el gráfico da una idea de la
tendencia general y del grado de variabilidad.
En general, los intervalos se espacian
igualmente; por ejemplo, un día, o un año, o
cinco años. La Figura 2.26 muestra el gráfico
secuencial para los valores mostrados en la
Tabla 2.11
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
342
CONSTRUCCIÓN DE GRÁFICOS
Manualmente
Grafico de barras
• Paso 1: establezca un orden (generalmente
arbitrario, pero, de acuerdo con los objetivos
del estudio, puede ser aconsejable el orden
creciente o decreciente de los valores) para
colocarlo en el eje vertical de las categorías;
• Paso 2: teniendo en cuenta el mayor valor de
las categorías, escoja una escala horizontal
para representar los valores correspondientes;
•Paso 3: en el eje vertical, para la primera
categoría dibuje un rectángulo con cualquier
base y con altura proporcional al valor de la
categoría;
• Paso 4: repita el proceso del paso 3 para las
demás categorías.
Ahora que la base y la altura esta
correlacionadas, al elaborar los gráficos es
conveniente, por razones estéticas, tener en
cuenta los siguientes aspectos:
- el gráfico, en su conjunto, debe encerrarse en
un rectángulo de dimensiones que lo hagan
agradable a la vista;
- la base del rectángulo no debe ser ni muy
grande, ni muy estrecha, guardando el sentido
de la estética;
- como la finalidad del gráfico es la de
simplificar, este debe contener solamente
algunas divisiones de la escala vertical; las
líneas horizontales deben ser pocas, y el
conjunto debe permitir que la lectura e
interpretación sean atrayentes.
Gráfico por columnas
• Paso 1: establezca un orden (generalmente
arbitrario, pero, de acuerdo con los objetivos
del estudio, puede ser aconsejable el orden
creciente o decreciente de los valores o de
acuerdo a su presencia a lo largo del tiempo)
para la colocación, en el eje horizontal, de las
categorías;
• Paso 2: teniendo en cuenta el valor mayor de
Las categorías, escoja una escala vertical para
representar los valores correspondientes;
• Paso 3: en el eje horizontal, para la primera
categoría, dibuje un rectángulo de base
cualquiera y altura proporcional al valor de la
categoría;
• Paso 4: repita el proceso del Paso 3 para las
demás categorías.
Gráfico por sectores
• Paso 1: calcule, por regla de tres, los grados
correspondientes a cada categoría; el total T
de las categorías equivale a 3600 y el ángulo
de una determina categoría C e igual a
(360°/T) x C;
• Paso 2: en un círculo de radio arbitrario, a
partir de cierto punto, marque, con el auxilio
de un transportador, el ángulo correspondiente
a la primera categoría;
• Paso 3: a partir de la marcación final de la
categoría recién señalada, repita el
procedimiento del Paso 2 con las demás
categorías;
• Paso 4: Repita el proceso del Paso 3 para las
demás categorías, marcando, sucesivamente,
los demás ángulos.
Al contrario del gráfico de barras, que puede
hacerse en un solo color (o un único tipo de
rayado), el gráfico por sectores debe tener
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
343
áreas diferenciadas por colores, gradaciones de
un mismo color, o también con rayados
diferentes. En el caso de una presentación, en
el mismo gráfico, de varios diagramas
sectoriales correspondientes a un mismo
fenómeno pero de fechas diferentes (u otras
formas equivalentes), se debe modificar el
radio de cada círculo, de modo que quede
protegida la regla general de proporcionalidad
entre los valores que estos representan y las
respectivas áreas de los círculos.
Gráfico de puntos
• Paso 1: trace un eje horizontal y marque en
él los puntos inicial y final, de tal manera que
incluyan todos los valores que figuraran en el
gráfico;
• Paso 2: marque, en la escala, cada valor
proporcionalmente;
•Paso 3: identifique cada valor por un punto
sobre el eje horizontal y en la dirección de ese
valor; cuando un valor se repita, coloque otro
punto sobre el anterior, formando un
apilamiento de puntos en esa localización
particular.
Histograma
• Paso 1: en el eje horizontal, marque,
sucesivamente, los límites de cada clase;
• Paso 2: en el eje vertical, marque, en la
escala, los valores relativos de las frecuencias
absolutas de las clases;
• Paso 3: para la primera clase, construya un
rectángulo cuya base es el intervalo de clase y
la altura es la frecuencia simple de esa clase;
• Paso 4: para la clase siguiente, construya un
rectángulo adyacente al primero cuya base es
el intervalo de la clase y la altura es la
frecuencia simple de esa clase;
• Paso 5: repita el procedimiento para las
demás clases.
Gráfico de dispersión
• Paso 1: trace los ejes coordenados;
• Paso 2: marque, en el eje horizontal, el
primer valor de la primera variable y trace una
recta paralela al eje vertical;
• Paso 3: marque, en el eje vertical, el
segundo valor de la primera variable y trace
una recta paralela al eje horizontal;
• Paso 4: identifique la intersección de las dos
rectas con un punto;
• Paso 5: repita el procedimiento para los
demás pares de valores de las variables.
Gráfico secuencial o de línea
• Los pasos son semejantes a los del gráfico de
dispersión, con la única diferencia que en el eje
horizontal se marca el tiempo.
Con el Excel
Es muy fácil y rápido presentar los datos de
una plantilla usando el Asistente de Gráficos,
con el cual se puede escoger el modelo a partir
de muchas variantes predefinidas y, en
consecuencia, personalizar cualquiera de esas
opciones. La vinculación del gráfico con los
valores que le dieron origen también es
sencilla, y cada cambio hecho en la planilla se
actualiza automáticamente en la figura. El
Apéndice 3 enseña cómo hacerlo.
GRÁFICOS ENGAÑOSOS
De nuevo, cuidado!!!!! Cuando se observa un
gráfico o una tabla, particularmente como
parte de un anuncio, sea cauteloso. Fíjese en
las escalas utilizadas en los ejes vertical y
horizontal. Se puede distorsionar la verdad con
las técnicas estadísticas, tal como lo muestran
las Figuras 2.27 y 2.28.
Herejía (mayor)
Usar gráficos con distorsiones para justificar
puntos de vista.
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
344
Términos claves
Análisis exploratorio de los datos
Información
Datos brutos de la muestra
Papel de la muestra
Medidas de tendencia central Media
Media aritmética muestral
Mediana de la muestra
Moda de la muestra
Media aritmética ponderada de la muestra
Desviación típica poblacional
Media geométrica muestral
Variabilidad
Medidas de dispersión
Amplitud total de la muestra
Tabla de frecuencia sin pérdida de información
Tabla de frecuencia con pérdida de información
Frecuencia absoluta
Límite inferior de clase Escalas patronizadas
Gráficos de barras
Gráficos por sectores
Histograma
Gráfico secuencial o en línea
Datos brutos de la población
Lista de la población
Medidas de tendencia central
Media aritmética poblacional
Mediana de la población
Moda de la población
Media aritmética ponderada de la población
Media geométrica poblacional
Amplitud total de la población
Varianza de la población
Parámetros de la población
Estadísticas muestrales
Coeficiente de variación
Tabla de frecuencias
Clases
Límite superior de clase
Datos cualitativos
Gráficos por columnas
Gráficos de puntos
Diagrama de dispersión
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
345
RESUMEN
El Análisis exploratorio de los datos es la fase
inicial del proceso de estudio de los elementos
recolectados en las muestras, en los cuales se
obtienen las informaciones que serán utilizadas
en la fase final, la llamada inferencia
estadística, también conocida como análisis
confirmatorio de los datos. Una vez
recolectados los datos de codas las variables
comprendidas en determinado estudio, el paso
siguiente consiste en descubrir lo que los datos
de la muestra tienen que decir con respecto a
lo que está siendo investigado.
Para mejor identificar a un conjunto de
números de una muestra, es preciso escoger
un valor único que representa a todos los
demos. Las tres medidas mis conocidas que
sugieren una concentración a su alrededor,
medidas de tendencia central, son la media
aritmética de la muestra, la mediana de la
muestra y la moda de la muestra.
La media de un conjunto de números es un
valor que, teniendo en consideración la to-
talidad de los elementos del conjunto, los
puede sustituir, sin alterar una determinada
característica del mismo. Si es la media
aritmética, conserva la suma total; si es la
media geométrica, conserva el producto. La
mediana de la muestra es el valor que ocupa la
posición central de la lista, cuando los valores
muestrales están en orden creciente o
decreciente e incluyendo los valores repetidos,
individualmente, en la lista ordenada.
La moda do La muestra es el valor que más
aparece en la muestra.
7. la varianza de la muestra es la medida de
variabilidad resultante de la división por (n-I)
de la suma de los cuadrados de las diferencias
entre los valores de la muestra y la media
aritmética de la muestra.
8. Para que las unidades de las medidas vuel-
van a sus dimensiones originales, se define la
más importante medida de dispersión para una
muestra, llamada desviación típica muestral,
que es la raíz cuadrada positiva de la varianza
de la muestra.
9. Los conceptos de las medidas que
caracterizan a una población finita de tamaño
N son semejantes a los de la muestra.
10. El coeficiente de variación es la magnitud
relativa de la desviación típica cuando era es
comparada con la media aritmética.
11. Las tablas resumen informaciones de las
muestras o de la población y se presentan en
un formato que permite sacar conclusiones
más fácilmente, aunque de manera limitada,
con respecto al conjunto total de categorías o
valores. Las tablas pueden construirse con o
sin pérdida de información.
12. La frecuencia absoluta de una categoría o
de un valor es la cantidad absoluta de veces en
que la categoría o el valor aparecen en un
conjunto de datos.
13. La tabla de frecuencias es la reorganización
de los valores en orden creciente o decreciente
de magnitud, en tal forma que una
característica de la población está subdividida
en clases o categorías, indicando la cantidad de
veces que aparece un dato en cada clase y
relacionando cada valor (o clase de valores)
con la frecuencia de su presencia.
14. La frecuencia acumulada de una clase es la
cantidad de elementos que tienen menor o
igual valor que el límite superior de esa Base.
15. Las escalas patronizadas o tipificadas dan,
mejores resultados que las comparaciones
basadas solamente en los datos brutos. Una de
esas escalas se basa en la desviación de cada
uno de los valores con respecto a la media
aritmética, expresándose esta desviación en
unidades de desviación típica.
16. Los gráficos facilitan la visualización de los
valores y son ampliamente utilizados en la
representación de los datos estadísticos. Al
hacer cualquier clase de gráfico se pierde
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
346
información, pues ya no existen las obser-
vaciones originales; de todos modos, fre-
cuentemente esta perdida de información es
pequeña comparada con la concisión y la
facilidad de interpretación proporcionada por
los gráficos.
17. Cuando se observa un grafico o una tabla,
especialmente cuando se trata de un anuncio,
sea cauteloso; observe las escalas utilizadas en
los ejes horizontal y vertical. Se puede
distorsionar la verdad con las técnicas
estadísticas.
EJERCICIOS PROPUESTOS
l. Para la siguiente noticia, identifique:
a. tipos de variables utilizados;
b. las medidas de tendencia central men-
cionadas;
c. las medidas de tendencia central calculadas.
Perfil. El turista brasileño tiene entre 30 y 40
años de edad una venta promedio de 851.800)
y secundaria completa viaja dos veces al año
en bus.
Su objetivo principal es el de visitar parientes y
amigos. La mayoría, el 70%, viaja en la
estación alta. Los viajes duran, en promedio,
12 días. Este es el perfil, encontrado por la
Fundación Instituto de Investigaciones
Económicas de la USP del turista brasileño en
1998. Los datos figuran en la publicación Datos
Estadísticos de, Turismo -1998.18
2. Demuestre las siguientes propiedades de la
media aritmética:
- la suma algebraica de las diferencias entre
cada valor observado y la media aritmética de
los valores es cero;
- la media del producto de una constante por
una variable es igual al producto de la
constante por la media de la variable;
- la suma de los cuadrados de las desviaciones
de la media aritmética es mínima comparada
con la suma de los cuadrados de las
desviaciones relacionadas con cualquier otro
valor diferente a la media aritmética.
3. En la definición de la media, si la
característica del conjunto que debe ser
conservada es la suma de los inversos de sus
elementos, se tiene la media armónica. El ori-
gen de la denominación de media armónica es
musical; ella es el término central de la
sucesión 6, 4, 3, donde 6:4:3 es la sucesión
según la cual debe estar comprendida la onda
musical para obtenerse una nota, la quinta y la
octava. Para dichos valores, la media
aritmética es 13/3, la media geométrica es la
raíz cúbica de 72 y la media armónica es 4.
Demuestre que la media aritmética es siempre
mayor o igual que la media geométrica y ésta
es siempre mayor o igual que la media
armónica.
4. Demuestre que:
- la varianza de una constante es igual a cero;
- la varianza del producto de una constante por
una variable es igual al producto del cuadrado
de la constante por la varianza de la variable;
- la varianza de la suma o la diferencia de una
constante y una variable es igual a la varianza
de la variable.
5. Comente el siguiente texto y decida quién
debe ser el vencedor: "La gente entonces
manda por los computadores de DATAMEC y
descubrieron cuál es el lector modelo de "EL
PASQUÍN". Lo cual quiere decir que quien esté
en medio de los medios gana".19
6. "El túnel Reboucas - inaugurado en 1965 es
un nexo importante entre las zonas Sur y
Norte - y la Avenida Brasil, principal eje de
acceso y salida de la ciudad,... son campeones
en los problemas causados por los conductores
y sus vehículos. Identifique la medida de
tendencia central que caracteriza al Túnel
Reboucas y a la Avenida Brasil.
7. El número de muertes por accidentes de
transito en Sao Paulo entre los años 1997 y
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
347
1998, es la que figura en la Tabla 2.12.
Explique por qué la variación total no es ni la
suma de las variaciones entre hombres y
mujeres, ni su media aritmética o geométrica.
8. los fieles de cada religión, en porcentajes de
población mundial, son los siguientes: ''
Católicos
Otros
cristianos
Musulmanes
Hindúes
Budistas
Judíos
Otros
16.9
17
23,1
13
6,1
0,2
23,7
Compare esas cifras con las constantes del
Problema 15 y saque sus conclusiones al
respecto.
9. Comente las siguientes frases: "Un escritor
medio:.. Los críticos que no gustan de....
acostumbran considerarlo "medio"…no tiene
genialidad, ni su abolengo provinciano, sus tics
moralistas, su adjetivación rococó: esa es la
forma de ser un gran "medio”22
10. Identifique la medida de tendencia central
presentada en esta noticia: "El ranking de los
remolcados. " Los modelos populares lideran
con holgura estadística en Río de Janeiro. El
recalentamiento es la mayor causa de las
averías."23
11. Compruebe si es correcta la siguiente
información:
"El cultivo del millo ocupa 1.320.880
hectáreas, con una productividad proyectada
de.2.937 kilos por hectárea y producción de
3.879.475 toneladas en el Estado."24
12. Con base en la información contenida en
las Tablas 2.2 y 2.3, asigne pesos a los
campeonatos y subcampeonatos, de tal ma-
nera que coloque en el primer lugar del ranking
del fútbol brasileño en 1998 a cualquier equipo
que esté entre la 2a y la 20a posiciones.
13. Los resultados del Examen Nacional de la
Enseñanza Media (ENEM), divulgados por el
Ministerio de Educación (MEC), en la parte
referente a los conocimientos generales, fueron
los siguientes: I-Dominio de idiomas, 4.2; II-
Comprensión de fenómenos, 4.1; III-
Resolución de situaciones-problema, 4; IV-
Construir argumentaciones, 3.7; V- Elaborar
propuestas, 3.9. Determine la calificación
media en cuestiones de conocimientos
generales y compare su respuesta con la
publicada: calificación.4
14. Elabore el gráfico de barras, el de
columnas y el de sectores para la distribución
de los fieles de cada religión en la población
mundial, en porcentajes. Ver datos en el
Problema 8.
15. "Según las estadísticas, de los 28.912 su-
cesos registrados en las cuatro vías especiales
de la ciudad, 9.764 fueron en Rebougas. La
Avenida Brasil aparece con 8.011, seguida por
el Túnel de Santa Bárbara con 6.260 y el Túnel
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
348
de los Hermanos con 4.877 accidentes"26 Para
ilustrar esta noticia, elabore un gráfico por
sectores.
16. Las importaciones brasileñas, en billones
de dólares, durante 1998 fueron las siguientes,
mes a mes: enero, 4.577; febrero, 3.799;
marzo, 5.038; abril, 4.779; mayo, 4.913;
junio, 4.844; jubo, 5.329; agosto, 4.634; sep-
tiembre, 5.338; octubre, 5.039; noviembre,
4.709; diciembre, 4.538.27 Construya un
gráfico de líneas para visualizar las importa-
ciones brasileñas en 1998.
17. Basándose en las importaciones y exporta-
ciones brasileñas en 1998, (ejercicio-ejemplo
2.5, y el Problema propuesto 12), construya un
gráfico que ilustre el déficit (o superávit) de la
balanza comercial brasileña.
18. Las principales religiones del mundo, en
número de fieles, es la siguiente:28
Cristianismo
Islamismo
Hinduismo
Budismo
Religiones
tribales
Judaísmo
Confucianismo
No religiosos y
ateos
1.929.957.000
1.147.494.000
747.797.000
353.141.000
231.614.000
14.890.000
6.112.000
906.995.000
Fuente David B. Barret /Organización de
Naciones Unidas / 1997
Construya los gráficos de barras, de columnas
y de sectores.
19. Las exportaciones brasileñas, en billones
de Mares, durante 1998 fueron las siguientes
mes a mes: enero, 3.914; febrero, 3.714;
marzo, 4.273, abril, 4.572; mayo, 4.609;
junio, 4.886; Julio, 4.970; agosto, 3.985; sep-
tiembre, 4.537; octubre, 4.014; noviembre,
3.702; diciembre, 3.944.29 Construya un
gráfico de líneas para visualizar las exporta-
ciones brasileñas en 1998.
20. Determine la mediana del comportamiento
de la Bolsa de Valores de Sao Paulo en la
primera semana de enero de 1999, con base
en el 0%: 2a ronda: +2.32%; 3a ronda: +2.43;
4a ronda: +3.09; 5a ronda: -5.13% y 6 a
ronda: -2.48%.30
21. La revista EXAME- Maiores e Melhores, de
julio de 1998, publicó la inversión no
inmovilizada de las 10 mejores empresas del
Brasil en el ramo de la electroelectrónica, en
función del retorno de las adquisiciones, en %,
obtenidos en el año (Tabla 2.13). Identifique,
justificando, la empresa que ocupa la mediana
de la muestra observada.
Tabla 213 inversión no inmovilizada de la 10
mejores empresas del Brasil en el ramo de la
electroelectrónica en función del retorno de las
adquisiciones, en porcentajes (%).
SOLUCIONES DE LOS EJERCITOS-
EJEMPLO
2.1 La solución es:
• Paso 1: digite los valores en la columna A
(podría ser en cualquier otra), un valor en cada
línea, desde la línea 1 hasta la línea 80; guarde
esta plantilla: la usará en otros ejercicios.
• Paso 2: seleccione las celdas que tienen los
valores (haciendo click en la celda A con el
botón izquierdo del mouse y llevando el
puntero, sin soltar el botón del mouse, hasta la
celda A80); todos los valores aparecen en
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
349
fondo oscuro:
•Paso 3: en la Barra de Menús, en Datos…,
escoja Clasificar..; se abre una pantalla en la
cual se teclea Creciente (en el Excel 97) en
Clasificar por o Ascendente (en Excel 7.0);
haga click en OK; en la columna A, donde
fueron digitados los valores, aparecen los
primeros ordenados.
2.2 La solución es: (30.775 + 21.411 + 24.045
+…..+ 4.087 + 1.873) empleados/80 =
6.468,275 empleados. Observe que el valor
0.468.275 no esta en la lista original.
2.3 Siguiendo los pasos para calcular la media
aritmética de esa muestra, el Excel mostrará,
en la celda activa, el siguiente resultado:
6.468,275 empleados.
2.4 Los cálculos hechos por el periódico son
correctos.
2.5 A. Se desea una media M tal que, si las
importaciones brasileñas fuesen mensualmente
iguales a M, la importación anual también seria
la misma. La importación anual fue entonces
de 4.577 + 3.799 + 5.038 + + 4.538. Si en
todos los meses las importaciones fueran
iguales a M, la importación anual sería
entonces igual a 12M. En consecuencia, 12M =
4.577 + 3.799 + 5.038 +....+ 4.538 = 57.537
y M = 57-537/12 = 4.794.75 billones de
Mares. La media buscada es la media
aritmética.
2.5 B. La respuesta no es, como puede apare-
cer a primera vista (2,8 + 3,7 + 0,5) % /3 =
2,33%.
Se desea una tasa media i tal que si, en todos
los años la tasa de crecimiento fuera igual a i,
el aumento trianual sería el mismo. Tomando
100' como base en el año cero, al final del
primer año se tendría 100 x 1.028 = 102,8; al
final del segundo año, 102,8 X 1-037 =
106,6036 y al final del tercer año, 106,6036 x
1,005 =107,136618. Si esto es así, el aumento
trianual fue de 7,136618%. Si en todos los
años hubiese un aumento con la tasa i se
tendría, suponiendo a 100 como la base en el
año cero, al final del primer año 100[1 + z]; al
final del segundo año, [100(1 +i)] (1 +i) y al
final del tercer año
[100(1+i)(1+i)](1+i)= 100[1+i ]Entonces:
100(1+i)3 = 107,136618
(1 fr)= 1,07136618 y (I +i)= raíz cúbica de
1,07136618= 1,023244245 y 1=
0,623244245= 2,3244245%. La media en-
contrada es la geométrica.
2.6 La muestra + 1,4%, +2,4%, +2%,-3, 1 %
y -1,2% tiene la siguiente ordenación: en la
posición 1 está -3,2%; en la posición 2 esta, -
1,2%; en la posición 3 está +1,4%; en la
posición 4 está +2%; y en la posición 5 está
+2,4%. El valor que ocupa la posición central
es + 1,4%, que es el valor de la mediana de la
muestra.
2.7 La muestra 1,76%, 1,41%, 2,64% y
2,18% tiene la siguiente ordenación: en la
posición 1 está 1,41%, en la posición 2 está
1,76%, en la posición 3 está 2,18% y en la
posición 4 está 2,64% Hay dos valores que
ocupan las posiciones centrales: 1,76% y
2,18%. El valor de la mediana de la muestra es
(1,76 + 2,18)/2 = 1,97%.
2.8 La muestra + 1,4%, +2,4%, + 2%, -3,1%
y -1,2% tiene el siguiente orden: en la 1a
posición está -3,2%, en la 2a posición, - 1,2%,
en la 3a posición está + 1,4%, en la 4a posición
está +2%, y en 5a posición está +2,4%. De
esa manera, n = 5 y la posición central es
(5+1)/2 = 3; la mediana de la muestra ocupa
la tercera posición y su valor es + 1,4%.
2.9 La muestra 1,76%, 1,41%, 2,64%, y
2,18% tiene el siguiente orden: en la 1a
posición está 1,4%, en la 2a posición está
1,76%, en la 3a posición está 2,18% y en la 4a
posición está 2,64%. Entonces n = 4 y la
posición central es (4+1)12 = 2,5 = 2 + 0,5 y,
siendo así, la mediana de la muestra es la
media de los valores que están en las
posiciones 2a y 3a a partir del comienzo de la
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
350
lista. En este ejemplo, la mediana de la
muestra es la media aritmética de los valores
que ocupan las posiciones 2ª y 3a, es decir,
1,76% y 2,18%. La media aritmética entre
1,76% 2,18% es (1,76 + 2,18)/2 = 1,97% que
es el valor de la mediana de la muestra.
2.10 La mediana es 4.916.
2.11 La moda de esta nuestra es OMO.
2.12 Esta muestra es bimodal: Rainha y Nike.
2.13 Como apareció #N, entonces el conjunto
es amodal.
2.14 33.461.319 empleados al cuadrado.
2.15 5.784,576 empleados.
2.16 El valor del CV es 89,43%.
2.17 A.
Aspecto inicial de la tabla de frecuencias del
Ejercicio-ejemplo 2.17
2.18A Los pasos para la construcción de una
tabla de frecuencias con pérdida de
información a partir de los datos de la Tabla
2.1 son los siguientes:
• Paso I: amplitud total de los valores: 30.775
- 154 = 30.621;
• Paso 2: escoger la cantidad de clases: 9;
• Paso3: amplitud de cada clase: 30.621/9 =
3.402,333 - 3.400; en caso de que sea
aproximada inferiormente la amplitud de cada
clase, el último dato sería excluido. De esta
manera, se aproxima a 3.500;
• Paso 4: límites de cada clase: Primera clase:
límite inferior = 100 y límite superior =
100+3.500 = 3.600. Segunda Base: limite
inferior = 3.600 y límite superior = 3.600 +
3.500 = 7.100, y así sucesivamente.
2.18A
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
351
2.19
• Paso 1: para la 1a clase, se tiene
(100+3.600)/2 = 1.850; para la 2a clase se
tiene (3.600+7.100)/2 5.350, y así suce-
sivamente.
• Paso 2: se tiene para la 1a clase: 1.850x30 =
55.500 y para la 2a clase, 5.350x24 =
128.400;
• Paso 3: (55.500 + 128.400 + +
29.850) que tiene un total de 529.500;
• Paso 4: 529.500/80 = 6.618,75, que es el
valor representativo de la media aritmética de
los datos originales, los cuales originan la tabla
de frecuencias con perdida de información;
compare con el valor exacto, 6.468,275.
2.20
• Paso 1: hay 80 valores, con dos posiciones
centrales: 40a y 41a;
• Paso 2: la frecuencia absoluta de la 1 a clase
es 30, la cual sumada a la frecuencia absoluta
de la segunda clase (igual a 24), da un total de
54 que es mayor que 40 y 4 1;
• Paso 3: compuesta segunda clase es la pri-
mera con frecuencia acumulada inmedia-
tamente superior a la mirad del total de los
valores, su punto medio, 5.350, es considerado
la mediana del conjunto de valores; compare
con el valor exacto, 4.916.
2.21 La clase con mayor frecuencia absoluta es
la 1a; entonces la moda es el punto medio de
esa clase, es decir, la moda vale 1.850;
compare con el valor exacto, que no existe,
por ser amodal la distribución de los datos.
Observe que tratar de emplear el mismo
procedimiento en situaciones diferentes sin
hacer un atento análisis, puede conducir a
decisiones erradas.
2.22 La amplitud total esta dada por 31.600 -
100 = 31.500; compare con el valor verda-
dero, 30.621.
2.23 Para la varianza, se debe calcular, para la
primera Base (1.850-6.618,75)2x 30; para la
segunda clase (5.400 -6.618,75)2x 24, y así
sucesivamente. Sumando esos resultados y
dividiendo por 79, se obtiene 33.569.262,24;
compare con el valor verdadero, 33.461.319.
2.24 No es posible porque la suma de los pun-
tos es igual para las dos personas.
2.25 Transformando los datos brutos en
valores relativos, por medio de la expresión
ANALISIS EXPLORATORIO_DE LOS DATOS_______________________________________________
352
Haciendo los mismos cálculos para la persona
B, todos los resultados pueden resumirse en la
siguiente tabla:
Solución del Ejercicio-ejemplo 2.25
Las dos personas pueden ser ahora
comparadas. Aunque A y B hayan obtenido la
misma suma de sus calificaciones brutas, el
resultado relación, que tiene en cuenta la
posición de cada persona en relación con codas
las demás que han obtenido determinada
evaluación, las coloca en orden. Se concluye
que la persona A es la mejor ya que, en
términos relativos, tiene una ventaja de 7 pun-
tos [-2 - (-9)] en relación con la persona B.
2.26. Las alturas serán, respectivamente, 6 cm
y 10 cm, porque, de esa manera, se asegura la
proporcionalidad. Se comprueba que la relación
entre cada altura y el respectivo valor es
constante e igual a 2/5 = 6/15 = 0,4.
Fuentes de noticias y citas
1. Folha de S. Paulo, 22/1/1999
2. Jornal do Brasil 10/12/1999
3. Miguel Jorge, Folha de S Paulo, 22/1/1999
4.Jornal do Brasil 26/1/1999
5. Folha de S. Paulo, 17/12/1998
6. Revista Exame - Maiores e Melhores, Julio
de 1998
7. Periodico Zero Hora, 14/1/1999
8. Jornal do Brasil, 8/1/1999
9. Carta Capital 3/2/1999
10. Periodico O Dia, 10/ 1 / 1999
11. Periodico O Dia, 10/ 1 / 1999
12. Periodico O Dia, 10/ 1 / 1999
13. Periodico O Dia, 10/ 1 /1999
14. Cuaderno Top of Mind, Folha de S. Paulo,
10/12/1998.
15. Cuaderno Top of Mind, Folha de S. Paulo,
10/ 12/1998.
16. Jornal do Brasil 31/12/1998.
17. Adaptado de <[email protected], 18.
Jornal de Brasil 31/12/1998.
19. MillOr Fernándes, Millor no Pasquim,
Circulo de libro, 1997
20. Jornal do Brasil 21/1/1998.
21. O Estado de S. Paulo, 13/1/1999
22. Otávio Frias Filho, Folha de S. Paulo,
10/12/1998
23. Jornal do BrasiL 16/1/1999.
24. Periodico How Zero, 14/1/1999.
25. Jornal do Brasil, 17/12/1999.
26. Jornal do Brasih 12/1/1998.
27. Jornal do BrasiL 8/1/1999.
28. Jornal do Brasil, 12/1/1999.
29. Jornal do Brasil, 8/ 1 / 1999.
30. Jornal O Dia, 10/ 1 / 1999
HACIENDO ENCUESTAS FIABLES_______________________________________________________
353
BLOQUE IV
EL TRATAMIENTO DE
LA INFORMACIÓN Y
LAS FUNCIONES
Clen Paulos, John (s/f), "Haciendo encuestas fiables",
en El hombre anumérico. El analfabetismo
matemático y sus consecuencias, México, Tusquets
(Metetemas), pp. 170-187.
Estimar las características de una población,
como el tanto por ciento que prefiere a cierto
candidato o a una marca concreta de comida
para perros, es en principio simple, igual que el
contraste de hipótesis. Se selecciona una
muestra al azar (esto es más fácil decirlo que
hacerlo) y luego se determina qué porcentaje
de la muestra prefiere al candidato (pongamos,
el 45 por ciento) o la marca de comida para
perros (pongamos, el 28 por ciento), ¿que
porcentajes hemos de tomar como estimación
de la opinión de la población total?
Sólo he trabajado efectivamente en una
encuesta en una ocasión. Se trataba de una
encuesta informal que pretendía resolver la
cuestión candente: ¿Que proporción, entre las
mujeres universitarias, se lo pasa bien viendo
series con Los tres Stooge? Descartando
aquellas que no conocían esa payasada tan
poco culta de los Stooge, encontró que un
sorprendente 8 por ciento de mi muestra
confesaba tal satisfacción.
No se puso demasiado cuidado en la selección
de la muestra, pero al menos el resultado el 8
por ciento, tenía ciertos visos de credibilidad.
Un problema evidente de afirmaciones tales
como «el 67 por ciento (o el 75 por ciento) de
los encuestados prefirieron la pastilla X» es
que fácilmente podrían estar basadas en
muestras pequeñas de tres o cuatro individuos.
Más descarado aún es el caso en que una ce-
lebridad avala una dieta, un medicamento, o lo
que sea, en tal caso tenemos una muestra de
uno, que generalmente, además, ha cobrado
por ello.
Así pues, más difícil que hacer cálculos
estadísticos es decidir que fiabilidad nos
merecen los mismos. Si la muestra es grande,
podemos confiar más en que sus
características se aproximen a las de la po-
blación total. Si la distribución de la población
no es demasiado dispersa ni variada, podemos
también confiar más en que las características
de la muestra sean representativas.
Con ayuda de unos pocos teoremas de teoría
de la probabilidad y estadística, podemos
sugerir lo que se conoce como intervalos de
confianza para estimar la probabilidad de que
una muestra característica sea representativa
del conjunto de la población. Así, podríamos
decir que un intervalo de confianza del 95 por
ciento para el porcentaje de electores que
votaran a favor del candidato X es el 45 por
ciento más o menos el 6 por ciento. Es decir,
HACIENDO ENCUESTAS FIABLES
HACIENDO ENCUESTAS FIABLES_______________________________________________________
354
que tenemos una seguridad del 95 por ciento
de que el porcentaje de la población se
desviara como mucho un 6 por ciento con
respecto a la estimación realizada en la
muestra; en este caso, entre un 39 y un 51 por
ciento de la población votar y por el candidato
X. Análogamente, podríamos decir que el
intervalo de confianza del 99 por ciento para la
proporción de consumidores que prefieren la
marca Y de comida para perro es del 28 por
ciento más o menos el 11 por ciento; o sea que
tenemos una seguridad del 99 por ciento de
que la proporción de la población se desvía
como mucho un 11 por ciento respecto de la
muestra; en este caso, entre el 17 y el 39 por
ciento de los consumidores prefieren la marca
Y.
Como en el caso del contraste de hipótesis, sin
embargo, en ninguna parte dan duros por
cuatro pesetas. Para muestras de un tamaño
dado, cuanto más estrecho es el intervalo de
confianza es decir, cuanto mas precisa es la
estimación, menos fiable es. Y a la inversa,
cuanto más ancho es el intervalo de confianza
esto es, cuanto menos precisa es la estima-
ción, más fiable es. Naturalmente, si
aumentamos el tamaño de la muestra,
podemos afinar, al mismo tiempo, el intervalo
de confianza y aumentar nuestra seguridad de
que este contiene el porcentaje de la población
(o cualquier parámetro o característica de la
misma), pero tomar muestras mayores es más
caro.
Los resultados de sondeos o de encuestas que
no llevan los intervalos de confianza o
márgenes de error son a menudo engañosos.
Lo más frecuente es que los sondeos si lleven
tales intervalos de confianza, pero que estos
no aparezcan en los reportajes de prensa. Las
afirmaciones que no se comprometen
demasiado y la incertidumbre rara vez son
noticia periodística.
Si un titular dice que el desempleo ha
disminuido del 7,1 al 6,8 por ciento, pero no
dice que el intervalo de confianza es de más o
menos 1 por ciento, uno puede llevarse la
impresión equivocada de que algo bueno ha
ocurrido. Sin embargo, dado el error del
muestreo, esa “disminución” podría ser
inexistente o, peor aun, podría haber habido
un aumento. Si no se dan los márgenes de
error, una buena regla empírica es que una
muestra aleatoria de mil o más individuos da
un margen suficientemente estrecho para la
mayoría de fines, mientras que una muestra
aleatoria de cien o menos da un margen
demasiado ancho.
Mucha gente se sorprende de que el número
de individuos que los encuestadores
entrevistan para llegar a sus resultados sea tan
pequeño. (La anchura del intervalo de
confianza es inversamente proporcional a la
raíz cuadrada del tamaño de la muestra.) En
realidad, el número de encuestados
generalmente es mayor que el que sería
necesario en teoría. Lo hacen así para
compensar problemas relacionados con la
dificultad de escoger una muestra aleatoria. Si
la muestra aleatoria seleccionada consta de mil
individuos, el intervalo de confianza teórico del
95 porciento para la estimación de los votantes
del candidato X o de quienes prefieren la
comida para perro de marca Y es
aproximadamente de más o menos el 3 por
ciento. Los encuestadores toman a menudo
más o menos el 4 por ciento en esta muestra,
para corregir el efecto de los que no contestan
y otros problemas.
Pensemos en los problemas que conlleva una
encuesta telefónica. ¿Afectará al resultado el
hecho de haber descartado de entrada las
casas que no tienen teléfono? ¿Qué porcentaje
de personas se negará a contestar o colgara
sin más cuando se entere de que se trata de
una encuesta? ¿Como los números se se-
leccionan al azar?, ¿qué pasa si el teléfono al
HACIENDO ENCUESTAS FIABLES_______________________________________________________
355
que se llama es una oficina? ¿Qué pasa si no
hay nadie en casa o si contesta un niño?
¿Cómo influye en las respuestas el sexo (la voz
o los modales) del entrevistador telefónico?
Cuando registra las respuestas, ¿el
entrevistador es siempre cuidadoso? ¿Es
siempre honesto? ¿Es aleatorio el método para
escoger números y centrales telefónicas?
¿Sugieren las preguntas alguna de las posibles
respuestas? ¿Son comprensibles? ¿Que
respuesta cuenta si hay más de un adulto en
casa? ¿Qué método se sigue para ponderar los
resultados? Si la encuesta se refiere a un tema
respecto al cual las opiniones varían
rápidamente, ¿cómo afecta a los resultados el
hecho de que la realización de la encuesta
haya durado cierto tiempo?
Las encuestas basadas en entrevistas
personales presentan también dificultades
parecidas. Entre los defectos más comunes de
las encuestas basadas en entrevistas
individuales tenemos el empleo de un tono
insinuante o la influencia del tipo de preguntas
sobre el encuestado. Por otra parte, una de las
preocupaciones más importantes en las
encuestas por correo es evitar que la muestra
se auto seleccione, al ser más probable que
contesten los individuos mas comprometidos y
estimulados, o los pertenecientes a cualquier
otro grupo atípico. (Tales muestras autoselec-
cionadas reciben a veces el nombre más
sincero de «grupo de presión».) La famosa
encuesta de 1936 del Literary Digest que
predijo que Alf Landon ganaría a Franklin
Roosevelt por un margen de tres a dos estaba
mal hecha, porque sólo el 23 por ciento de los
que recibieron cuestionarios los contestaron, y
estas personas eran generalmente de las
clases más altas. Un error parecido sesgó la
encuesta de 1948 que predijo que Thomas
Dewey ganaría a Harry Truman.
Es escandalosa la inclinación de los diarios y
revistas a publicar resultados sesgados
basados en respuestas a cuestionarios que
vienen en el mismo periódico. Estas encuestas
informales rara vez van acompañadas de los
intervalos de confianza u otros detalles de los
métodos seguidos, con lo que el problema de
las muestras auto seleccionadas no siempre
esta claro. Cuando autoras feministas como
Shere Hite o la columnista Ann Landers
informan que la proporción de sus encuestadas
que tienen aventuras amorosas o que
preferirían no haber tenido hijos es
sorprendentemente alta, tendríamos que
preguntarnos automáticamente quien va a
contestar mas probablemente a tales
cuestionarios: una mujer que tenga una
aventura o una que este razonablemente
satisfecha, una mujer desesperada por sus
niños o una que este contenta con ellos.
Las muestras autoseleccionadas no nos dan
mucha más información que una lista de
predicciones correctas hechas por alguien que
supuestamente tiene poderes psíquicos. A
menos que se tenga una lista completa de las
predicciones, o un subconjunto escogido al
azar, las predicciones correctas no significan
nada. Es seguro que algunas de ellas son
ciertas por
casualidad. Del mismo modo, a menos que la
muestra encuestada sea escogida al azar y no
autoseleccionada los resultados de la encuesta
no significaran gran cosa.
Además de ser consciente del problema de las
muestras autoseleccionadas, el consumidor con
cultura numérica debería comprender también
el problema a fin de los estudios
autoseleccionados. Si una compañía Y encarga
ocho estudios comparativos de las ventajas
relativas de su producto y el de la com-
petencia, y siete de los ocho señalan que el de
la competencia es mejor, no hay que ser muy
listo para adivinar cual de los estudios citara la
compañía Y en sus anuncios de televisión.
Como en los capítulos sobre las coincidencias y
HACIENDO ENCUESTAS FIABLES_______________________________________________________
356
la seudociencia, vemos que el deseo de filtrar y
poner énfasis en la información esta reñido con
el de obtener una muestra aleatoria. Para los
anuméricos especialmente, unas pocas
predicciones o coincidencias vividas tienen a
menudo mas peso que una evidencia
estadística que, aunque menos impresionante,
es mas concluyente.
Por todo ello, no comprendo por que tan
frecuentemente se llama encuesta a una
colección de perfiles íntimos o de historias
personales. Si se hace bien, tal colección es
atractiva (a pesar de que pueda ser menos
convincente) que la típica encuesta, y pierde
buena parte de su valor si se la envuelve en la
mortaja de un sondeo científico.
OBTENIENDO INFORMACIÓN PERSONAL
La madre del cordero de la estadística esta en
deducir información sobre una población
grande a partir de las características de una
muestra pequeña seleccionada al azar. Todas
las técnicas empleadas desee la inducción
enumerativa de Francis Bacon hasta las teorías
del contraste de hipótesis y del diseño expe-
rimental de Karl Pearson y R.A. Fisher, padres
fundadores de la estadística moderna-
dependen de esta (ahora) evidente
perspicacia. Siguen a continuación varias
maneras de obtener información.
La primera de ellas, que quizá cobrara cada
vez mayor importancia en una era inquisitiva
que sin embargo proclama el valor de la
intimidad, permite obtener información
delicada de un grupo sin comprometer la
intimidad de ninguno de sus miembros.
Supongamos que tenemos un grupo grande de
personas y queremos descubrir que porcentaje
de ellas ha mantenido cierto tipo de relación
sexual, con objeto de determinar que prácticas
llevan al SIDA con mayor probabilidad.
¿Que podemos hacer? Se pide al encuestado
que tome una moneda del bolsillo o del
monedero y que la lance al aire. Sin dejar que
nadie vea el resultado, ha de mirar si ha salido
cara o cruz. Si ha sido cara, ha de contestar
con sinceridad a la pregunta: ¿Ha mantenido
tal relación sexual, si o no? Y si sale cruz,
simplemente ha de escribir si. Así pues, una
respuesta si puede significar dos cosas, una
totalmente inocua (que ha salido cruz) y la
otra potencialmente embarazosa (haber
mantenido esa relación sexual). Como el
experimentador no puede saber que significa el
si es de esperar que los encuestados sean
sinceros.
Supongamos que de 1.000 respuestas, 620
son afirmativas. ¿Que nos dice esto acerca del
porcentaje de personas que han mantenido la
relación sexual? Aproximadamente 500 de los
1.000 encuestados habrán escrito si porque es
ha salido cruz. Quedan pues 120 personas que
han contestado si de entre las 500 que
contestaron con sinceridad a la pregunta
(aquellas a las que les salio cara). Por tanto, la
estimación del porcentaje de personas que han
mantenido esa relación sexual es el 24 por
ciento (120/500).
El método admite mas refinamientos que
pueden servir para conocer más detalles, por
ejemplo cuantas veces se ha tenido la relación
sexual. También admite algunas variantes que
se pueden realizar de modo informal, y podría
servir a una agencia de espionaje para calcular
el numero de disidentes de cierta región, o a
una agencia publicitaria para estimar el
mercado de un producto cuyo atractivo la
gente probablemente negara. Los datos en
bruto para los cálculos se pueden obtener de
fuentes públicas y, trabajadas con-
venientemente pueden llevar a conclusiones
sorprendentes.
Otra manera un tanto poco común de obtener
información es la que se conoce como método
de pescar-repescar. Supongamos que
HACIENDO ENCUESTAS FIABLES_______________________________________________________
357
queremos saber cuantos peces hay en cierto
lago. Capturamos cien, los marcamos y los
volvemos a soltar. Dejarnos transcurrir un
tiempo para que se dispersen por el lago,
volvemos a pescar otros cien peces y miramos
que fracción de ellos están marcados.
Si los peces marcados son ocho, una
estimación razonable es que el 8 por ciento de
los peces de todo el lago están marcados. Y
como este 8 por ciento lo forman los cien
peces que pescamos y marcarnos la primera
vez, obtendremos el numero de peces del lago
resolviendo la siguiente regla de tres: 8 (peces
marcados de la segunda muestra) es a 100 (el
numero de peces de la segunda muestra) igual
que 100 (el numero total de peces marcados)
es a N (el numero total de peces del lago). N
es, aproximadamente, 1.250.
Hay que tener cuidado, naturalmente, de que
el pez marcado no muera por el hecho de
haber sido marcado, de que se distribuyan mas
o menos uniformemente por el lago, de que los
marcados no sean solo los mas lentos o los
mas simplones de los peces, etc. Sin embargo,
como manera de obtener una estimación
aproximada, la pesca-repesca es un método
eficiente, y más general de lo que pudiera
sugerir el ejemplo de los peces.
Los análisis estadísticos de obras cuya autoría
esta en disputa (los libros de la Biblia, The
Federalist Papers [((Documentos
federalistas»], etc.) dependen también de
métodos ingeniosos similares para recoger
datos de fuentes que no están dispuestas a
colaborar (porque han muerto).
DOS RESULTADOS TEÓRICOS
Buena parte del atractivo de la teoría de la
probabilidad reside en la inmediatez y en el
interés intuitivo de sus problemas prácticos y
de los principios sencillos que nos permiten
resolver muchos de ellos. Sin embargo, los dos
resultados teóricos siguientes tienen una
importancia tan fundamental que pecaría de
negligencia si no dijera nada de ellos.
El primero es la ley de los grandes números,
uno de los teoremas más importantes de la
teoría de la probabilidad, a menudo mal
entendido. Es un teorema que a veces se
invoca para justificar todo tipo de conclusiones
extrañas. Dice sencillamente que, a la larga, la
diferencia entre la probabilidad de cierto
suceso y la frecuencia relativa con la que este
ocurre tiende a cero.
En el caso especial de una moneda no trucada,
la ley de los grandes números enunciada por
primera vez por Jean Bernoulli en 1713, dice
que la diferencia entre 1/2 v el cociente del
numero total de caras dividido por el numero
de tiradas se aproxima a cero tanto cot-no
queramos, a medida que aumenta el numero
de tiradas. Recuerdese, sin embargo, de
cuando hablábamos sobre los perdedores y las
monedas sin truco del Capitulo 2, que esto no
significa que la diferencia entre el número total
de caras y cruces haya de disminuir a medida
que aumenta el número de tiradas:
generalmente sucede todo lo contrario. Las
monedas sin truco se comportan bien en
sentido relativo pero no en sentido absoluto. Y,
contrariamente a lo que se pueda decir en
numerosas conversaciones de café, la ley de
los grandes números no implica la falacia del
jugador: que después de una larga serie de
cruces es mi s probable que salga cara.
Entre otras cosas, esta ley justifica la creencia
del experimentador de que la media de un
conjunto de mediciones de la misma cantidad
ha de aproximarse al verdadero valor de la
misma a medida que aumentamos el número
de mediciones. También proporciona una base
racional a la observación lógica de que si se
lanza un dado N veces, la probabilidad de que
el numero de veces que sale 5 difiera de N/6
es menor cuanto mayor es N.
HACIENDO ENCUESTAS FIABLES_______________________________________________________
358
Resumiendo: la ley de los grandes números
proporciona una base teórica para la idea
natural de que una probabilidad teórica es una
especie de guía para el mundo real, para lo
que realmente ocurre.
Según parece, la curva normal o campana
describe muchos fenómenos naturales. ¿Por
que? Otro resultado muy importante de la
teoría de la probabilidad conocida como
teorema del límite central, nos da la
explicación teórica del predominio de esta
distribución gaussiana normal (que debe su
nombre a Carl Friedrich Gauss, uno de los más
grandes matemáticos del siglo diecinueve y de
todos los tiempos). El teorema del límite
central dice que la suma o la media de un gran
conjunto de mediciones siguen una curva
normal, incluso en el caso de que cada
medición por separado no lo haga. ¿Qué
significa esto?
Imaginemos una fabrica que produzca pilas
para juguetes, y supongamos que esta dirigida
por un ingeniero sádico que asegura que
aproximadamente el 30 por ciento de las pilas
se agota en solo cinco minutos, y que el 70 por
ciento restante tiene una duración de unas mil
horas. Esta claro que la distribución de las
vidas de estas bacterias no es descrita por una
curva normal en forma de campana, sino más
bien por una curva en U con dos picos, uno en
los cinco minutos y el otro en las mil horas.
Supongamos ahora que estas pilas salen de la
cadena de montaje ordenadas al azar y se
empaquetan en cajas de treinta y seis. Si
decidimos determinar la vida media de las pilas
de una caja, encontraremos que nos da
aproximadamente 700; pongamos 709. Si
hacemos lo mismo con las pilas de otra caja de
treinta y seis, veremos que da otra vez
aproximadamente 700, quizá 687. De hecho, si
examinamos muchas de estas cajas, la media
de las medias será próxima a 700, y lo que es
mas impresionante, la distribución de dichas
medias será aproximadamente normal (en
forma de campana), con la proporción justa de
paquetes con vidas medias entre 680 y 700, o
entre 700 y 720, etcétera.
El teorema del limite central dice que, bajo una
amplia variedad de circunstancias, siempre
ocurre esto: las medias y las sumas de
cantidades que no están distribuidas
normalmente siguen sin embargo una
distribución normal.
La distribución normal también aparece en los
procesos de medida. Aquí el teorema nos
proporciona la justificación teórica del hecho de
que las medidas de cualquier cantidad tienden
a seguir una <<curva de error» normal en
forma de campana centrada en el verdadero
valor de la cantidad que estamos midiendo.
Entre otras cantidades que tienden a seguir
una distribución normal tenemos: los pesos y
estaturas para una edad determinada, el
consumo de agua de una ciudad en un día
dado, el grosor de unas piezas mecanizadas, el
CI (independientemente de lo que este
signifique), el n6mero de ingresos en un gran
hospital en un día dado, ]as distancias de los
dardos al blanco, el tamaño de las hojas, el
tamaño del pecho, o la cantidad de refresco
servida por una maquina de venta automática.
Todas estas cantidades pueden considerarse
como suma o media de muchos factores
(genéticos, físicos, o sociales) y por tanto el
teorema del limite central explica su
distribución normal.
Resumiendo: Las medias (o las sumas) de
cantidades tienden a seguir una distribución
normal, aun cuando las cantidades de las que
son media (o soma) no la sigan.
CORRELACIÓN Y CAUSALIDAD
Correlación y causalidad son dos palabras con
significados completamente distintos, pero los
anumericos tienen una tendencia muy fuerte a
HACIENDO ENCUESTAS FIABLES_______________________________________________________
359
confundirlas. Es muy frecuente que dos
cantidades estén correlacionadas sin que una
sea la causa de la otra.
Un modo bastante común de que esto pueda
ocurrir es que los cambios en ambas
cantidades sean consecuencia de un tercer
factor. Tenemos un ejemplo, bien conocido en
la correlación moderada entre el consumo de
leche y la incidencia del cáncer en distintas
sociedades. La explicación de la correlación
probablemente este en la prosperidad relativa
de dichas sociedades, que comporte tanto un
mayor consumo de leche como mas cáncer
debido a una mayor longevidad. De hecho,
cualquier practica saludable, coma beber leche,
que tenga una correlación positiva con la
longevidad probablemente la tenga también)
con la incidencia del cáncer.
En varias regiones del país hay una pequeña
correlación negativa entre las defunciones por
cada mil habitantes y las tasas de divorcio por
cada cien matrimonios. A mas divorcio, menos
mortalidad. Aquí también un tercer factor, la
distribución de edad de las distintas regiones,
nos puede apuntar una explicación. Las parejas
casadas de personas mayores tienen una
probabilidad menor de divorciarse y una
probabilidad mayor de morir que las parejas de
jóvenes. De hecho, como el divorcio es una
experiencia tan desgarradora y produce tanta
tensión nerviosa, probablemente comporte un
aumento del riesgo de muerte, con lo que en
realidad ocurre algo completamente distinto de
lo sugerido por esa correlación engañosa. Otro
ejemplo en el que correlación se ha confundido
con causa: en las islas Nuevas Hebridas, los
piojos eran considerados causa de buena
salud. Como muchas otras observaciones
populares, esta se apoyaba en evidencias
sólidas. Cuando la gente se ponía enferma, le
subía la temperatura y esto hacia que los
piojos buscaran un huésped más acogedor. Los
piojos y la buena salud se marchaban con la
llegada de la fiebre. Análogamente, la
correlación entre la calidad de los programas
de guarderías de un estado y la tasa de
denuncias de abusos sexuales infantiles no es
ciertamente causal, sino que simplemente
indica que cuanto mejor es la supervisión, mas
diligentemente se denuncian unos incidentes
que indudablemente ocurren.
Algunas veces dos cantidades correlacionadas
tienen también una relación causal, pero esta
es enmascarada por otros factores extraños.
Una correlación negativa -por ejemplo, entre el
grado académico alcanzado por una persona
(licenciatura, master o doctorado) y su primer
salario- se puede entender si se tiene en
cuenta el factor enmascarante de las distintas
clases de empleos. Es más probable que un
doctor acepte un empleo académico
relativamente mal pagado que personas con
una licenciatura o un master, que seguramente
irán a trabajar a la industria. De ahí que un
grado académico más alto y este último factor
expliquen que el primer salario sea inferior.
Fumar es, sin la menor duda, una causa
importante que contribuye al cáncer y a las
enfermedades de pulmón y corazón, pero hay
factores encubridores relacionados con el modo
de vida y el entorno que enmascararon
parcialmente este hecho durante algunos años.
Hay una pequeña correlación entre el hecho de
que una mujer sea soltera y el haber ido a la
universidad. Sin embargo, hay muchos
factores enmascarantes, y no esta claro-si hay
alguna relación causal entre ambos fenómenos
y, de haberla, cual de ellos es la causa y cual
el efecto. Podría ser que la tendencia de una
mujer a la «soltería o sea una causa que
contribuye a que vaya a la universidad, en vez
de lo contrario. A propósito, en cierta ocasión
Newsweek publico que las probabilidades que
tenia de casarse una mujer universitaria,
soltera y con mas de treinta y cinco años, eran
menores que las de ser asesinada por un
HACIENDO ENCUESTAS FIABLES_______________________________________________________
360
terrorista. Probablemente la observación era
una hipérbole intencionada, pero la he oído
también citada como una realidad por algunas
personas que trabajan en los medios
informativos. Si existiera el premio al
Anumerismo del ano», la afirmación anterior
seria una firme candidata.
Finalmente, hay muchas correlaciones
puramente accidentales. Los estudios que dan
pequeñas correlaciones no nulas, lo que en
realidad están dando en muchos casos son
fluctuaciones del azar, y son poco más o
menos tan significativas. Como el hecho de
haber lanzado una moneda cincuenta veces y
que no hayan salido exactamente veinticinco
caras. Gran parte de la investigación que se
hace en el campo de las ciencias sociales no
es, en realidad, más que una recopilación
estupida de datos irrelevantes de este estilo. Si
la propiedad X (por ejemplo, el sentido del
humor) se define así (numero de risas
provocadas por una serie de chistes) y la
propiedad Y (por ejemplo, el amor propio) se
define asa (numero de respuestas afirmativas
a una lista de rasgos positivos), entonces el
coeficiente de correlación entre el sentido del
humor v el amor propio es 0,217. Paparruchas.
La regresión lineal, que tiene por objeto
relacionar los valores de la cantidad X con Los
de la cantidad Y, es una herramienta muy
importante en estadística, pero frecuentemente
se emplea mal.
Demasiado a menudo se obtienen resultados
como los vistos en los ejemplos anteriores o
algo por el estilo de Y = 2,3 X + R, donde R es
una cantidad aleatoria con una variabilidad tan
grande corno para abrumar la supuesta
relación entre X e Y.
Tales estudios defectuosos constituyen
frecuentemente la base de los tests
psicotécnicos para la prospección de empleo,
las tarifas de las pólizas de seguros o el interés
de up crédito. Uno puede ser un buen
empleado, merecer primas bajas o ser digno
de un crédito a bajo interés, pero si de algún
modo se nota que no hay correlativos, lo
tendra también difícil.
Bena Ruiz, Julián (1 999), "Sistemas de datos en el
currículo", en Uno. Revista de didáctica de las
matemáticas, num. 20, abril, España (s/ed.), pp. 9-
24.
SISTEMAS DE DATOS EN EL CURRÍCULO
El articulo trata sobre las primeras fases de la
investigación estadística en la escuela
enfatizando su importancia educativa y so
dimensión matemático. Se hace un recorrido
par diferentes contenidos matemáticos
relacionados con el tratamiento de la
información, presentando la elaboración y use
de sistemas de datos coma uno estrategia
metodológica e interdisciplinar. Los de
reflexión, opiniones y sugerencias van dirigidas
a abordar desde las matemáticas escolares a la
obtención, organización y utilización de datos a
como parte diferenciora del currículo, sobre
todo aquellas experiencias que no tienen
cabida en lo que habitualmente llamamos libro
de texto. No se abogo par un estudio especifico
pero se abordan los bases y sistemas de datos
como ejes integradores y transversales que
conectan diferentes contenidos y materias.
DATA SYSTEMS IN THE CURRICULUM
This article looks at the first stages in
statistical research in schools emphostsing the
educational importance and the mathematical
dimension of this. It reviews the different
mathematical contents related to the treatment
of information, presenting the elaboration and
use of data systems as a methodologicol and
interdisciplinary strategy. The areas of
HACIENDO ENCUESTAS FIABLES_______________________________________________________
361
reflection, opinion and suggestion ore aimed at
ithe obtaining, organising and use of do to-
from a school moths point of view as a special
port of the curriculum, specially these onus
that are not usually found in textbooks. The
study doesn't pretend to be specific but rather
it looks at the bases and data systems as
integrating axis that connect different contents
and materials.
La introducción del estilo heurístico haría tan largos
los libros de texto que nunca podrían leerse hasta el
final.
La respuesta a este argumento pedestre es
intentémoslo.
I.Lakatos
LOS DATOS ELEMENTALES BÁSICOS DE
INFORMACIÓN
Me gustaría empezar distinguiendo algunos
significados del termino información*. No estoy
de acuerdo con quienes piensan que todo es
información. Una cosa parece clara: la
información es un producto humano y la
podemos situar dentro de lo artificial. El mundo
natural, en todas sus manifestaciones y sus
seres no contiene información. Es el hombre al
discriminar relacionar, abstraer y generalizar
en sus observaciones y sus contactos
sensoriales con el mundo exterior, quien
genera conocimientos sobre ellos y lo expresa
o registra a través de informaciones que le
sirven para comunicarse con los demos. Así
pues, los procesos de generación de
información también están vinculados a los de
9 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
conceptualización y discriminación. De esta
forma surgen las primeras informaciones o
datos de los objetos: su nombre, tamaño,
color... A medida que la inteligencia del niño se
desarrolla aumentan las discriminaciones y
categorías con las que clasifica y designa los
objetos que percibe. La información, por tanto,
esta llegada al propio proceso de conocimiento
en el que están presentes la discriminación y
generalización.
7ampoco es admisible que toda producción
lingüística (oral o escrita) sea información. Por
ejemplo, una guía telefónica y un libro de
poemas. Casi todo lo que contiene la guía de
teléfonos es información, en cambio el libro de
poemas prácticamente no tiene información, el
contenido de un poema no es de tipo
informativo. En mi opinión, la información es
además un producto elaborado con una
intención concreta. La guía de teléfonos se ha
hecho con intención de informar mientras que
el poeta no se ha preocupado de informar
aunque si comunicar, ¡que no es lo mismo!
Cabe también otra interpretación: de un
poema podemos sacar información: el tipo de
rima, el tipo de estrofas, el numero de silabas
de cada verso..., pero estos datos no forman
parte del contenido del poema.
En resumen, la información en sus diferentes
soportes es un producto de la inteligencia
humana elaborado con la intención concreta
de dar a conocer una característica, hecho o
circunstancia relativa a un individuo,
acontecimiento o circunstancia. El ejemplo mas
claro de Información lo constituyen los datos
(numéricos o no). El termino dato no figura
habitualmente en los diccionarios de
matemáticas. En aquellos donde aparece tiene
el significado de producto o resultado de una
observación o medición que se realiza sobre un
objeto de estudio que puede ser concreto,
abstracto, o referirse a un hecho, fenómeno o
acontecimiento. Los datos son elementos
básicos de información y corresponden siempre
a atributos o características de determinados
individuos a los que habitualmente nos
HACIENDO ENCUESTAS FIABLES_______________________________________________________
362
referimos con el nombre de unidades o ele-
mentos de una población.
Una de las características de la era de la
información y la comunicación que vive nuestra
sociedad occidental es el vertiginoso ritmo de
producción y difusión de información. Incluso
podemos hablar de invasión informativa.
Continuamente nos llega más información de la
que podemos asimilar. A diario tenemos que
manejar y procesar con rapidez multitud de
datos para tomar decisiones, sin embargo, no
siempre disponemos de las herramientas y
conocimientos necesarios para conseguir
determinadas informaciones de interés o tomar
de decisiones. Para comprarme un ordenador,
un equipo de música o un coche utilizo los
datos que el vendedor me ofrece sobre el
producto, o tengo la suficiente capacidad para
definir, a partir de los motivos de la compra,
las cualidades que no figuran en la publicidad,
busco los datos que me faltan y decido en
consecuencia?
10 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
La adquisición y asimilación de los elementos
de nuestra cultura pasa también por una
formación a lo largo de todas las etapas
educativas en el tratamiento de la información
y so manejo mediante nuevas tecnologías,
especialmente en las habilidades para la
definición de los objetivos de un estudio y la
elaboración , organización y tratamiento do
datos. Es evidente que la mejor herramienta
para la supervivencia del ciudadano del futuro
es una mente bien organizada que disponga de
métodos para generar, representar,
almacenar, transmitir y acceder a la
información.
Estas destrezas son imprescindibles para
desenvolverse ante la cantidad de información
y las diversas y variadas formas en que se pre-
senta y se presentara. La relevancia de estas
capacidades nos lleva también a los
educadores a incluirlas dentro de las metas del
currículo. Principalmente considerar como
objetivo que ayude a comprender el mundo
actual, que los alumnos sepan cómo acceder,
comprender, analizar e interpretar la
información. En la educación escolar (desde la
escuela infantil hasta la universidad) alcanzar
esta meta es algo gradual, comienza pero
nunca acaba, pues siempre podemos acceder a
formas mas complejas de analizar y dar
significado a la información. Estas ideas se
ponen de manifiesto en los decretos de
enseñanza derivados de la LOGSE: sin
embargo, se necesitan respuestas concretas en
cada área en forma de actividades que pongan
en juego estas habilidades. Si no se ofrecen
situaciones de aprendizaje apropiadas desde la
escuela, no se aprenderán por arte de magia.
Antes de definir posibles actividades donde los
alumnos y alumnas planteen preguntas y
resuelvan problemas que se apoyen en la
observación, búsqueda, selección, recogida,
organización, registro, reducción e
interpretación de datos múltiples y diferentes,
conviene acotar previamente líneas de
intervención conjunta para contribuir desde
las matemáticas a que los estudiantes tengan
capacidad para desenvolverse con soltura ante
esta progresiva contaminación informativa en
la que vivimos inmersos.
Hace ocho o diez años, de acuerdo con los
programas vigentes, la mayoría de ejercicios
de los libros de texto de matemáticas
relacionados con el tratamiento de la
información, se consideraban principalmente
dentro de la estadística, a partir de datos o
tablas dados de antemano. Casi todo se
reducía al estudio de variables cuantitativas y
al cálculo e interpretación de parámetros:
media, moda, desviación típica, etc. dejando
HACIENDO ENCUESTAS FIABLES_______________________________________________________
363
de lado cuestiones básicas previas.
11 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 • abril 1999
De acuerdo con los actuales decretos de
enseñanza y con distintos informes sobre
educación matemática, es necesario incorporar
nuevos contenidos propios: procesos de
análisis y formulación critica de preguntas
referidas a poblaciones y colectivos, definición
de las variables, de las unidades de estudio,
consulta de fuentes, técnicas y destrezas de
extracción de información, búsquedas,
interacción con sistemas de datos, elaboración
de bases de datos y so utilización critica en
tareas de recuento y resumen de datos.
Se trata de contenidos integrados en los
nuevos currículos de educación secundaria
dentro del bloque interpretación,
representación y tratamiento de la información
entre los que se encuentran, además de los
citados, otras destrezas y contenidos útiles:
recogida de datos, los diseños y planificaciones
de recogida de información relevante en fun-
ción del tipo de fuente, la valoración de
ventajas y peligros de los sistemas de datos, y
un largo etcétera que constituiría un núcleo de
destrezas y cualidades previas a (o integradas
en) la denominada formación estadística, y que
serán los cimientos de esa formación.
Tradicionalmente el cálculo -aritmético,
algebraico, vectorial, diferencial o integral- ha
demandado coordinaciones entre los
profesores de matemáticas y de otras
materias, principalmente tos de física. De
forma similar los contenidos de estadística
reclaman el contacto entre las matemáticas y
otras áreas, en especial las ciencias de la
naturaleza y las ciencias sociales, que también
incorporan sus métodos a la resolución de
múltiples problemas y comparten diversos
contenidos, en su mayoría técnicas
instrumentales no exclusivos de las
matemáticas. Parece obvio que la formación en
esta parcela es interdisciplinar y compete
directamente a las áreas y materias que
utilizan la estadística en la resolución de
problemas. Estos saberes metodológicos o
procedimentales se adquieren participando
activamente en las distintas fases y etapas. Por
este motivo la enseñanza de la estadística
debería ser enfocada basándose en trabajos
que impliquen a los alumnos y alumnas en el
proceso completo: desde la formulación y
refinamiento de preguntas, la elaboración de
instrumentos de recogida de datos, hasta la
elaboración de tablas y resúmenes, la
interpretación de parámetros y la comunicación
de los resultados. Sin olvidar la tecnología que
también tiene reservado so papel dentro de las
actividades cuando sea apropiada.
¿En que aspectos concretos las diferentes
áreas deben contribuir a la formación
estadística de los estudiantes? Ante una
cuestión tan importante como la definición de
objetivos y la selección de contenidos con
vistas a que el alumnado estudie métodos que
le faciliten el acceso racional a la información y
le permitan interpretarlo adecuadamente, las
matemáticas están obligadas a dar una
respuesta que contribuya en un gran objetivo
general de la educación básica.
12 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Es un error pensar que, únicamente teniendo
en cuenta aisladamente los objetivos de cada
área, de manera milagrosa se consiguen metas
generales como esta. Reconozco que el
problema no tiene fácil solución pero observo
un camino plausible en el dialogo
interdisciplinar, y so respuesta expresada en el
proyecto curricular. Por ejemplo, si el profesor
o profesora de matemáticas se esfuerza en sus
HACIENDO ENCUESTAS FIABLES_______________________________________________________
364
clases por demostrar a los estudiantes las
ventajas de disponer de técnicas de análisis de
datos en el estudio de las ciencias sociales y el
profesor de sociales no le dan importancia a
estos métodos, o al contrario, si desde las
sociales se destaca el interés de las
matemáticas que están presentes en
investigaciones de las ciencias humanas y el
profesorado de matemáticas ni los menciona
en sus clases, el alumnado terminara pensando
que las afirmaciones de algunos de sus
profesores no eran muy sinceras.
Para precisar y concretar un poco mas esta
parte del currículo presente en los objetivos
generales y en la mayoría de áreas de la
educación obligatoria, voy a referirme a los
sistemas de datos como contexto donde llevar
a cabo la acción didáctica y punto de referencia
para dirigir las intervenciones, con una
presencia muy especifica de las matemáticas.
Independientemente del número de áreas
interesadas en abordar conjuntamente estas
técnicas, la organización de datos se integraría
dentro de las matemáticas a través de los
siguientes contenidos:
Preguntas y problemas que se
resuelven con un estudio estadístico.
Asignación de atributos.
Determinación de variables y
categorías.
Búsqueda de información. Consulta de
fuentes.
Estrategias de recuento. Tabulación.
Organización y estructuración de
datos. Tablas de datos. Bases de
datos.
Ordenación y clasificación.
Diseño de encuestas. Elaboración de
cuestionarios.
Obtención de datos de forma
individual y colectiva utilizando
diferentes fuentes y recursos.
Organización y estructuración de
datos utilizando diferentes es-
trategias de recuento.
Usos a interpretación critica del
lenguaje de las tablas y las graficas
Estadisticas.
Elección, cálculo e interpretación de
parámetros centrales y de dispersión.
Valoración de la incidencia de medios
tecnológicos en el tratamiento y
representación de la información.
Investigación de fenómenos aleatorios
y relaciones entre magnitudes,
formulación y comprobación de
conjeturas.
Utilización de la probabilidad para
detectar errores en la interpretación
del azar y para tomar decisiones en
distintas situaciones.
Interpretación de datos relativos a
una muestra estadística teniendo en
cuenta su representatividad.
13 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
En la enseñanza secundaria, la estadística
empieza cuando están definidas las variables,
la población y tenemos recogidos los datos. De
este modo, el aprendiz no participa en las
fases más importantes: la definición del
problema, delimitación de la población,
determinación de variables, recogida de datos
y registro de los mismos. Desde la educación
estadística se deberían considerar actividades
que partan de problemas y preguntas. Muchas
razones hay para defender este argumento.
Unas son de tipo normativo: constituyen
contenidos de los nuevos currículos de la
educación obligatoria. Y otras son de sentido
común: recientemente, determinados
especialistas en estadística están reconociendo
que la gran dificultad de los investigadores
universitarios -muchos de ellos licenciados en
HACIENDO ENCUESTAS FIABLES_______________________________________________________
365
matemáticas- es precisamente definir de forma
adecuada sus unidades de análisis y variables.
He aquí otro argumento que reclama el
encuentro, desde los primeros años, de los
alumnos con los sistemas de datos reales como
comienzo de la educación estadística.
Asumir estas premisas supone establecer
metodologías apropiadas, nuevas formas de
organizar los contenidos y la propia clase. Mi
experiencia, Las discusiones con colegas y las
lecturas sobre el tema me llevan a crecer
firmemente que la realización de
investigaciones relacionadas con la estadística
por parte de los estudiantes, son fructíferas en
la medida que estén conectadas con sus
intereses y el entorno donde viven y que
recorran todas las fases, desde la definición
del problema hasta la redacción y
presentación de conclusiones. Y considero que
son más viables a través de proyectos de
trabajo.
Proyectos para la vida y par la vida que surjan
de autenticas necesidades y mantengan un
dialogo con el media. El método de proyectos
es una técnica clásica, introducida en EE.UU.
durante 10 años veinte par seguidores de J.
Dewey, que podemos encontrar en cualquier
manual de pedagogía. A pesar de sus claras
ventajas para el aprendizaje, tiene escasa
acogida en España -al menos que yo sepa- por
parte de los profesores de matemáticas de
secundaria.
De todos modos, siempre cabe la posibilidad
de diseñar unidades didácticas donde tengan
presencia todos los pasos de una investigación
utilizando colecciones y ficheros como
sustitutos didácticos artificiales de una
población a estudiar, distinguiendo, eso si, las
unidades de estudio de sus representaciones
mediante las fichas.
14 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Independientemente de cómo se trabaje, con o
sin proyectos, y de dónde se trabaje, dentro o
fuera del aula, las primeras fases de una inves-
tigación o Indagación que utilice técnicas
estadísticas se nutre de conocimientos
instrumentales básicos y conceptos
matemáticos y a la par incide en su desarrollo.
De ellos se ocupan los siguientes apartados del
artículo.
En los procesos de clasificación se definen
variables, se generan datos y se utilizan
categorías en un sentido lógico y excluyente. El
trabajo y las actividades de clasificación están
presentes en todas las disciplinas y facetas de
la vida. Cuando en clase de matemáticas
detectamos deficiencias en este ámbito, dentro
de la formación del alumnado, cuando
percibimos que estas técnicas elementales de
clasificación no se han trabajado en la medida
de lo deseable, sentimos la obligación de favo-
recer el razonamiento lógico a través de la
clasificación -o relaciones de equivalencia que
vienen a ser lo mismo- y reconocemos en ellas
el verdadero punto de partida. Desde las
matemáticas, antes de entrar de lleno a
estudiar temas propios de otras materias
(como ciencias de la naturaleza o sociales), es
menos complicado trabajar estos contenidos
mediante situaciones ideadas ad hoc que serán
mas o menos interdisciplinares en función de
las relaciones e intereses del profesorado de
cada centro. De entre las múltiples actividades
que podríamos introducir citare dos ejemplos:
juegos lógicos y una dinámica de grupos.
JUEGOS LÓGICOS
Se trata de adaptar ciertas aplicaciones de los
bloques lógicos de Dienes a cualquier nivel
educativo. Los bloques lógicos más conocido en
educación primaria son una colección de 48
objetos físicos -figuras de madera con cuatro
HACIENDO ENCUESTAS FIABLES_______________________________________________________
366
atributos cada uno: nombre (cuadrado, circulo,
rectángulo, triángulo); color (rojo, azul,
amarillo); tamaño (grande, pequeño) y grosor
(grueso, fino). No pretendo destacar las
grandes ventajas didácticas de este material -
poco se puede añadir sobre los bloques lógicos
que no este escrito- únicamente deseo
enfatizar su potencialidad en el desarrollo de
capacidades de observación activa, de
clasificación libre o dirigida, de extracción de
datos, conocimientos a partir de los que
edificar el resto de habilidades a las que nos
venimos refiriendo como parte del tratamiento
de la información.
15 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Los juegos de Dienes no solo constituyen, en la
escuela infantil o primaria, los primeros pasos
en la matemática, también debemos caer en la
cuenta de que son además los inicios en el
análisis de datos. Desde el punto de vista del
uso inteligente de características y
clasificaciones de individuos y el manejo de
datos en el razonamiento, convendría
recuperar los juegos lógicos en la escuela. Si
están en desuso en parte es debido al enfoque
ortodoxo de determinadas propuestas que los
asociaron al formalismo y la teoría de
conjuntos y que hoy se ha desterrado del
currículo.
Otra manera de reconsiderar los trabajos de
Dienes consiste en enfocarlos bajo
perspectivas dirigidas a investigar sobre un
colectivo o población, mientras se trabaja el
razonamiento lógico,
sin recurrir necesariamente a la simbología y
representaciones conjuntistas. Se trata de
extender y generalizar las ideas principales,
diseñando, construyendo u adaptando
materiales similares en forma de colecciones
finitas de objetos, fichas o tarjetas, para llevar
también los juegos lógicos a las etapas de
secundaria.
La colección P, compuesta por un numero fijo y
no muy elevado -30 o 40- de unidades
(individuos) cada una de las cuales muestra
una serie de cualidades, atributos que dejan
ver, variables cualitativas o cuantitativas,
directamente o por comparación con el resto.
Para los primeros cursos de primaria podemos
inventar poblaciones artificiales sencillas, o
incluso usar juegos comercializados, cuyos
individuos sean como los de la figura 1.
En el segundo ciclo de primaria se pueden
extender a conjuntos procedentes del entorno
próximo -una colección de animales, plantas,
edificios, pueblos, obras de arte... En la ESO la
complejidad y abstracción de los colectivos
aumentaría pudiendo estudiarse colectivos de
las propias matemáticas recurriendo a las
fracciones o una colección de polígonos o
poliedros... Algunos profesores proponen la
utilización de colecciones de números naturales
para trabajar la factorización.
Muchos juegos se basan en disputas entre dos
jugadores o equipos basadas en preguntas que
solo pueden ser contestadas con si o no.
Cuando un jugador hace una pregunta que el
rival puede contestar, necesariamente esta
haciendo referencia a un variable lógica, o
dicotomica -la que solo admite dos estados.
HACIENDO ENCUESTAS FIABLES_______________________________________________________
367
Los jugadores, por tanto, están obligados a
observar detenidamente a los individuos como
elementos del colectivo, y a establecer
relaciones y comparaciones que conducirán a
establecer características, variables, categorías
y a generar información que usara para
formular las preguntas a su rival.
Una gran parte del interés formativo en el ma-
nejo de variables dicotómicas radica en su
presencia creciente en informaciones dirigidas
al consumidor. En la figura 2 tenemos un
ejemplo de estructura informativa basada en
este tipo de variables. Se trata de una etiqueta
de características técnicas que los
hipermercados acostumbran a colocar en los
productos de determinadas secciones.
DINÁMICA DE GRUPOS
En multitud de ocasiones, para distribuir los
alumnos en pequeños grupos de trabajo
necesitamos unos criterios. Relacionar estos
criterios con las clasificaciones es el pretexto y
la intención de esta actividad. Se trata de una
dinámica de grupos que va aplicar a un
profesor norteamericano.
El objetivo principal es que se trabaje la
clasificación libre de manera cooperativa y
consensuada. Los criterios de clasificación que
los alumnos deciden son la base para distribuir
a los propios estudiantes en pequeños grupos
de trabajo. Consiste en repartir a cada alumno
un objeto o ficha y pedirles que busquen a los
compañeros que tengan una ficha u objeto con
algo en común con el que se les ha entregado.
Por ejemplo, en un grupo de educación infantil
repartimos a cada chico o chica una figura. Se
pueden agrupar por el color (tres grupos), por
el grosor (dos grupos), por la forma (cuatro
grupos). Otro ejemplo, repartiendo en un
grupo de ESO, tarjetas con una ecuación, si el
gran grupo decide realizar agrupaciones
atendiendo a tenor la misma solución, es
preciso que previamente, en los diferentes
subgrupos espontáneos, se resuelvan y
compartan tantas ecuaciones como alumnos
participen de la discusión. Un ultimo ejemplo,
si en un grupo de primero de bachillerato de
ciencias o tecnología, dentro del estudio de la
analítica de la recta, repartimos a cada alumno
una tarjeta con la ecuación de un recta los
agrupamientos pueden producirse según sea el
tipo de ecuación (parametricas, continua,
implícita...), Si las rectas tienen la misma
dirección (pendiente), si las rectas coinciden en
un mismo punto, etc. En el intercambio de
información se comparten y repasan todos los
contenidos relacionados con el tema.
17 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Si bien hemos conectado los inicios del análisis
de datos con procesos de clasificación, no
podemos olvidar que los problemas
estadísticos propiamente dichos empiezan con
un problema o pregunta dirigida hacia un
colectivo. El interés que despierte el contenido
de la pregunta, la forma en que esta redactada
y los términos que en ella se utilicen son
determinantes a la hora de elegir las variables
que intervienen en el estudio.
Por ejemplo, si preguntamos por las
preferencias musicales de los alumnos estamos
haciendo referencia a una variable concreta, la
preferencia musical y a unas unidades de
HACIENDO ENCUESTAS FIABLES_______________________________________________________
368
análisis, los alumnos del instituto. Si
preguntamos por el numero de alumnos
ecologistas en los centros de la provincia, el
numero de ecologistas será la variable y los
centros de la provincia las unidades. De
manera análoga a los datos se entiende la
noción de variable, en un sentido más amplio
que el numérico, como una propiedad de un
individuo susceptible de adoptar diferentes
nombres o valores. La idea de variable incluye
las denominadas nominales (cualitativas) que
clasifican a los individuos y solo permite
relaciones de igualdad o desigualdad; un caso
particular de estas son las dicotomicas. Cuando
una variable clasifica y ordena a los individuos
recibe el nombre ordinal, por ejemplo una
fecha, una escala cualitativa como las
calificaciones escolares (insuficiente, suficiente,
bien notable y sobresaliente). Las variables
numéricas también conectan estas investiga-
ciones con los números, las magnitudes y las
medidas (muchas propiedades de los objetos
son magnitudes, longitud, peso, anchura...
cuando se había de un colectivo, tenemos una
ocasión para trabajar con magnitudes y cosas
como rapidez, y otras destrezas de las
poblaciones).
Antes de preponer al alumnado una
investigación o actividad, conviene plantear
¿como se decide lo que hay que conocer?
Tengamos presente que el punto de partida de
las verdaderas investigaciones es el
desconocimiento de un tema sobre el que
deseamos profundizar o fundamentar opiniones
y creencias.
Una vez situados son múltiples y diversos los
matices y posibles grados de aproximación. Por
ejemplo, si abordamos vía publicidad en los
periódicos y revista a, las unidades de análisis
pueden ser a los medios de comunicación
escrita o bien a los anuncios que aparecen en
ellos. Supongamos que interesan como
unidades de estudio alas revistas semanales y
mensuales de tirada nacional, ¿que atributos
conviene destacar en relación con nuestro
tema de interés? El tipo de revista, si es sema-
nal, si es especifica de algún sexo, el numero
de paginas, el numero de paginas completas
de publicidad, el numero de paginas completas
de publicidad dedicadas a una misma marca, el
numero de dobles paginas dedicadas a un
anuncio, el numero de tres paginas
consecutivas dedicadas a un anuncio, el
numero de anuncios, la porción total dedicada
a publicidad, etc.
18 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Cuando se analizan las unidades para recoger
los datos surgen nuevas dudas y hay que
volver a clarificar: ¿las paginas de moda se
consideran de publicidad?, ¿contamos también
como paginas los anexos u folletos
independientes que se incluyen?, etc.,
decisiones que hay que ir tomando y
consensuado para que la investigación sea
coherente.
De este modo los estudiantes llegan a toparse
con grandes sorpresas. Por ejemplo, en una
revista femenina de 220 páginas, un alumno
llego a contar 102 páginas de anuncios a toda
página, de las cuales había 5 dobles páginas, 3
triples y ¡hasta una cuádruple! Las
matemáticas, en este tipo de actividades,
ayudan a averiguar que determinados medios
de comunicación escrita contienen el mismo
numero de paginas de publicidad que de
información o que la mayoría de ejemplares
extra que las revistas regalan en verano o por
Navidad son en un 66% anuncios publicitarios,
o por que es cierto el dicho que en
determinadas cadenas de televisión
acostumbran a interrumpir los anuncios con
algún programa.
Cuando las variables proceden de preguntas, o
HACIENDO ENCUESTAS FIABLES_______________________________________________________
369
sea cuando los profesores preguntamos con la
intención de obtener variables Estadisticas
ocurren, como es lógico, otros fenómenos
curiosos. Pensamos que a una pregunta
corresponde una variable y resulta que no.
Resulta que surgen multitud de matices, de
posibilidades, de variables posibles... No es lo
mismo pensar en variables, llamémoslas
objetivas, como por ejemplo la fecha de
nacimiento, estatura o peso de una persona
que sus gustos, aficiones o satisfacción. Si por
ejemplo la pregunta se refiere a la satisfacción
escolar de los estudiantes, se aprecia que en la
delimitación de la variable esta también
implícita la forma en que se va a recoger la in-
formación o los datos correspondientes.
Otras cuestiones delicadas que conviene tener
previstas. El refinamiento de preguntas o
procedimiento por el cual una pregunta inicial
se va perfeccionando a lo largo de una
discusión critica. El valor de las hipótesis
cuando las preguntas tratan de relacionar dos
variables (confirmación de hipótesis). Por
ejemplo, si formulamos la hipótesis de que al
grado de satisfacción de los alumnos en el
instituto es mayor a medida que disminuye el
fracaso escolar. Antes de recoger información
sobre ambas variables conviene precisar
definiendo claramente lo que se entiende por
(o mejor que queremos decir con) fracaso
escolares y agrado de satisfacción.
Vivimos inmersos en un mundo de datos,
incluso podemos hablar de contaminación
informativa. Para desenvolvernos en la vida
cotidiana es más importante tener habilidades
para seleccionar, manejar, usar e interpretar
las informaciones, distinguiendo las básicas de
las superfluas y las útiles de las inútiles por
ello es también necesario facilitar a los futuros
ciudadanos buenas herramientas de
intervención ante la información en una doble
vertiente: por un lado, para determinar el
interés y la necesidad de los datos en un
asunto y por otro para disponer de buenas
estrategias de selección y recogida de datos.
19 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999
Como profesores necesitamos justificar la
recogida y el tratamiento de los datos
.¿obtener datos, para?¿con que tipo de
situaciones debe ponerse en contacto el
alumnado para que verdaderamente sienta la
necesidad de generar y manejar datos ¿desde
luego no tiene sentido la obtención de datos
para ,la recogida debe venir motivada por una
pregunta o un problema diferente informes y
documentos curriculares consideran la recogida
de datos por los propios alumnos como base
del estudio de la estadística considerando el
tipo de datos apropiados ala razones para
recogerlas, los problemas que se plantean al
hacerlo, las formas en que pueden ser
tratados validamente y las conclusiones que
se puedan extraer de ellos, ahora hacen falta
criterios para diseñar las situaciones de
aprendizaje.
La recogida de datos es uno de los primeros
pasos en la realización e investigaciones
estadísticas, pero la selección del tipo de dato
necesario y la elección de la fuente de donde
de obtendrá los mismos y la elaboración del
instrumento, son pasos previos a la recogida
de datos
Normalmente, necesitamos los datos para
saber de los objetos (quiero comprarme un
ordenador, ¿Qué modelo me interesa?, pero
también para saber de los colectivos (¿son
puntuales en su llegada al instituto los
alumnos del centro?). El primer problema me
obliga a obtener datos (en función de mis
necesidades como usuario del ordenador) de
diferentes modelos y marcas, para posterior
HACIENDO ENCUESTAS FIABLES_______________________________________________________
370
mente decidirme por uno de ellos en el
segundo el atributo de la población se obtiene
a partir de los datos de sus componentes.
Dentro de la recogida de datos se distinguen
los procedimientos directos de los indirectos
,en los primeros se obtiene información de los
propios individuos las llamadas fuentes
primarias recurriendo a la observación
experimentación, encuesta cuestionada son
contenidos específicos de esta parte el
diseño y el refinamiento de cuestionarios
mediante exploraciones piloto los
procedimientos indirectos recogen datos de
fuente secundarias o colecciones de
información estructurada por ejemplo, se
puede hacer un estudio estadístico de los
alumnos de un centro recurriendo
exclusivamente ala información de secretaria
registro (sistema y bases de datos) para
describir las posibilidades didácticas del trabajo
de otra fase de una investigación, el registro
de los datos, utilizare dos ejemplos.
MATRICES DE DATOS
Aquí solo resumiré una experiencia vivida
dentro del escenario la clase de tercero de
primaria de un colegio de barrio del zaidin
(granda). Los alumnos investigan sobre
preferencias académicas y deportivas con este
fin la profesora había preparado una ficha
cuestionadota véase formato en la figura 3 que
reparte a los alumnos para que rellenen
cuando todos han respondido al cuestionario,
se les propone, en la hora de clase ,que
elaboren individualmente una tabla vacía y
establece un sistema de trabajo en cadena,
cada alumno rellene un renglón, pasa la ficha a
un compañero –siempre mismo-y la recoge de
otro-que tampoco cambia el resultado es un
matriz de datos,¡en veinte minutos cada uno
tenia su tabla de datos en la figura 5 aparece
la tabla de víctor.
Podemos imaginar cómo continúo la historia
que por problemas de espacio no cuento. si
diré que además de Estadisticas (elaboración
de otras tablas y gráficos) las tablas dieron
juego para las actividades de aritmética u
cálculo.
Estas experiencias constituyen uno de los
primeros contactos con los sistemas de datos
.en ellas se trabajan procedimientos para
pasar del fichero (véase figura 4) la tabla de
datos (figura 59 la tabla o matriz también es
una base de datos en sentido amplio en
particular su estructura cumple el requisito
que según la enciclopedia británica caracteriza
a las bases de datos servir para la búsqueda
y recuperación rápida.
Si esto contenidos no se trabajan en los
primeros curiosos los profesores de
secundaria que detecten deficiencias en este
terreno se encontraran ante un dilema: optar
entre proponer en edades de secundaria
actividades propias de niños pequeños o
HACIENDO ENCUESTAS FIABLES_______________________________________________________
371
eludirlos .si bien la primera opción, en muchos
casos, esta dando lugar a las famosas criticas
de bajadas de niveles la segunda es peor.
BASES DE DATOS UN ORDENADOR EN
CLASE
para niveles posteriores, a partir del primer
ciclo de ESO, si los alumnos están iniciados en
procesos de registro y familiarizados con las
tablas de datos, se puede incorporar a estas
tareas el uso de ordenadores, lo que ira
preemitiendo a los alumnos manejar
colecciones de datos cada vez mayores los
programas de gestión de bases de datos,
permiten a los estudiantes diseñar su propia
estructura de datos e introducir una gran
cantidad de información que luego puede
ordenar y recuperar siguiendo multitud de
criterios .se profundiza en los diferentes
conceptos estadísticos ,sobre todo en las ideas
de variable estadísticas que se generalizan a
través del concepto de campo y de unidad
estadística ,que viene a representarse con los
registros en el gestor de base de datos
muchas son las actividades que se pueden
proponer para introducir a los alumnos el uso
de software sobre base de datos ,incluso sin
necesidad de utilizar el aula de informática
del instituto, las tareas con base de datos se
presentan a ser trabajos con un solo
ordenador en clase ,es más, algunos de los
ordenadores que se desechan o abandonan
sirven para gestionar bases de datos o
admiten una hoja de calculo que ofrece las
mismas prestaciones.
HACIENDO ENCUESTAS FIABLES_______________________________________________________
372
USO DE BASES DE DATOS COMO FUENTES
DE INFORMACIÓN
Otra de las aplicaciones consiste en utilizar el
ordenador para manejar bases de datos
construidas de antemano.
La justificación de los contenidos de este
apartado se apoya en la necesidad del
ciudadano de consultar las bases do datos
mediante el ordenador. Hoy día es corriente
hablar de los discos compactos que contienen
enormes cantidades de datos (desde el
catalogo de una biblioteca, hasta actividades
de ocio, pasando por otros temas de interés)
hablar de Internet donde la navegación -
controlada, racional e inteligente- que tan de
moda se esta poniendo requiere conocimientos
y destrezas en el manejo de las bases de
datos. El orden es necesario par la búsqueda
en una base de datos. Incluso las variables
cualitativas se pueden ordenar, es necesario
ordenarlas para la búsqueda, puesto que
siempre se puede recurrir al orden
alfanumérico. Búsquedas condicurnadas y
tablas de contingencia. Ordenación por
diferentes criterios.
LA TABLA COMO ORGANIZADORA
Mucho se ha escrito del valor que tiene una
tabla a la hora de resumir la información, pero
tal vez no se ponga el énfasis necesario en su
enseñanza.
En un seminario sobre estadística, un grupo de
18 profesores, discutiendo la importancia del
manejo de tablas y los conocimientos del
alumnado sobre su construcción, decidió pasar
una aprueba» para detectar posibles
deficiencias en este sentido. Durante una hora
de ciase se propuso a alumnos de diferentes
niveles -desde 5° de primaria hasta COU- que
contaran en el cuadro (véase figura 6) las
figuras de cada clase y expresaran los
resultados en una tabla.
Constatamos que prácticamente ningún
alumno aplico estrategias de recuento y la
mayoría se equivoco contando. A partir de 14
años, casi todos establecieron correctamente
las dos categorías -tipo de figura, y tipo de
relleno- pero nadie utilizo una tabla de doble
entrada para expresar los resultados. Las
mejores eran simples tablas de frecuencia. Una
tabla» muy original es la de la figura 7.
En multitud de situaciones, la información se
puede resumir en una tabla. Estos ejercicios,
además de desarrollar técnicas de recuento,
obligan a identificar variables y crear una
estructura de resumen utilizando una tabla de
doble entrada.
Los conceptos y procedimientos matemáticos
implicados en el tratamiento de la información,
y en particular en la construcción y manejo de
sistemas de datos, son conocimientos
relevantes y prioritarios en la formación
matemática elemental. Pero difícilmente se
generaliza en la práctica aquello que no cabe
en los libros (para enseriarlo) y lo que no cabe
en los exámenes para evaluarlo. Clasificar,
etiquetar, fichar, reducir datos, separar
unidades, establecer sistemas de categorías,
construir tablas, diseñar encuestas, elaborar
cuestionarios, acceder a la información usando
diversas fuentes de datos (incluyendo las
informáticas), construir y manejar bancos y
bases de datos son saberes que ni caben en los
libros de texto ni sus niveles de conocimiento
pueden entrar en un examen. Si no prosperan
materiales didácticos alternativos que soporten
estas actividades y nuevos instrumentos de
evaluación que destierren como únicos los
exámenes al use o las pruebas de respuesta
única (tipo test) para medir la capacidad de los
estudiantes y a través de ellos la de los
profesores.
Me conformo con que alguna de las propuestas
HACIENDO ENCUESTAS FIABLES_______________________________________________________
373
o preguntas anteriores pueda contribuir a
generar opinión sobre el tema, aumentando el
interés por llevar a clase situaciones que den
verdadero sentido a la investigación, o a
suavizar el afán de trabajar la estadística
partiendo de datos que sedan organizados de
antemano.
Julian Baena Ruiz es miembro del grupo
Teseract y asesor de formación permanente.
Centro de Profesorado de Granada. C/ fábrica
Vieja, 1. 18002. TEL.: (958)264871. Línea de
trabajo Organización y desarrollo de la aurícula
mediante proyectos.
24 Una Revista de didáctica de las matemáticas * n.
20 * pp. 9-74 * abril 1999