Estatística Básica
Renato Dourado MaiaInstituto de Ciências Agrárias
Universidade Federal de Minas Gerais
MEDIDAS RESUMO
25/08/14 Estatística Básica – Renato Dourado Maia 2/30
Motivação Básica
• Se você estivesse num ponto de ônibus e alguém perguntasse sobre o quanto um determinado ônibus demora para passar, o que você responderia? – Com certeza você não apresentaria uma tabela de fre-
quências e tampouco um modelo teórico para a variável aleatória de interesse!
• Quem perguntou deseja uma resposta breve que sintetize a informação e não uma completa descri-ção completa dos dados coletados ou de uma mode-lagem que eventualmente foi feita.
25/08/14 Estatística Básica – Renato Dourado Maia 3/30
Motivação Básica
• Nesta unidade serão apresentadas algumas medidas que sumarizam as informações disponíveis sobre o comportamento de uma variável, seja para um con-junto de dados – toda a população ou uma amostra, seja para variáveis aleatórias.
• Essencialmente, estudaremos medidas que represen-tam tendência central e dispersão.
25/08/14 Estatística Básica – Renato Dourado Maia 4/30
Medidas de Posição (Tendência Central)
• Seja uma variável X com observações x1, x2, …,xn. – A mediana (mdobs) é o valor que ocupa a posição central
dos dados ordenados.– A moda (moobs) é dada pelo valor mais frequente.– A média é dada pela soma das observações dividida pelo
número de observações:
xobs=x1+x2+⋯+xn
n=
∑i=1
n
x i
n=
n1 x1+n2 x2+⋯+nk xk
n1+⋯+nk
=
∑i=1
k
ni x i
n=∑
i=1
k n i
nx i .
Tabela de Frequências
25/08/14 Estatística Básica – Renato Dourado Maia 5/30
Exemplo 1
• Suponha que parafusos a serem utilizados em toma-das elétricas são embalados em caixas rotuladas co-mo contento 100 unidades. Em uma construção, 10 caixas de um lote tiveram o número de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99, 97, 96, 95, 99, 100. Determine, para o número de parafusos por caixa, a média, a moda e a mediana.
25/08/14 Estatística Básica – Renato Dourado Maia 6/30
Exemplo 1
• Dados ordenados: 95, 96, 97, 98, 99, 99, 100, 100, 100, 102.
{→ md obs=
quinto elemento+sexto elemento2
=99+99
2=99
→ mo obs=100
→ xobs=98+102+⋯+100
10=
98610
=98,6
25/08/14 Estatística Básica – Renato Dourado Maia 7/30
Pergunta
Quando utilizar cada uma das medidas de
posição?
25/08/14 Estatística Básica – Renato Dourado Maia 8/30
Medidas de Posição (Tendência Central)
• As medidas de posição podem ser utilizadas em con-junto para auxiliar na análise dos dados. Em determi-nadas situações, entretanto, uma pode ser mais con-veniente do que as outras.– Se há valores discrepantes, a mediana é menos afetada do
que a média.– Se há muitas observações, a mediana é mais difícil de ser
calculada, mesmo considerando a utilização de computado-res, pois o processo de ordenação é custoso.
– Há distribuições multimodais – conjuntos de dados com mais do que uma moda.
25/08/14 Estatística Básica – Renato Dourado Maia 9/30
"Basic Statistics of Movable Points" from the Wolfram Demonstrations Project
http://demonstrations.wolfram.com/BasicStatisticsOfMovablePoints
25/08/14 Estatística Básica – Renato Dourado Maia 10/30
"Mean, Median, Mode" from the Wolfram Demonstrations Project
http://demonstrations.wolfram.com/MeanMedianMode/
25/08/14 Estatística Básica – Renato Dourado Maia 11/30
Medidas de Posição (Tendência Central)
• Seja uma VA X com possíveis valores x1, x2, …,xk e cor-respondentes probabilidades p1, p2, …, pk. – A média, valor esperado ou esperança matemática de X,
denotada por E(X), μX, ou simplesmente μ, é dada pela expressão:
– A moda (Mo) de X é(são) o(s) valor(es) da variável com maior probabilidade, ou seja:
E (X )=∑i=1
k
x i pi .
P (X =Mo)=max( p1, p2,⋯, pk ) .
25/08/14 Estatística Básica – Renato Dourado Maia 12/30
Medidas de Posição (Tendência Central)
• Seja uma VA X com possíveis valores x1, x2, …,xk e cor-respondentes probabilidades p1, p2, …, pk. – A mediana de X (Md) é o valor que satisfaz às seguintes
condições:
– Em algumas situações, as desigualdades são satisfeitas por qualquer valor num certo intervalo e, nesse caso, toma-se a mediana como o ponto médio do intervalo.
P (X ≥Md )≥0,5 e P(X ≤Md )≥0,5.
25/08/14 Estatística Básica – Renato Dourado Maia 13/30
Exemplo 2
• Determine a média, e moda e a mediana para a VA X com a função discreta de probabilidade apresentada na tabela a seguir.
X -5 10 15 20
pi 0,3 0,2 0,4 0,1
{→ μ =∑i=1
4
x i p i=(−5)×(0,3)+10×0,2+15×0,4+20×0,1=8,5
→ Mo=15→ Md ∈ [10,15]⇒ Md=12,5
25/08/14 Estatística Básica – Renato Dourado Maia 14/30
Medidas de Posição (Tendência Central)
X x1 x2 ... xk
ni n1 n2 ... nk
X x1 x2 ... xk
pi p1 p2 ... pk
xobs=1n∑i=1
k
ni x i
Conjunto de Dados Variável Aleatória
Valores
Média
Mediana
Moda
μ=∑i=1
k
x i pi
md obs=valor centralP (X ≥Md )≥0,5 e
P(X ≤Md )≥0,5
moobs=valor com maior
frequênciaMo=valor com maior
probabilidade
25/08/14 Estatística Básica – Renato Dourado Maia 15/30
Pergunta
A renda per capita é a-propriada para compa-
rar a distribuição de renda de dois países?
25/08/14 Estatística Básica – Renato Dourado Maia 16/30
Medidas de Dispersão
• As medidas de posição podem esconder valiosas in-formações, pois elas não capturam a variabilidade dos valores da variável em estudo.– Diferentes conjuntos de dados, por exemplo, podem ter
medidas de posição idênticas. – Nesses casos, é provável que existam diferenças em rela-
ção à dispersão dos dados, isto é, quanto à maneira como os valores de cada conjunto se espalham.
• Para quantificar a dispersão dos dados, são utilizadas medidas de dispersão.
25/08/14 Estatística Básica – Renato Dourado Maia 17/30
Medidas de Dispersão
25/08/14 Estatística Básica – Renato Dourado Maia 18/30
Medidas de Dispersão – Conjunto de Dados
• A amplitude (Δ) é definida como a diferença entre o maior e o menor valor do conjunto de dados.
• Desvio mediano:
• Desvio médio:
desvio mediano=1n∑i=1
n
∣xi−md obs∣.
desvio médio=1n∑i=1
n
∣xi− xobs∣.
25/08/14 Estatística Básica – Renato Dourado Maia 19/30
Medidas de Dispersão – Conjunto de Dados
• Os desvios mediano e médio utilizam a função mó-dulo, cuja derivada é descontínua, o que dificulta o tratamento matemático:– O que se pode dizer sobre a derivada da função módulo?
• Em função disso, é comum a utilização de uma medi-da de dispersão que tenha propriedades matemáti-cas mais interessantes.
25/08/14 Estatística Básica – Renato Dourado Maia 20/30
Medidas de Dispersão – Conjunto de Dados
• A variância de uma variável X referente a um con-junto de dados, denotada por varobs, pode ser calcu-lada por meio da seguinte expressão:
• O desvio-padrão (dpobs), que tem a mesma unidade dos dados originais, é definido como a raiz quadrada positiva da variância.
var obs=1n∑i=1
n
( xi− xobs )2.
25/08/14 Estatística Básica – Renato Dourado Maia 21/30
Medidas de Dispersão – Conjunto de Dados
• A expressão a seguir facilita o cálculo da variância:
• Para o caso de os dados estarem disponíveis numa tabela de frequências, são utilizadas as seguintes ex-pressões para o cálculo da variância:
var obs=(1n∑i=1
n
x i2)− xobs
2 .
var obs=1n∑i=1
k
ni (x i− xobs)2=(1
n∑i=1
k
n i xi2)− xobs
2 .
25/08/14 Estatística Básica – Renato Dourado Maia 22/30
• Seja uma VA X com P(Xi = xi) = pi, i = 1, 2, …, k, e média μ. A variância de X é a ponderação, pelas res-pectivas probabilidades, dos desvios relativos à mé-dia, elevados ao quadrado, isto é,
• Normalmente, a variância por σ2 e o desvio-padrão por σ.
Medidas de Dispersão – Variável Aleatória
Var (X )=∑i=1
k
( xi−μ )2
p i .
25/08/14 Estatística Básica – Renato Dourado Maia 23/30
• A variância de definida no slide anterior pode ainda ser considerada como o valor esperado de uma nova variável aleatória, o desvio ao quadrado, isto é,
• Essa expressão pode ser reescrita da seguinte forma:
Medidas de Dispersão – Variável Aleatória
Var (X )=E [(X −μ )2].
Var (X )=E ( X 2)−μ 2=∑
i=i
k
p i xi2−μ 2 .
25/08/14 Estatística Básica – Renato Dourado Maia 24/30
Medidas de Dispersão
X x1 x2 ... xk
ni n1 n2 ... nk
X x1 x2 ... xk
pi p1 p2 ... pk
Conjunto de Dados Variável Aleatória
Valores
Variância {var obs=1n∑i=1
k
ni ( xi− xobs )2
var obs=(1n ∑i=1
k
n i xi2)− xobs
2 {σ2=E [(X −μ )
2 ]=∑i=1
k
pi (x i−μ )
σ 2=E ( X 2)−μ 2
=∑i=i
k
pi xi2−μ 2
25/08/14 Estatística Básica – Renato Dourado Maia 25/30
Propriedades da Média e da Variância
Exercício interessante: demonstrar essas propriedades...
Conjunto de Dados Variável Aleatória
Y =aX + b
yobs=a xobs+b
var obs(Y )=a2 var obs(X )
Y =aX + b
E (Y )=aE (X )+ b
Var (Y )=a2Var (X )
25/08/14 Estatística Básica – Renato Dourado Maia 26/30
Variável Discreta Valor Esperado Variância
Uniforme (1, k)
Bernoulli (p)
Binomial (n, p)
Geométrica (p)
Poisson (λ)
Hipergeométrica(n, m, r)
1+ k2
p
np
1−pp
λ
rmn
k 2−1
12
p (1− p)
np (1− p)
1−p
p2
λ
rm(n−m)(n−r )
n2(n−1)
Exercício interessante: calcular...
25/08/14 Estatística Básica – Renato Dourado Maia 27/30
"Descriptions of Univariate Data" from the Wolfram Demonstrations Project
http://demonstrations.wolfram.com/DescriptionsOfUnivariateData
25/08/14 Estatística Básica – Renato Dourado Maia 28/30
"Illustrating the Use of Discrete Distributions" from the Wolfram Demonstrations Project
http://demonstrations.wolfram.com/IllustratingTheUseOfDiscreteDistributions
25/08/14 Estatística Básica – Renato Dourado Maia 29/30
"Mathematica 7's Discrete Distributions" from the Wolfram Demonstrations Project
http://demonstrations.wolfram.com/Mathematica7sDiscreteDistributions/
25/08/14 Estatística Básica – Renato Dourado Maia 30/30
That's All Folks!
Próxima aula: exercícios do capítulo 4...