aula prática no r: introdução, resumo de dados, medidas de ... noturno 2018... · aula prática...

4

Click here to load reader

Upload: hadien

Post on 09-Feb-2019

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aula Prática no R: Introdução, Resumo de Dados, Medidas de ... Noturno 2018... · Aula Prática no R: Introdução, Resumo de Dados, Medidas de Posição e Dispersão Prof. Dr

Aula Prática no R: Introdução, Resumo de Dados,Medidas de Posição e Dispersão

Prof. Dr. Lucas Santana da Cunha20 de agosto de 2018

INTRODUÇÃO

Operações aritméticas simples e funções básicas no R

Exemplo

Resolva as seguintes operações no R:

a) 1 + 3 + 5 + 7 b) 1 + 5.3− 8 c) (2 + 3)2 d) 3 123−12 e)

√25

f) 3√

8 g) log2 4 h) loge 1 i) e0 j) 4! k) eloge 5

1+3+5+71+5*3-8(2+3)^23*(12/(3-12))sqrt(25) # raiz quadrada8^(1/3) # raiz cúbica de 8log(4,2) # logaritmo de 4 na base 2log(1) # logaritmo de 1 na base e (neperiano)exp(0) # exponencial de 0factorial(4) # fatorialexp(log(5)) # exponencial do logaritmo

Valores a Objetos

Exemplo

Armazene os seguintes objetos no R:

a) x1 =√

4 b) x2 = sen(3) c) x3 = e2 d) y = sen(π) e) z = x1 + x3.

# Armazenando valor ao objetox1 <- sqrt(4)x2 <- sin(3)x3 <- exp(2)sin(pi) -> yy = sin(pi)sin(pi) = yz <- x1+x3# Armazenando e Visualizando valor ao objetozz <- x1+x3 ; z(z <- x1+x3)

1

Page 2: Aula Prática no R: Introdução, Resumo de Dados, Medidas de ... Noturno 2018... · Aula Prática no R: Introdução, Resumo de Dados, Medidas de Posição e Dispersão Prof. Dr

Entrada de dados

Exemplo 1

Faça a leitura do seguinte conjunto de dados no R:

Altura 165 152 150 160 163 156 156 158 178 162 180 166 176 177 162Peso 53 53,3 50 62,5 80 39 55 56 51 73 61 73 97

# Entrada dos dadosaltura <- c(165,152,150,160,163,156,156,158,178,162,180,166,176,177,162); alturapeso <- c(53,53.3,50,62.5,80,39,55,56,51,73,61,73,97,"",""); pesopeso <- as.numeric(peso)dados <- data.frame(altura,peso); dados

RESUMO DE DADOS

Construção de tabelas e gráficos

Exemplo 1

Do Formulário Estatística Econômica - Turma 2000, pede-se:# Entrada do formulário no Rinstall.packages(readxl)library(readxl)formulario <- read_excel("C:/Users/lucas/Dropbox/UEL/Graduação/2018/

6EMA020 - Ciências Econômicas/Matutino/Estatística Econômica - Turma 2000 (respostas).xlsx")

View(formulario)

a) Uma tabela simples para as variáveis Escolaridade do Pai e Time de futebol e os gráficos de colunas ebarras, respectivamente;

# Tabelas simplesInstPai <- table(formulario$`Escolaridade do pai`); InstPaicbind(InstPai)Time <- table(formulario$Time); tab_Timecbind(tab_Time)# Gráficos de colunasinstall.packages("ggplot2")library(ggplot2)gInstP <- ggplot(formulario, aes(`Escolaridade do pai`))gInstP + geom_bar()gInstP + geom_bar(aes(fill=`Escolaridade do pai`), show.legend = F)# Gráficos de barrasgTime <- ggplot(formulario, aes(Time))gTime + geom_bar(aes(fill=Time), show.legend = F) + coord_flip()

b) Uma tabela de dupla entrada para as variáveis Cidade e Sexo. Represente essa tabela em um gráfico decolunas múltiplas;

2

Page 3: Aula Prática no R: Introdução, Resumo de Dados, Medidas de ... Noturno 2018... · Aula Prática no R: Introdução, Resumo de Dados, Medidas de Posição e Dispersão Prof. Dr

# Tabelas de dupla entradatab_dupla <- table(formulario$Cidade, formulario$Sexo); tab_dupla# Gráfico de colunas múltiplasgCid <- ggplot(formulario, aes(Cidade))gCid + geom_bar(aes(fill=Sexo), show.legend = T)# Melhorando o gráficoformulario$Cidade[which(formulario$Cidade == "Outra cidade do interior do Paraná")] <-

"Interior PR"formulario$Cidade[which(formulario$Cidade == "Outra cidade do Brasil fora do estado do PR")] <-

"Outro Estado"gCid <- ggplot(formulario, aes(Cidade))gCid + geom_bar(aes(fill=Sexo), show.legend = T)

d) Um gráfico de dispersão da variável Peso em função da Altura por Sexo.# Gráfico de dispersãoinstall.packages("lattice")library(lattice)xyplot(Peso~Altura,group=Sexo, col=c(2,3), data=formulario)xyplot(Peso~Altura|Sexo, data=formulario)

e) Box plot da variável por Carreira.# Gráfico Box Plotboxplot(formulario$Idade~formulario$Carreira)library(ggplot2)bp <- ggplot(formulario, aes(Carreira,Idade))bp + geom_boxplot(varwidth = TRUE)bp + geom_boxplot(fill = "white", colour = "blue")

MEDIDAS DE CENTRALIDADE E DE DISPERSÃO

Exemplo 1

Das variáveis Peso, Altura e Satisfação do formulário, calcule:

a) As médias.# Cálculo da média para cada variávelmediaP <- mean(formulario$Peso, na.rm = T); mediaPmediaA <- mean(formulario$Altura, na.rm = T); mediaAmediaS <- mean(formulario$Satisfação, na.rm = T); mediaS# Calculo das três variáveis pela função "sapply"sapply(formulario[,c("Peso","Altura","Satisfação")], mean,na.rm=T)

b) As medianas.# Cálculo da média para cada variávelmdP <- median(formulario$Peso, na.rm = T); mdPmdA <- median(formulario$Altura, na.rm = T); mdAmdS <- median(formulario$Satisfação, na.rm = T); mdS# Calculo das três variáveis pela função "sapply"sapply(formulario[,c("Peso","Altura","Satisfação")], median, na.rm=T)

c) As modas, caso existam.

3

Page 4: Aula Prática no R: Introdução, Resumo de Dados, Medidas de ... Noturno 2018... · Aula Prática no R: Introdução, Resumo de Dados, Medidas de Posição e Dispersão Prof. Dr

# Construindo uma função para cálculo da modamoda <- function(x) {

z <- table(as.vector(x))names(z)[z == max(z)]

}modaP <- moda(formulario$Peso); modaPmodaA <- moda(formulario$Altura); modaAmodaS <- moda(formulario$Satisfação); modaSsapply(formulario[,c("Peso","Altura","Satisfação")], moda)

d) As amplitudes totais;(atP <- max(formulario$Peso, na.rm = T) - min(formulario$Peso, na.rm = T)) (atA <- max(formulario$Altura, na.rm = T) - min(formulario$Altura, na.rm = T))(atS <- max(formulario$Satisfação, na.rm = T) - min(formulario$Satisfação, na.rm = T))

e) As variâncias;# Calculo da variância direto pela função "var"varP <- var(formulario$Peso, na.rm = T); varPvarA <- var(formulario$Altura, na.rm = T); varAvarS <- var(formulario$Satisfação, na.rm = T); varSsapply(formulario[,c("Peso","Altura","Satisfação")], var, na.rm = T)

f) Os desvios padrões;# Calculo do desvio padrão para todas as variáveissdP <- sd(formulario$Peso, na.rm = T); sdPsdA <- sd(formulario$Altura, na.rm = T); sdAsdS <- sd(formulario$Satisfação, na.rm = T); sdSsapply(formulario[,c("Peso","Altura","Satisfação")], sd, na.rm = T)

g) Os coeficientes de variação.# Cálculo do coeficiente de variaçãoCVP <- sdP/mediaP*100; CVPCVA <- sdA/mediaP*100; CVACVS <- sdS/mediaS*100; CVS

Exemplo 2

Do plano de ensino da disciplina Estatística Econômica aplicada à Economia, tem-se que os pesos das provasP1, P2, P3 e P4 são todas pi = 2, para i = 1, 2, 3, 4. A média dos trabalhos tem peso pt = 1. Assim, se umaluno obteve as seguintes notas: P1 = 8, P2 = 5, P3 = 8, P4 = 5, Pt = 8, qual será sua média final?# Entrada dos dados# pesosp1 <- 2; p2 <- 2; p3 <- 2; p4 <- 2; pt <- 1pi <- c(p1,p2,p3,p4,pt)P1 <- 8; P2 <- 5; P3 <- 8; P4 <- 5; Pt <- 8Pi <- c(P1,P2,P3,P4,Pt)# Cálculo da média pela função "weighted.mean"(media = weighted.mean(Pi, pi))

4