geoestatÍstica aplicada a engenharia florestal gef -140 josÉ marcio de mello...
TRANSCRIPT
GEOESTATÍSTICA APLICADA A ENGENHARIA FLORESTAL
GEF -140
JOSÉ MARCIO DE MELLO
LAVRAS #2014 – 2#
1. INTRODUÇÃO1.1 Disciplina e suas interfaces na Engenharia Florestal
Técnicas estatísticas são aplicadas em todos os ramos da ciência. (Teste F, testes de média, regressão, análise de agrupamento, Modelagem, etc...)
ESTATÍSTICA “CLÁSSICA” –
MODELAGEM E TESTES DE
COMPARAÇÃO
VIVEIROS “Anava”
SEMENTES“Viabilidades do vigor
através da distribuição de BERNOULLI”
TECNOLIGIA DA MADEIRA“Anava e modelagem”
ECOLOGIA “Modelagem/análise
multivariada”
BIOMETRIA“Modelagem”
INVENTÁRIO FLORESTAL
MANEJO FLORESTAL
MÉTODOS SILVICULTURAIS
“Anava – modelagem”
“ISTO EVIDENCIA A IMPORTÂNCIA DA ESTATÍSTICA NA FORMAÇÃO DO ENGENHEIRO FLORESTAL”.
Os métodos de análises empregados na estatística clássica, assumem que as observações ocorrem de forma independente.
Os métodos clássicos geram uma medida de posição (µ) e uma medida de dispersão (σ2). Na clássica os métodos discerne somente o tamanho da variabilidade.
Segundo Reichardt (1985) “A estatística clássica e a geoestatística, que é um ramo da estatística espacial, se complementam”.
Neste sentido é que teremos que perceber a interface e possibilidades de novas alternativas que explore a relação espacial entre as observações (distâncias entre os pontos observados).
GEOESTATÍSTICA
VIVEIROS “casa de
vegetação (L1; C3;xi)”
RECUPERAÇÃO DE ÁREAS
DEGRADADAS “Variabilidade de solos”
TECNOLIGIA DA MADEIRA“Continuidade espacial da DB ao longo do fuste”
ECOLOGIA “Estudo da distribuição espacial das espécies”
BIOMETRIA“Estudo de variabailidade
espacial de variáveis”
INVENTÁRIO FLORESTAL “Georeferenciamento”
SENSORIAMENTO REMOTO
MELHORAMENTO “Análise de progêneses”
FOCO DO CURSO: “Apresentar noções gerais de geoestatística, a fim de que possamos ter outras alternativas de análises”.
1.2 Breve histórico sobre geoestatística
a) - Smith (1910)
- Montgomery (1913)
- Waynich e Sharp (1919)
Utilizavam a média e o desvio padrão para caracterizar fenômenos na área de solos – QUESTIONAMENTOS SOBRE OS MÉTODOS????
- Adubação- Calagem...
Dose única para toda a área.
- Hoje tem-se a agricultura de precisão...
b) Mercer & Hall (1911) “Experimento em branco em campos de milho na Inglaterra”.
Montaram um experimento com diversas parcelas pequenas em campo de milho para estudar a variação entre estas parcelas.
Observaram que a variância diminui com o aumento da parcela.
σ2
Tamanho
“Tendência de estabilização da variância”.
A ideia de estabilização da σ2 é “um primeiro indicativo de geo”.
Verificaram que havia uma forte correlação entre as parcelas adjacentes nos campos de milho. (INTUIÇÃO DE DEPENDÊNCIA ESPACIAL).
Eles sugeriram comparar o desvio padrão da diferença entre unidades vizinhas ( BASE DO SEMIVARIOGRAMA)
“Tendência de estabilização da variância”.
“Tendência de estabilização da variância”.
σ2
“Tendência de estabilização da variância”.
σ2σ2
Tamanho
σ2
“Tendência de estabilização da variância”.
Tamanho
σ2
“Tendência de estabilização da variância”.
Tamanho
σ2
Percebendo estas questões e não tendo recurso computacional adequado, as ideias dos pesquisadores estatísticos começaram a fluir....
Fisher (1925) – Livro “Statistical Method for Reserch Workerks”
Snedecor (1937) – “Statistical Method”
“ Esta duas obras nortearam os princípios e fundamentos da estatística experimental (distribuição normal, aleatorização e independência entre as observações)”.
A PRINCIPAL HIPÓTESE DESSA ESTATÍSTICA É QUE AS VARIAÇÕES NUMA DADA CARACTERÍSTICA DE UM LOCAL PARA OUTRO SÃO ALEATÓRIAS, OU SEJA, NADA INFLUENCIA A σ2 DOS DADOS.
c) Daniel G. Krige (1951) – Começa a história da geoestatística
Concluiu que (µ) e (σ2) eram insuficientes para explicar o que acontecia com as estimativas de ouro nas jazidas da África do Sul.
Quando era explorado a jazida, os valores de média e variância gerados pela amostra eram viesados.
Krige e Sichel – desenvolveram uma estatística diferenciada e apropriada para estimar o cálculo da reserva.
“Introduziu o conceito de média móvel para evitar a superestimação sistemática da reserva”.
1962/1963 – Matheron com os dados de Krige desenvolveu a Teoria das Variáveis Regionalizadas.
“Modelagem Matemática para variáveis que ocorrem de forma contínua e que a variação de local para outro tem influência da distância”.
2. ESTATÍSTICA DESCRITIVA – uso do R
2.1 Conceito de população
- Alvo
- Estatística
- COORDENADAS DO CONTORNO DA ÁREA
- COORDENADAS DE PARCELAS
2.2 Amostra
É um conjunto representativo da população estatística. Os dados para trabalhar com geoestatística vem de informações da amostra.
Quando se trabalha com amostragem sistemática, ela possibilita “enxergar” melhor a estrutura de continuidade espacial da característica avaliada.
A observação da continuidade espacial, às vezes, é uma questão de escala. Se os pontos de observação estão distantes, pode-se concluir que a variável não é contínua. É preciso amostrar numa escala menor (TESSELA) para poder visualizar a magnitude desta continuidade espacial. [ Amostrar na pequena escala. Lá pode ter continuidade e a gente não enxergar]...
Uso R
(Parte 1)
1. Apresentação do R;
2. Abrir o arquivo “dados_2014.xls” e criar o arquivo “dados2014.txt”;
3. Gerar um objeto (dados) data.frame com o arquivo “dados.txt”;
dados=read.table("dados1.txt",header=T,dec=",")
4. Apresentar a função sample do R;
5. Criar 3 objetos utilizando a função sample;
a10=sample(dados$VTCC,10,replace=F)
a50=sample(dados$VTCC,50,replace=F)
a100=sample(dados$VTCC,100,replace=F)
Observe que foram geradas 3 amostras de tamanhos diferentes (10; 50; 100).
2.3 Medidas de posição
As medidas de posição são: média; mediana e moda.
- FAZENDO NO RFAZENDO NO R
x=seq(10,220) fx1=dnorm(x,80,20) plot(x,fx1,ype=“l”) fx2=dnorm(x,100,20) lines(fx2)
2
22)(
*21exp
**2
1)(
xxf
Uso R(Parte 2)
6. Calcular a média e mediana para cada uma das amostras (a10; a50; a100);
mean(a10) median(a10)
mean(a50) median(a50)
mean(a100) median(a100)
7. Gerar o histograma de frequência para cada uma das amostras;
par(mfrow=c(1,3))
hist(a10,col="red",main="Média 1",label=T)
hist(a50,col="blue",main="Média 2",label=T)
hist(a100,col="orange",main="Média 3",label=T)
abline(v=a) # a= objeto com média de 10 elementos
- GRÁFICO RELACIONANDO MÉDIA COM A INTENSIDADE AMOSTRAL
media=c(mean(a10),mean(a50),mean(a100)) x=c(10,50,100) plot(x,media,ylim=c(200,250)) abline(h=mean(dados$VTCC)) plot(dados$VTCC~dados$LAT) lines(lowess(dados$VTCC~dados$LAT))
20 40 60 80 100
200
210
220
230
240
250
x
med
ia
2.4 Medidas de dispersão
As principais medidas de dispersão são: Variância; Desvio padrão; CV e erro padrão.
- FAZENDO NO RFAZENDO NO R
x=seq(1,100) fx1=dnorm(x,50,5) plot(x,fx1,type=“l”) fx2=dnorm(x,50,10) lines(fx2) abline(v=50)
Uso R
PARTE 31. Gerar aleatoriamente as seguintes intensidades amostrais: a20; a40; a60;
a80; a100 e a120.
2. Para cada grupo encontrar a média, a variância e o desvio padrão.
MEDIA=c(mean(a20),mean(a40),mean(a60),mean(a80),mean(a100),mean(a120))
RESULTADO=matrix(c(MEDIA,VARIANCIA,DESVIO),ncol=3)
colnames(RESULTADO)=c("MÉDIA","VARIÂNCIA",“DESVIO")
CV=(DESVIO/MEDIA)*100
3. Relacionar a intensidade amostral (x) com o coeficiente de variação (CV).
2. X=c(20,40,60,80,100,120)
3. plot(X,CV)
4. Processar cada intensidade amostral gerada aleatoriamente usando a função t.test.
- t.test(a20)
4. Processar cada intensidade amostral gerada aleatoriamente usando a função t.test.
t.test(a20) # Repete-se o cálculo do IC para cada intensidade amostral…
5. Construir um gráfico comparando os intervalos com o valor paramétrico.
ICI=c(valor1,valor2,valor3) # Criar um vetor com os limites inferiores do IC.ICS=c(valor1,valor2,valor3) # Criar um vetor com os limites superiores. X=seq(1:6) # Criar uma sequência para mostrar quantos intervalos temos. Neste exemplo temos 6 médias.Y=seq(menor LI -1, maior LS+1, length=6) # Os valores -1 e +1 é para realçar as barras verticais. Length 6 é para indicar quantas barrinhas.plot(X,Y,type=“n” ) # Type n é para não aparecer as bolinhas da função plot.arrows(X,ICI,X,ICS,lty=1,code=3,angle=0)media=mean(dados$VTCC)abline(h=media)