Programa do Curso - HIP03

1. Idéias básicas.

Natureza aleatória de eventos hidrológicos. Variáveis discretas e contínuas. Variação em torno de um valor central, com dispersão. Resumo de informações em termos de estatísticas. Idéias de estimação, e da incerteza das estimativas.

2. Concentração de informação: observações (medições) de uma variável.

Freqüências: uso de um histograma para representar as características de um conjunto de dados. Diagrama de freqüências acumuladas. Medidas da centralidade: mediana, moda, média. Quartiles: quantiles. Resíduos e “erros”. Medidas de dispersão: “range”; q3-q1; variância; desvio padrão. Medidas de assimetria e curtose.

3. Concentração de informação: observações (medições) de duas variáveis ou mais.

Histogramas bivariadas; covariância, coeficiente de correlação. Procura de relações estatísticas entre duas variáveis ou mais. Relação entre histograma bivariada e histogramas univariadas.

4. Elementos da teoria de probabilidade.

Eventos aleatórios; espaço de amostragem; axiomas de probabilidade. Distribuição de probabilidade de uma variável aleatória. Derivação da distribuição de probabilidade de funções de variáveis aleatórias. Momentos; uso de momentos para descrever centralidade, dispersão, ... de distribuições de probabilidade. Valores esperados: uso do operador E[.].

5. Distribuições de probabilidade.

Distribuições Bernoulli e binomial, com aplicações. Distribuição Poisson: relação à distribuição binomial. Distribuição geométrica. Distribuição exponencial; distribuição gamma e chi-quadrado (x2). Distribuição Normal N(m, s2), e importância dela. Relações entre todas estas distribuições. Distribuição log-Normal, com aplicações hidrológicas; distribuições Gumbel, Weibull, GEV. Cálculo de eventos com período de eventos de retorno T anos.

6. Ajuste de distribuições probabilísticas aos dados.

Parâmetros e estimativas deles. Estimador e estimativa. Características de estimadores: tendenciosidade; eficiência; suficiência. Estimadores pelo método de momentos; a função verossimilhança; estimadores pelo método de Máxima Verossimilhança (MV). Estimadores pelo método de mínimos quadrados: relação aos estimadores MV. Estimadores pelo método de momentos ponderados probabilísticos.

7. Testes de hipóteses.

Lógica de abordagem; hipótese nula e alternativa. Estatística de teste, e o cálculo da probabilidade de observá-la, sendo a hipótese nula verdadeira. Erros Tipo I, Tipo II. Testes de igualdade entre as médias de duas distribuições normais (teste “t”); extensão ao teste de igualdade entre K médias. Análise da variância (ANOVA) “one-way”, (unidades completamente casualizadas) e “two-way” (blocos casualizados). Teste “F”. Uso do teste “F” para testar hipóteses sobre igualdade de variâncias. Testes de ajuste: teste x2 e Kolmogorov-Smirnov. Testes não-paramétricos.

8. Modelos de regressão linear simples.

Suposições do modelo de regressão simples; estimadores mínimos quadrados do intercepto a e a declividade b. Erros padrão destes estimadores; uso da distribuição “t” para testar hipóteses H0 : b = 0 e H0 : a = 0. Cálculo de intervalos de confiança das estimativas, e intervalos de confiança delas. Verificação das suposições implícitas no modelo; características dos resíduos, e uso deles para detectar tendências não-lineares e não-homogeneidade de variância.

9. Modelos de regressão múltipla.

Extensão do modelo regressão ao caso com duas variáveis explanatórias ou mais. Correlações parciais, e testes de hipóteses. Regressão múltipla na comparação das variáveis explanatórias. Coeficiente de determinação. Erros padrão dos coeficientes de regressão parcial; estimação de Y e de E[Y], e os erros padrão  destas estimativas.

10. Análise de dados na forma de tabelas de freqüências.

Tabelas de contingência; uso do teste x2 para testar associação. Introdução aos métodos baseados na regressão logística no estudo da associação entre fatores.

11. Seleção do modelo mais apropriado

Testes baseados nos quantiles; plotagens “Q-Q” para testar Normalidade. Teste de Filliben. Transformações de dados às escalas diferentes; transformações Box-Cox. Uso da função verossimilhança na escolha do modelo mais apropriado.

Bibliografia:

Livros especificamente para hidrólogos:

  • Benjamin J R e C A Cornell (1970), Probability, Statistics and Decision for Civil Engineers, McGraw Hill Book Co., (Capítulos 1; 2; 3 [omite $3.4, $3.5, $3.7]; 4.bb
  • Haan C T (1977), Statistical Methods in Hydrology, Iowa State University Press, (Capítulos 1; 2 [omite página 40]; 3; 4; 5[omite matéria sobre a distribuição hipergeométrica]; 6 [omite matéria sobre a distribuição beta e distribuição Pearson]; 7; 8; 9; 10; 11).
  • Clarke R T (1994), Statistical Modeling in Hydrology, John Wiley & Sons Ltd: Chichester, Inglaterra.

Livros para leitura mais geral:

  • Kite G W (1977), Frequency and Risk Analysis in Hydrology, Water Resources Publications: Fort Collins, CO.
  • Wonnacott J H (1980), Introdução à Estatística, Livro-Técnico e Científico: Rio de Janeiro.
  • Meyer P L (1965), Probabilidade: Aplicações à Estatística, A C Livro-Técnico S A.
  • Hoel P G (1960), Estatística Elementar, Editora fundo da Cultura.
  • Fonsceca J S, de Andrade M e Toledo G L (1985), Estatística Aplicada, Editorial Atlas: São Paulo.
  • Wonnacott J L and Wonnacott R J (1977: 3rd edition), Introductory Statistics, John Wiley & Sons Inc: New York.

Software para análise estatística:

  • GENSTAT - Muito poderoso; instalado no IPH, manuais na biblioteca. Especialmente poderosos na leitura de dados com “format” diferente, e para ler (por exemplo) dados misturados com texto.
  • SAS - Também muito poderoso; usado pelo Departamento de Estatística no Campus. Usuários do Genstat e SAS geralmente preferem Genstat.
  • MINITAB - Fácil a usar, mas falta a generalidade de Genstat.

(Existem outros softwares também: SYSTAT, por exemplo. Ao nível deste curso, provavelmente qualquer software servirá; mas Genstat ou SAS são recomendados de você fizer muito uso de métodos estatísticos no futuro. E lembre-se que a parte maior da sua vida profissional vai ser passada na análise e interpretação de dados).