1. Idéias básicas.
Natureza aleatória de eventos hidrológicos. Variáveis discretas e contínuas. Variação em torno de um valor central, com dispersão. Resumo de informações em termos de estatísticas. Idéias de estimação, e da incerteza das estimativas.
2. Concentração de informação: observações (medições) de uma variável.
Freqüências: uso de um histograma para representar as características de um conjunto de dados. Diagrama de freqüências acumuladas. Medidas da centralidade: mediana, moda, média. Quartiles: quantiles. Resíduos e “erros”. Medidas de dispersão: “range”; q3-q1; variância; desvio padrão. Medidas de assimetria e curtose.
3. Concentração de informação: observações (medições) de duas variáveis ou mais.
Histogramas bivariadas; covariância, coeficiente de correlação. Procura de relações estatísticas entre duas variáveis ou mais. Relação entre histograma bivariada e histogramas univariadas.
4. Elementos da teoria de probabilidade.
Eventos aleatórios; espaço de amostragem; axiomas de probabilidade. Distribuição de probabilidade de uma variável aleatória. Derivação da distribuição de probabilidade de funções de variáveis aleatórias. Momentos; uso de momentos para descrever centralidade, dispersão, ... de distribuições de probabilidade. Valores esperados: uso do operador E[.].
5. Distribuições de probabilidade.
Distribuições Bernoulli e binomial, com aplicações. Distribuição Poisson: relação à distribuição binomial. Distribuição geométrica. Distribuição exponencial; distribuição gamma e chi-quadrado (x2). Distribuição Normal N(m, s2), e importância dela. Relações entre todas estas distribuições. Distribuição log-Normal, com aplicações hidrológicas; distribuições Gumbel, Weibull, GEV. Cálculo de eventos com período de eventos de retorno T anos.
6. Ajuste de distribuições probabilísticas aos dados.
Parâmetros e estimativas deles. Estimador e estimativa. Características de estimadores: tendenciosidade; eficiência; suficiência. Estimadores pelo método de momentos; a função verossimilhança; estimadores pelo método de Máxima Verossimilhança (MV). Estimadores pelo método de mínimos quadrados: relação aos estimadores MV. Estimadores pelo método de momentos ponderados probabilísticos.
7. Testes de hipóteses.
Lógica de abordagem; hipótese nula e alternativa. Estatística de teste, e o cálculo da probabilidade de observá-la, sendo a hipótese nula verdadeira. Erros Tipo I, Tipo II. Testes de igualdade entre as médias de duas distribuições normais (teste “t”); extensão ao teste de igualdade entre K médias. Análise da variância (ANOVA) “one-way”, (unidades completamente casualizadas) e “two-way” (blocos casualizados). Teste “F”. Uso do teste “F” para testar hipóteses sobre igualdade de variâncias. Testes de ajuste: teste x2 e Kolmogorov-Smirnov. Testes não-paramétricos.
8. Modelos de regressão linear simples.
Suposições do modelo de regressão simples; estimadores mínimos quadrados do intercepto a e a declividade b. Erros padrão destes estimadores; uso da distribuição “t” para testar hipóteses H0 : b = 0 e H0 : a = 0. Cálculo de intervalos de confiança das estimativas, e intervalos de confiança delas. Verificação das suposições implícitas no modelo; características dos resíduos, e uso deles para detectar tendências não-lineares e não-homogeneidade de variância.
9. Modelos de regressão múltipla.
Extensão do modelo regressão ao caso com duas variáveis explanatórias ou mais. Correlações parciais, e testes de hipóteses. Regressão múltipla na comparação das variáveis explanatórias. Coeficiente de determinação. Erros padrão dos coeficientes de regressão parcial; estimação de Y e de E[Y], e os erros padrão destas estimativas.
10. Análise de dados na forma de tabelas de freqüências.
Tabelas de contingência; uso do teste x2 para testar associação. Introdução aos métodos baseados na regressão logística no estudo da associação entre fatores.
11. Seleção do modelo mais apropriado
Testes baseados nos quantiles; plotagens “Q-Q” para testar Normalidade. Teste de Filliben. Transformações de dados às escalas diferentes; transformações Box-Cox. Uso da função verossimilhança na escolha do modelo mais apropriado.
Bibliografia:
Livros especificamente para hidrólogos:
Livros para leitura mais geral:
Software para análise estatística:
(Existem outros softwares também: SYSTAT, por exemplo. Ao nível deste curso, provavelmente qualquer software servirá; mas Genstat ou SAS são recomendados de você fizer muito uso de métodos estatísticos no futuro. E lembre-se que a parte maior da sua vida profissional vai ser passada na análise e interpretação de dados).