Aula 1 – Estatística (parte 2)
Prof. Julio C. J. Silva
Universidade Federal de Juiz de Fora (UFJF) Instituto de Ciências Exatas
Depto. de Química
Juiz de Fora, 1o Semestre, 2020
QUI 093 – Análise Química Instrumental
1
Como saber se minha análise possui algum tipo de erro ???
• Definir o intervalo de confiança (IC) – relaciona-se ao desvio padrão da média.
• Determinar o número de réplicas de medidas necessário para assegurar que uma média experimental esteja contida em uma certa faixa, com um dado nível de probabilidade.
• Estimar a probabilidade de (a) uma média experimental e um valor verdadeiro ou (b) duas médias experimentais serem diferentes; isto é, se a diferença é real ou simplesmente o resultado de um erro aleatório.
• Determinar, dentro de um dado nível de probabilidade, se a precisão de dois conjuntos de resultados é diferente.
• Decidir com uma certa probabilidade se um valor aparentemente crítico, contido em um conjunto de réplicas de medidas, é o resultado de um erro grosseiro que, portanto, pode ser rejeitado, ou se é parte legítima de uma população que precisa ser mantida no cálculo da média do conjunto de resultados.
Tratamento de estatística de dados
Intervalo de Confiança (IC)
• Teste t de Student Ferramenta estatística usada para representar IC e para comparação de resultados
• Teste “t” de Student Desenvolvido por W.S. Gosset (Student) em 1908 (Biometrika) para compensar as diferenças existentes entre “” e “x” , além de levar em conta que “s” é simplesmente uma aproximação de
• Cervejaria Guinness
• Usado para calcular a probabilidade de que um certo valor esteja em um certo intervalor de dados (distribuição normal)
4
Intervalo de Confiança • Intervalor de confiança (IC) faixa de valores entre os quais
se espera que a média da população (µ) esteja contida com uma certa probabilidade; desde que haja uma boa estimativa de “ ”
• Nível de confiança (NC) probabilidade de que esteja em um certo intervalo.
(Erro padrão da média) m = /(N)0,5
Intervalo de Confiança da Média quando é ?
• Sabe-se que para N grande X (média) e s (desvio padrão), são estimativas de e (desvio padrão da população)
• Em química analítica pequeno número de determinações
• Na prática apenas as estimativas podem ser calculadas
• Porém, s: somente para um grande número de medidas, o que não ocorre na prática.
• Assim, o intervalo de confiança deve ser maior para s (poucos medidas) tender a .
• Valor t Desvio da média em relação a s
• Para a média de N medidas
• Teste t de Student Ferramenta estatística usada para representar IC e para comparação de resultados
• Teste “t” de Student Desenvolvido por W.S. Gosset (Student) em 1908 para compensar as diferenças existentes entre “” e “x” , além de levar em conta que “s” é simplesmente uma aproximação de
• Intervalo de confiança da média (IC) para N réplicas
• Valor “t” variabilidade do desvio (s) a um certo nível de confiança (NC)
• Nível de confiança (NC) probabilidade de que esteja em um certo intervalo.
• Sabe-se que para N grande X (média) e s (desvio padrão), são estimativas de e (desvio padrão da população)
• Na prática pequeno número de determinações
• Na prática apenas as estimativas podem ser calculadas
• Porém, s: somente para um grande número de medidas, o que não ocorre na prática.
• Assim, o intervalo de confiança deve ser maior para s (poucos medidas) tender a .
• Valor t Desvio da média em relação a s t = (x - µ)/s
N N
Exemplo
• Um químico obteve os seguintes dados para o teor alcoólico de uma amostra de sangue: % de C2H5OH: 0,084; 0,089 e 0,079. Calcule o intervalo de confiança a 95% para a média considerando que os três resultados obtidos são a única indicação da precisão do método
Teste de Hipóteses • Teste de hipóteses: serve de base para muitas decisões tomadas em
trabalhos científicos.
• Para explicar uma observação, um modelo hipotético é proposto e testado experimentalmente para se avaliar sua validade.
• Se os resultados desses experimentos não dão suporte para o modelo, nós o rejeitamos e procuramos outra hipótese.
• Se houver concordância, o modelo hipotético serve de base para experimentos posteriores.
• Hipótese Nula (H0): A afirmação de que dois conjuntos de dados são obtidos a partir de populações com as mesmas propriedades ( e )
14
Comparação de um valor µ com µ0 • Hipótese nula (H0) cita que duas ou mais quantidades observadas são
estatisticamente iguais, ou seja: = 0
• NC = Nível de confiança
• = Nível de significância
• NC (Em termos fracionários) (valor p)
• NC (Em termos percentuais) (1 - ) X 100
• Teste z para grandes amostras:
Teste de duas caudas
Teste de uma cauda
• Comparar a média de uma série de resultados com um valor de referência (µ0) e exprimir o nível de confiança associado ao significado de comparação
• O valor encontrado difere significativamente do valor de referência. Nesse caso não se pode adotar a hipótese nula (H0) que não há erro sistemático na análise
Comparação de um valor µ com µ0 (N µ)
Teste de Hipóteses
“Os testes estatísticos apenas nos
fornecem probabilidades. Eles não nos
desobrigam de interpretar nossos
resultados”
18
Testes de Significância - Teste t de Student
ou p-valor (0,1) → NC = 100 x (1- ) = 90% 19
Testes de Significância - Teste t de Student
ou p-valor (0,1) → NC = 100 x (1- ) = 90%
Testes de Significância Teste t de Student
ou p-valor (0,1) → NC = 100 x (1- ) = 90%
Viés Indica a tendência dos dados apresentarem algum erro sistemático
µ0 = µA
Testes de Significância Teste t de Student
• Exemplo:
• Em um novo método para determinação de selenourea em água, os seguintes valores foram encontrados para as amostras de água dopadas com 50 mg L-1 de selenourea: 50,4; 50,7; 49,1; 49,0 e 51,1 mg L-1 de selenourea.
• Existe evidencia de erro sistemático a 95% de nível de confiança?
Teste F (Usado para Comparar variâncias)
Usado para comparar as precisões (desvios padrões) de dois conjuntos de dados
Teste F = (s1)2/(s2)2
O maior valor de s é sempre colocado no numerador, o que faz com que o valor de F seja sempre maior do que a unidade: H0: s1 = s2 (os dados foram obtidos de populações com o mesmo desvios padrão ()) Fcalculado > Ftabelado = H0 rejeitada Fcalculado < Ftabelado = H0 aceita Graus de liberdade = N-1 (numerador e denominador)
24
Testes de Significância - Teste F
25
Exemplo • Um método proposto para a determinação da
demanda química de oxigênio (DQO) em águas residuais foi comparado com o método padrão (sal de Hg). Os seguintes resultados foram obtidos:
Método padrão (mg L-1) : média = 72, s = 3,31
Método proposto (mg L-1): média = 72, s = 1,51
Considerando oito (8) determinações, podemos considerar que as precisões de ambos os métodos são iguais em um NC de 95% ?
26
Comparação de Duas Médias Experimentais
• Comparando os resultados de um método proposto com um de referência.
• Tem-se duas médias x1 e x2
• Considerar a hipótese nula (H0) que ambos métodos dão o mesmo resultado (1 = 2)
• É necessário que não haja uma diferença significativa entre as variâncias (teste F)
27
Exemplo
28
Comparação de Duas Médias Experimentais
• INMETRO: se F calculado for maior que o F tabelado, as variâncias não podem ser consideradas iguais, ou seja, a matriz tem um efeito importante sobre a precisão do método na faixa de concentração em estudo
29
Teste t Pareado (diferenças individuais)
• Comparação de métodos cujas amostras possuem, substancialmente, diferentes quantidades de analito;
• Os testes t pareados usam o mesmo tipo de procedimento do teste t normal, exceto que analisamos:
– Pares de dados. O desvio padrão agora é o desvio padrão da diferença
nas médias.
– Hipótese nula é H0: µd = Δ0, em que Δ0 é um valor específico da diferença a ser testado, frequentemente zero (Gaussiana). O valor do teste estatístico é:
30
Exemplo
31
Análise de Variância (ANOVA)
• Comparação entre mais de duas médias de populações;
• Os métodos usados para múltiplas comparações estão contidos na categoria geral da análise da variância (ANOVA);
• Os métodos de planejamento experimental tiram vantagem da ANOVA no planejamento e realização de experimentos;
• Teste F 32
Conceito ANOVA
• Procedimentos: detectar diferenças em diversas médias de populações pela comparação das variâncias;
• Para comparar “I” médias de populações, µ1, µ2, µ3, µI, a hipótese nula H0 assume:
• Ha: pelo menos dois µI são diferentes 33
Parâmetros ANOVA
• ANOVA = Comparação entre as várias populações;
• Fator = Característica comum da população que tem diferentes valores;
• Níveis = Valores diferentes do fator de interesse a ser testado;
• Resposta = Medida da resposta para cada nível amostrado;
• Princípio: Comparar variações entre os níveis com as variações dentro dos níveis.
34
Exemplo
• Existe uma diferença nos resultados de cinco analistas na análise de Ca2+ por titulação ?
• Fator ?
• Níveis?
• Resposta?
35
Exemplo
36
Níveis
ANOVA de Fator único
Teste da hipótese nula (H0: µ1 = µ2 = µ3 = ...µI) :
• Médias das amostras das I populações (𝑥 1, 𝑥 2, 𝑥 3, ...𝑥 l );
• Variâncias das amostras (𝑠21, 𝑠22, 𝑠23, ...., 𝑠2l );
• Média global 𝑥 (ponderada) média de todos os dados.
37
ANOVA de Fator único • Soma dos quadrados devido ao Fator (SQF)
• Soma dos quadrados devido ao erro (SQE)
• Soma total dos quadrados (SQT)
• Número de Graus de Liberdade
• Valores médios quadrados
• Teste F
38
Quais resultados são diferentes?
• DMS = Diferença menos significativa
• Ng = Número de réplicas em cada nível (grupo)
ANOVA de Fator único
Exemplo
Cinco laboratórios diferentes participaram de um estudo interlaboratorial envolvendo determinações dos níveis de Fe em amostras de água. Os seguintes resultados são réplicas de determinações de ppm de Fe para os laboratórios A-E.
(a) Defina as hipóteses apropriadas.
(b) Os laboratórios diferem em um nível de confiança de 95%? E a um nível de confiança de 99% (Fcrít = 5,99)? E ao nível de confiança de 99,9% (Fcrít = 11,28)?
(c) (c) Que laboratórios são diferentes dos outros em um nível de confiança de 95%?
Rejeição de Resultados (Teste Q)
• Colocar os valores obtidos em ordem crescente;
• Determinar a diferença existente entre o maior e o menor valor (faixa);
• Determinar a diferença (em módulo) entre o menor valor da série e o resultado mais próximo;
• Dividir esta diferença (em módulo) pela faixa, determinando Q;
• Se Q > Qtab, o menor valor é rejeitado;
41
Rejeição de Resultados (Teste Q)
• Se o valor menor é rejeitado, redeterminar a faixa e testar o maior valor da série;
• Repetir o processo até que o menor e maior valores sejam aceitos;
• Se o menor valor é aceito, o maior valor é testado e o processo repetido até que o maior e menor valores sejam aceitos;
• Se a série contiver somente três medidas somente um teste sobre o valor duvidoso precisa ser feito;
42
• o valor absoluto da diferença entre o resultado questionável xq e seu vizinho mais próximo xp é dividido pela faixa f do conjunto inteiro para dar a grandeza Q
43
Exemplo
Aplique o teste Q aos conjuntos de dados que seguem para determinar se resultados anômalos devem ser mantidos ou rejeitados a um nível de confiança de 95%.
(a) 41,27; 41,61; 41,84; 41,70
(b) 7,295; 7,284; 7,388; 7,292
44
Referências
-Cadore, S. Notas de aula. IQ, UNICAMP, 2004.
-Santos, M., Notas de aula. Depto Química, UFJF. 2009
-D. A. SKOOG, D. M. WEST, F. J. HOLLER e S. R. CROUCH –
Fundamentos de Química Analitica, 1a ed., Thomson, 2006.
- Baccan, N., Química Analítica Quantitativa Elementar. 3a Ed.
Edgard Blucher LTDA
- James N. Miller & Jane C. Miller. Statistics and Chemometrics for
Analytical Chemistry, fourth edition. Person Education.
- ANVISA - Guia para Qualidade em Química Analítica: Uma Assistência a Acreditação – ANVISA, 1.ed. – Brasília, 2004.
- Lowinsohn, D., Notas de aula. Depto. de Química, UFJF. 2009.
45