por filipenasato » Seg Dez 19, 2011 19:01
Boa noite! Preciso de uma sugestão sobre o que usar para filtrar os chamados "outliers". Utilizei alguns métodos como o box plot, z-scores, entre outros mas nenhum obteve resultados satisfatórios.
Tenho o seguinte problema, meu software gera uma seqüência de médias aritméticas utilizando sempre dados anteriores no cálculo por isso quando ainda existem poucos dados o resultado acaba não sendo muito confiável por falta de histórico mas a medida que novos dados são acrescentados o resultado acaba ficando mais robusto e sofre menos variação. Segue um exemplo:
r0 = -10
r1 = -10, 1
r2 = -10, 1, 5
r3 = -10, 1, 5, 2
r4 = -10, 1, 5, 2, 10
r_final teria que ser 1, 5, 2, 10 ignorando apenas o -10 e quando cálculo a média tenho os seguintes resultados: 1,6 com o -10 e 4,5 sem o -10 cujo seria o correto. Pensei em usar alguma média diferente ou ignorar uma quantidade inicial X de dados antes de começar o cálculo da média pois se eu uso os métodos conhecidos para "outliers" como o box plot, o número 10 ficaria fora do conjunto.
Alguma ideia?
Agradeço desde já.
Att,
Filipe Nasato.
-
filipenasato
- Novo Usuário

-
- Mensagens: 3
- Registrado em: Seg Dez 19, 2011 18:36
- Formação Escolar: GRADUAÇÃO
- Andamento: formado
por Neperiano » Seg Dez 19, 2011 20:40
Ola
Deixa eu ver se eu entendi
Ele não é confiavel porque apresenta poucos dados?
Tu deveria dar uma condição, tipo assim, SE X>10, exija que ele tenha ao menos 10 resultados
Ou então use o desvio padrão, quanto mais resultados, menor o desvio padrão
Não sei se ajudei
Qualquer duvida
Atenciosamente
Sómente os mortos conhecem o fim da guerra
"Platão"
-

Neperiano
- Colaborador Voluntário

-
- Mensagens: 960
- Registrado em: Seg Jun 16, 2008 17:09
- Formação Escolar: GRADUAÇÃO
- Área/Curso: Engenharia de Produção
- Andamento: cursando
por filipenasato » Ter Dez 20, 2011 09:14
Exato, no início como ainda tem poucos dados ele retorna uma média que pode distorcer o resultado futuro se o valor do dado for muito grotesco. A condição de ter um mínimo de resultados parece a solução mais correta, se fosse usar desvio padrão acabaria que talvez alguns dados ficassem de fora. Pretendo usar também uma média sem muita memória mas ainda não sei qual.
-
filipenasato
- Novo Usuário

-
- Mensagens: 3
- Registrado em: Seg Dez 19, 2011 18:36
- Formação Escolar: GRADUAÇÃO
- Andamento: formado
por Neperiano » Ter Dez 20, 2011 13:44
Ola
Conheço média geométrica e harmonica, são interessantes você dar uma pesquisada
Atenciosamente
Sómente os mortos conhecem o fim da guerra
"Platão"
-

Neperiano
- Colaborador Voluntário

-
- Mensagens: 960
- Registrado em: Seg Jun 16, 2008 17:09
- Formação Escolar: GRADUAÇÃO
- Área/Curso: Engenharia de Produção
- Andamento: cursando
por filipenasato » Ter Dez 20, 2011 14:35
Após alguns testes acabei utilizando a mediana acredito que seja a única forma de tirar os outliers com eficiência. Também estou ignorando os 10 primeiros resultados como foi mencionado anteriormente.
Obrigado!
-
filipenasato
- Novo Usuário

-
- Mensagens: 3
- Registrado em: Seg Dez 19, 2011 18:36
- Formação Escolar: GRADUAÇÃO
- Andamento: formado
por Neperiano » Ter Dez 20, 2011 14:47
Ola
Boa, ela meio que ignora os valores das pontas, não importa a amplitude com ela
Só cuidado ao utilizar ela, se você comparar com a média pode dar uma grande diferença
Atenciosamente
Sómente os mortos conhecem o fim da guerra
"Platão"
-

Neperiano
- Colaborador Voluntário

-
- Mensagens: 960
- Registrado em: Seg Jun 16, 2008 17:09
- Formação Escolar: GRADUAÇÃO
- Área/Curso: Engenharia de Produção
- Andamento: cursando
Voltar para Estatística
Usuários navegando neste fórum: Nenhum usuário registrado e 1 visitante
Assunto:
Funções
Autor:
Emilia - Sex Dez 03, 2010 13:24
Preciso de ajuda no seguinte problema:
O governo de um Estado Brasileiro mudou a contribuição previdenciária de seus contribuintes. era de 6% sobre qualquer salário; passou para 11% sobre o que excede R$1.200,00 nos salários. Por exemplo, sobre uma salário de R$1.700,00, a contribuição anterior era: 0,06x R$1.700,00 = R$102,00; e a atual é: 0,11x(R$1.700,00 - R$1.200,00) = R$55,00.
i. Determine as funções que fornecem o valor das contribuições em função do valor x do salário antes e depois da mudança na forma de cobrança.
ii. Esboce seus gráficos.
iii. Determine os valores de salários para os quais:
- a contribuição diminuiu;
- a contribuição permaneceu a mesma;
- a contribuição aumentou.
Powered by phpBB © phpBB Group.
phpBB Mobile / SEO by Artodia.