segunda-feira, 7 de fevereiro de 2011

Curvas ROC

Curvas ROC foram criadas na segunda guerra mundial para interpretar dados do radar e identificar aviões inimigos. A curva ROC é bastante útil para comparar resultados.

A curva ROC (Receiver Operating Characteristic) é utilizada para mostrar o grau de acerto ou de erro. Suponha que se tenha um paciente e quer saber se ele tem determinada doença. Aplica-se um teste e verifica o resultado. A interpretação resulta em 4 grupos:
1) Doentes classificados como doentes.
2) Doentes classificados como sãos.
3) Sãos classificados como sãos.
4) Sãos classificados como doentes.

Ou escrito de outra forma:
1) Correta aceitação.
2) Falsa rejeição.
3) Correta rejeição.
4) Falsa aceitação.

Obviamente os grupos 2 e 4 devem ser minimizados.


A curva ROC plota os dados de 0,0 a 1,1 da seguinte forma:
O eixo X é da falsa aceitação, e o eixo Y da correta aceitação. Portanto o ideal é uma reta de 0,0 para 0,1 e outra reta de 0,1 para 1,1. Veja a figura 1.

Se utilizar uma moeda (cara ou coroa) para determinar se está doente, iriamos obter uma reta de 0,0 para 1,1, cortando o quadrado no meio, diagonalmente, como na figura 2. Qualquer outra técnica utilizada deverá levantar a curva para o canto superior esquerdo. Quanto mais no canto, melhor a técnica. A figura 3 mostra uma curva ROC típica.



Também é comum usar a área abaixo da curva como medida de comparação entre diversas técnicas. A situação de cara ou coroa dá uma área abaixo da curva de 0,5. Qualquer outra técnica deve aumentar este número até chegar ao ideal que seria 1,0. Quanto mais alto o número, melhor a técnica de identificação.

Para um método de cálculo da área abaixo da curva veja este tutorial: Área Abaixo da Curva.

Nenhum comentário:

Postar um comentário