¿Otras pruebas?
En ocasiones podemos tener problemas con datos que al hacer la regresión van a influenciarlo o van a ocasionar un sesgo. Por ello, es importante identificar observa- ciones influyentes. Primero podríamos pedirle a R una gráfica de los residuos de la regresión. Dicha grá- fica se obtiene al usar la función plot aplicada al modelo y el argumento which = 1. Dicha gráfica nos presenta los probables datos atípicos. Pero, además de los out- liers, podrían existir puntos que podrían estar influenciando fuertemente la regre- sión. Para identificar aquellas observaciones que están influyendo más sobre un modelo, en particular para realizar un diagnóstico útil de los problemas probables en los datos, utilizamos la función influence.measures que reporta varios estadís- ticos útiles para identificar observaciones influyentes y las marca con un asterisco. Cuando un estadístico dice que una observación es influyente, esto quiere decir que al remover dicha observación el modelo cambiaría significativamente. Probando auto-correlación entre residuos Si existe correlación entre los residuos, es probable que la regresión no sea una buena representación del fenómeno. Para probar si existe auto-correlación entre residuos se puede utilizar la prueba de Durbin-Watson. Esta prueba se usa en análisis de series de tiempo, sin embargo se creó originalmente para diagnosticar la auto-correlación entre los residuos de una regresión. La auto-correlación en los residuos puede ser un problema, pues distorsiona las estadísticas de regresión, como el estadístico F y las estadísticas t para los coefi- cientes de regresión. La presencia de auto-correlación sugiere que al modelo le falta un predictor o una variable útil o que debe incluir un componente de serie temporal, como una tendencia o un indicador estacional. Adicionalmente, se puede realizar una comprobación visual de la auto-correlación graficando la función de auto-corre- lación (ACF) de los residuos.
Search
Read the Text Version
- 1 - 2
Pages: