Regresión lineal múltiple |
|||||||||||||||||||||||
Supongamos ahora que hemos realizado las mediciones de tres atributos sobre cada unidad muestral, esto es (xi, yi, zi) para i = 1, ..., n son n tripletas de puntos. Supongamos ahora que se sospecha de que el atributo indicado por la letra z depende "linealmente" de los otros dos atributos. De otra forma se postula que Z = a + b X + c Y Entonces el problema consiste en calcular los valores de a, b y c de tal forma que el "error cuadrático" siguiente sea mínimo Si [ zi - (a + b xi + c yi ]2 Y una manera de determinar estos valores es resolver las ecuaciones normales (AtA)b = AtZ donde
de tal forma que el sistema queda como
|
Este sistema se resuelve con "relativa facilidad" mediante el "método de Cramer", esto es a = Db0 / D; b = Db1 / D; c = Db2 / D donde D es el determinante de la matriz AtA o matriz de los coeficientes y Dbi es el determinante de la matriz resultante al reemplazar la columna i de la matriz de los coeficientes por la columna AtZ o columna de las constantes. Ejemplo (ficticio). Los siguientes datos representan el PNB (Z) anual, el consumo de gasolina anual (X) y el consumo de electricidad anual (Y), durante seis años (en unidades normalizadas respectivamente)
El programa para resolver este ejemplo o cualquiera similar, realizado con el software DERIVE lo puede bajar desde aquí. Las ecuaciones normales son y la solución es a = -8.8947; b= 0.3684 y c = 0.78947. El resto de los cálculos, como el error de estimación estándar o errores de estimación puntuales, así como el coeficiente R2 son sencillos de obtener. |
||||||||||||||||||||||