Regresión lineal múltiple

Supongamos ahora que hemos realizado las mediciones de tres atributos sobre cada unidad muestral, esto es (xi, yi, zi) para i = 1, ..., n son n tripletas de puntos. Supongamos ahora que se sospecha de que el atributo indicado por la letra z depende "linealmente" de los otros dos atributos. De otra forma se postula que

Z = a + b X + c Y

Entonces el problema consiste en calcular los valores de a, b y c de tal forma que el "error cuadrático" siguiente sea mínimo

Si [ zi - (a + b xi + c yi ]2

Y una manera de determinar estos valores es resolver las ecuaciones normales

(AtA)b = AtZ

donde

de tal forma que el sistema queda como

Este sistema se resuelve con "relativa facilidad" mediante el "método de Cramer", esto es

a = Db0 / D; b = Db1 / D; c = Db2 / D

donde D es el determinante de la matriz AtA o matriz de los coeficientes y Dbi es el determinante de la matriz resultante al reemplazar la columna i de la matriz de los coeficientes por la columna AtZ o columna de las constantes.

Ejemplo (ficticio). Los siguientes datos representan el PNB (Z) anual, el consumo de gasolina anual (X) y el consumo de electricidad anual (Y), durante seis años (en unidades normalizadas respectivamente)

 

Z 8 10 12 13 15 18
X 4 3 6 6 7 8
Y 20 22 23 26 27 30

El programa para resolver este ejemplo o cualquiera similar, realizado con el software DERIVE lo puede bajar desde aquí. Las ecuaciones normales son

y la solución es a = -8.8947;  b= 0.3684 y c = 0.78947. El resto de los cálculos, como el error de estimación estándar o errores de estimación puntuales, así como el coeficiente R2 son sencillos de obtener.

Anterior

Avanzar

Principal