# Datos de las 10 companias industriales mas grandes de EEUU en 1990: companias <- c("GM","Ford","Exxon","IBM","Gen.Elec.","Mobil","Phil.Mor.","Chrysler","DuPont","Texaco"); ventas <- as.numeric(c(126974,96933,86656,63438,55264,50976,39069,36156,35209,32416)); gan.net<- as.numeric(c(4224,3835,3510,3758,3939,1809,2946,359,2480,2413)); datos <- data.frame(companias,ventas,gan.net); x1x2.dat <- as.matrix(datos[,2:3]); n <- length(ventas); ## Medias y matriz -S- de varianza covarianza: medias <- apply(x1x2.dat,2,mean); Smat <- var(x1x2.dat); S.inv <- solve(Smat); #Construccion del plot de distancias chi-cuadradas: #1. Calcular las distancias (xj-x.barra)'S^(-1)(xj-x.barra): dsq.vec <-rep(0,n); for(i in 1:n){ dsq.vec[i] <- (x1x2.dat[i,] - medias)%*%S.inv%*%(x1x2.dat[i,]-medias); } #2. Ordenar las distancias de menor a mayor ord.dists <- sort(dsq.vec,decreasing=FALSE) #3. Graficar los pares (chisq( (j-1/2)/n, d.f.=p=2), ord.dists[j] ), donde el primer termino es el cuantil 100*(j-1/2)/n # de la distribucion chi-cuadrada con d.f.=p=2 grados de libertad: js <- seq(1:n); quant.vec <- qchisq(p=((js-0.5)/10),df=2); plot(quant.vec,ord.dists,pch=16,xlab="cuantiles de la distribucion Chi-cuadrada",ylab="distancias al cuadrado", main="grafica de distancias ji-cuadradas"); abline(a=0,b=1)