Último taller del semestre!

Usaremos los datos del siguiente sitio: Datos de Daniel Peña. Observe que para cada datos hay un fichero que explica la naturaleza de los datos.

Actividades

1. De la base de datos llamada EPF (Encuesta de Presupuestos Familiares), realice un preciso análisis de cluster, y luego determine en qué grupo ubicará a las siguientes ciudades que tienen los siguientes datos:
Las variables son: X1= alimentación, X2= vestido y calzado, X3= vivienda, X4= mobiliario doméstico, X5= gastos sanitarios, X6= transporte, X7= enseñanza y cultura, X8= turismo y ocio, X9= otros gastos.
Observación X1 X2 X3 X4 X5 X6 X7 X8 X9
1 472540 253161 651194 137718 74413 233207 110808 378928 85380
2 394344 223166 607295 114552 56113 302027 160256 320398 75660
3 516100 236506 415122 90537 100615 199641 47136 219969 112658
4 598677 227601 371927 152260 53012 303633 58158 446120 100055
5 592427 154495 466836 133252 62666 287540 109736 289340 59327
6 635210 198371 635263 112071 38142 313625 154709 365379 92652
7 321872 288122 622177 121639 23144 196929 151868 401493 92996
8 477825 242978 545979 137433 62960 318395 174132 341734 71993
9 584161 273946 354575 142158 70156 215385 105153 289160 94992
10 409623 207220 460693 150326 67973 261447 161665 288616 134967
11 441343 168537 478529 110640 42857 196077 137785 287212 113084
12 361324 311627 420932 101453 22043 201086 158207 339181 76822
13 348806 255741 441899 131570 45933 215042 89483 332772 95144
14 418349 220671 572603 156273 74582 205321 163821 231061 122496
15 434678 257397 506481 136297 52566 243646 109495 252679 103839
16 327125 155510 446705 121798 66451 353634 94788 340820 100243
17 451125 304447 427943 168259 50384 217273 122781 349223 105298
18 464235 136997 666805 173403 59582 197822 94780 351789 102073
19 507347 210798 599347 119961 56010 297106 126565 321262 123730
20 467320 403405 541883 158100 66485 218066 114616 251594 105602
2. De los datos del fichero INVEST sobre el número de publicaciones por área temática de países de la OCDE, realice un análisis de cluster, de manera de poder establecer en qué nivel pueden estar países de otros continentes. En particular, en que conglomerado estaría un país con la siguiente producción de publicaciones científicas:
INTER.A  INTER.F  AGRIC.  BIOLO.  MEDIC.   QUIMI.  INGEN.  FISICA  
91000 79851 13079 48104 25864 40134 11015 12288
142103 90332 30158 29802 59630 92725 7409 34349
102856 70811 13078 10758 25634 98926 12039 40538
118935 76186 13818 11253 49938 120065 9984 35792
71099 85047 10740 20337 41233 66087 11304 22093
62722 39459 14041 16722 23139 101900 15034 14645
52905 39734 7904 13444 31078 36322 8833 12300
46121 29236 12419 19863 12186 20641 4898 6299
19912 28036 6563 7548 13721 23029 3798 6775