/usr/share/gretl/gretlcmd.hlp.it is in gretl-common 1.9.14-2.
This file is owned by root:root, with mode 0o644.
The actual contents of the file can be viewed below.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 1056 1057 1058 1059 1060 1061 1062 1063 1064 1065 1066 1067 1068 1069 1070 1071 1072 1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1086 1087 1088 1089 1090 1091 1092 1093 1094 1095 1096 1097 1098 1099 1100 1101 1102 1103 1104 1105 1106 1107 1108 1109 1110 1111 1112 1113 1114 1115 1116 1117 1118 1119 1120 1121 1122 1123 1124 1125 1126 1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142 1143 1144 1145 1146 1147 1148 1149 1150 1151 1152 1153 1154 1155 1156 1157 1158 1159 1160 1161 1162 1163 1164 1165 1166 1167 1168 1169 1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180 1181 1182 1183 1184 1185 1186 1187 1188 1189 1190 1191 1192 1193 1194 1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207 1208 1209 1210 1211 1212 1213 1214 1215 1216 1217 1218 1219 1220 1221 1222 1223 1224 1225 1226 1227 1228 1229 1230 1231 1232 1233 1234 1235 1236 1237 1238 1239 1240 1241 1242 1243 1244 1245 1246 1247 1248 1249 1250 1251 1252 1253 1254 1255 1256 1257 1258 1259 1260 1261 1262 1263 1264 1265 1266 1267 1268 1269 1270 1271 1272 1273 1274 1275 1276 1277 1278 1279 1280 1281 1282 1283 1284 1285 1286 1287 1288 1289 1290 1291 1292 1293 1294 1295 1296 1297 1298 1299 1300 1301 1302 1303 1304 1305 1306 1307 1308 1309 1310 1311 1312 1313 1314 1315 1316 1317 1318 1319 1320 1321 1322 1323 1324 1325 1326 1327 1328 1329 1330 1331 1332 1333 1334 1335 1336 1337 1338 1339 1340 1341 1342 1343 1344 1345 1346 1347 1348 1349 1350 1351 1352 1353 1354 1355 1356 1357 1358 1359 1360 1361 1362 1363 1364 1365 1366 1367 1368 1369 1370 1371 1372 1373 1374 1375 1376 1377 1378 1379 1380 1381 1382 1383 1384 1385 1386 1387 1388 1389 1390 1391 1392 1393 1394 1395 1396 1397 1398 1399 1400 1401 1402 1403 1404 1405 1406 1407 1408 1409 1410 1411 1412 1413 1414 1415 1416 1417 1418 1419 1420 1421 1422 1423 1424 1425 1426 1427 1428 1429 1430 1431 1432 1433 1434 1435 1436 1437 1438 1439 1440 1441 1442 1443 1444 1445 1446 1447 1448 1449 1450 1451 1452 1453 1454 1455 1456 1457 1458 1459 1460 1461 1462 1463 1464 1465 1466 1467 1468 1469 1470 1471 1472 1473 1474 1475 1476 1477 1478 1479 1480 1481 1482 1483 1484 1485 1486 1487 1488 1489 1490 1491 1492 1493 1494 1495 1496 1497 1498 1499 1500 1501 1502 1503 1504 1505 1506 1507 1508 1509 1510 1511 1512 1513 1514 1515 1516 1517 1518 1519 1520 1521 1522 1523 1524 1525 1526 1527 1528 1529 1530 1531 1532 1533 1534 1535 1536 1537 1538 1539 1540 1541 1542 1543 1544 1545 1546 1547 1548 1549 1550 1551 1552 1553 1554 1555 1556 1557 1558 1559 1560 1561 1562 1563 1564 1565 1566 1567 1568 1569 1570 1571 1572 1573 1574 1575 1576 1577 1578 1579 1580 1581 1582 1583 1584 1585 1586 1587 1588 1589 1590 1591 1592 1593 1594 1595 1596 1597 1598 1599 1600 1601 1602 1603 1604 1605 1606 1607 1608 1609 1610 1611 1612 1613 1614 1615 1616 1617 1618 1619 1620 1621 1622 1623 1624 1625 1626 1627 1628 1629 1630 1631 1632 1633 1634 1635 1636 1637 1638 1639 1640 1641 1642 1643 1644 1645 1646 1647 1648 1649 1650 1651 1652 1653 1654 1655 1656 1657 1658 1659 1660 1661 1662 1663 1664 1665 1666 1667 1668 1669 1670 1671 1672 1673 1674 1675 1676 1677 1678 1679 1680 1681 1682 1683 1684 1685 1686 1687 1688 1689 1690 1691 1692 1693 1694 1695 1696 1697 1698 1699 1700 1701 1702 1703 1704 1705 1706 1707 1708 1709 1710 1711 1712 1713 1714 1715 1716 1717 1718 1719 1720 1721 1722 1723 1724 1725 1726 1727 1728 1729 1730 1731 1732 1733 1734 1735 1736 1737 1738 1739 1740 1741 1742 1743 1744 1745 1746 1747 1748 1749 1750 1751 1752 1753 1754 1755 1756 1757 1758 1759 1760 1761 1762 1763 1764 1765 1766 1767 1768 1769 1770 1771 1772 1773 1774 1775 1776 1777 1778 1779 1780 1781 1782 1783 1784 1785 1786 1787 1788 1789 1790 1791 1792 1793 1794 1795 1796 1797 1798 1799 1800 1801 1802 1803 1804 1805 1806 1807 1808 1809 1810 1811 1812 1813 1814 1815 1816 1817 1818 1819 1820 1821 1822 1823 1824 1825 1826 1827 1828 1829 1830 1831 1832 1833 1834 1835 1836 1837 1838 1839 1840 1841 1842 1843 1844 1845 1846 1847 1848 1849 1850 1851 1852 1853 1854 1855 1856 1857 1858 1859 1860 1861 1862 1863 1864 1865 1866 1867 1868 1869 1870 1871 1872 1873 1874 1875 1876 1877 1878 1879 1880 1881 1882 1883 1884 1885 1886 1887 1888 1889 1890 1891 1892 1893 1894 1895 1896 1897 1898 1899 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 2027 2028 2029 2030 2031 2032 2033 2034 2035 2036 2037 2038 2039 2040 2041 2042 2043 2044 2045 2046 2047 2048 2049 2050 2051 2052 2053 2054 2055 2056 2057 2058 2059 2060 2061 2062 2063 2064 2065 2066 2067 2068 2069 2070 2071 2072 2073 2074 2075 2076 2077 2078 2079 2080 2081 2082 2083 2084 2085 2086 2087 2088 2089 2090 2091 2092 2093 2094 2095 2096 2097 2098 2099 2100 2101 2102 2103 2104 2105 2106 2107 2108 2109 2110 2111 2112 2113 2114 2115 2116 2117 2118 2119 2120 2121 2122 2123 2124 2125 2126 2127 2128 2129 2130 2131 2132 2133 2134 2135 2136 2137 2138 2139 2140 2141 2142 2143 2144 2145 2146 2147 2148 2149 2150 2151 2152 2153 2154 2155 2156 2157 2158 2159 2160 2161 2162 2163 2164 2165 2166 2167 2168 2169 2170 2171 2172 2173 2174 2175 2176 2177 2178 2179 2180 2181 2182 2183 2184 2185 2186 2187 2188 2189 2190 2191 2192 2193 2194 2195 2196 2197 2198 2199 2200 2201 2202 2203 2204 2205 2206 2207 2208 2209 2210 2211 2212 2213 2214 2215 2216 2217 2218 2219 2220 2221 2222 2223 2224 2225 2226 2227 2228 2229 2230 2231 2232 2233 2234 2235 2236 2237 2238 2239 2240 2241 2242 2243 2244 2245 2246 2247 2248 2249 2250 2251 2252 2253 2254 2255 2256 2257 2258 2259 2260 2261 2262 2263 2264 2265 2266 2267 2268 2269 2270 2271 2272 2273 2274 2275 2276 2277 2278 2279 2280 2281 2282 2283 2284 2285 2286 2287 2288 2289 2290 2291 2292 2293 2294 2295 2296 2297 2298 2299 2300 2301 2302 2303 2304 2305 2306 2307 2308 2309 2310 2311 2312 2313 2314 2315 2316 2317 2318 2319 2320 2321 2322 2323 2324 2325 2326 2327 2328 2329 2330 2331 2332 2333 2334 2335 2336 2337 2338 2339 2340 2341 2342 2343 2344 2345 2346 2347 2348 2349 2350 2351 2352 2353 2354 2355 2356 2357 2358 2359 2360 2361 2362 2363 2364 2365 2366 2367 2368 2369 2370 2371 2372 2373 2374 2375 2376 2377 2378 2379 2380 2381 2382 2383 2384 2385 2386 2387 2388 2389 2390 2391 2392 2393 2394 2395 2396 2397 2398 2399 2400 2401 2402 2403 2404 2405 2406 2407 2408 2409 2410 2411 2412 2413 2414 2415 2416 2417 2418 2419 2420 2421 2422 2423 2424 2425 2426 2427 2428 2429 2430 2431 2432 2433 2434 2435 2436 2437 2438 2439 2440 2441 2442 2443 2444 2445 2446 2447 2448 2449 2450 2451 2452 2453 2454 2455 2456 2457 2458 2459 2460 2461 2462 2463 2464 2465 2466 2467 2468 2469 2470 2471 2472 2473 2474 2475 2476 2477 2478 2479 2480 2481 2482 2483 2484 2485 2486 2487 2488 2489 2490 2491 2492 2493 2494 2495 2496 2497 2498 2499 2500 2501 2502 2503 2504 2505 2506 2507 2508 2509 2510 2511 2512 2513 2514 2515 2516 2517 2518 2519 2520 2521 2522 2523 2524 2525 2526 2527 2528 2529 2530 2531 2532 2533 2534 2535 2536 2537 2538 2539 2540 2541 2542 2543 2544 2545 2546 2547 2548 2549 2550 2551 2552 2553 2554 2555 2556 2557 2558 2559 2560 2561 2562 2563 2564 2565 2566 2567 2568 2569 2570 2571 2572 2573 2574 2575 2576 2577 2578 2579 2580 2581 2582 2583 2584 2585 2586 2587 2588 2589 2590 2591 2592 2593 2594 2595 2596 2597 2598 2599 2600 2601 2602 2603 2604 2605 2606 2607 2608 2609 2610 2611 2612 2613 2614 2615 2616 2617 2618 2619 2620 2621 2622 2623 2624 2625 2626 2627 2628 2629 2630 2631 2632 2633 2634 2635 2636 2637 2638 2639 2640 2641 2642 2643 2644 2645 2646 2647 2648 2649 2650 2651 2652 2653 2654 2655 2656 2657 2658 2659 2660 2661 2662 2663 2664 2665 2666 2667 2668 2669 2670 2671 2672 2673 2674 2675 2676 2677 2678 2679 2680 2681 2682 2683 2684 2685 2686 2687 2688 2689 2690 2691 2692 2693 2694 2695 2696 2697 2698 2699 2700 2701 2702 2703 2704 2705 2706 2707 2708 2709 2710 2711 2712 2713 2714 2715 2716 2717 2718 2719 2720 2721 2722 2723 2724 2725 2726 2727 2728 2729 2730 2731 2732 2733 2734 2735 2736 2737 2738 2739 2740 2741 2742 2743 2744 2745 2746 2747 2748 2749 2750 2751 2752 2753 2754 2755 2756 2757 2758 2759 2760 2761 2762 2763 2764 2765 2766 2767 2768 2769 2770 2771 2772 2773 2774 2775 2776 2777 2778 2779 2780 2781 2782 2783 2784 2785 2786 2787 2788 2789 2790 2791 2792 2793 2794 2795 2796 2797 2798 2799 2800 2801 2802 2803 2804 2805 2806 2807 2808 2809 2810 2811 2812 2813 2814 2815 2816 2817 2818 2819 2820 2821 2822 2823 2824 2825 2826 2827 2828 2829 2830 2831 2832 2833 2834 2835 2836 2837 2838 2839 2840 2841 2842 2843 2844 2845 2846 2847 2848 | # add Tests
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--lm"> (effettua un test LM (solo OLS))
<@lit="--quiet"> (non mostra le stime del modello aumentato)
<@lit="--silent"> (non mostra nulla)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--both"> (aggiunge come regressore e come strumento, solo per TSLS)
Esempi: <@lit="add 5 7 9">
<@lit="add xx yy zz --quiet">
Va invocato dopo un comando di stima. Esegue un test congiunto per l'aggiunta delle variabili specificate all'ultimo modello stimato; si può avere accesso ai risultati del test tramite <@lit="$test"> e <@lit="$pvalue">.
Di default, aggiunge al modello precedente le variabili nella <@var="lista-variabili"> e stima il nuovo modello. Il test è un test di Wald sul modello aumentato, che rimpiazza quello originale come "ultimo modello" per quanto riguarda,ad esempio, il contenuto di <@lit="$uhat"> o test ulteriori.
Alternativamente, con l'opzione <@opt="--lm"> (disponibile solo per i modelli stimati via OLS), viene effettuato un test LM. Viene eseguita una regressione ausiliaria in cui la variabile dipendente è il residuo dell'ultimo modello e le variabili indipendenti sono quello del modello originale più <@var="lista-variabili">. Sotto l'ipotesi nulla che le variabili aggiuntive non hanno potere esplicativo, il prodotto fra l'R-quadro non aggiustato della regressione ausiliaria e il numero di osservazioni si distribuisce come una chi quadro con tanti gradi di libertà quante sono le variabili in <@var="lista-variabili">. In questo caso, il modello originale non viene rimpiazzato.
L'opzione <@opt="--both"> è specifica per le stime con i minimi quadrati a due stadi: essa indica che le nuove variabili vanno aggiunte sia alla lista dei regressori che a quella degli strumenti; di default, infatti, la <@var="lista-variabili"> viene aggiunta soltanto ai regressori.
Accesso dal menù: Finestra del modello, /Test/ADD - Aggiungi variabili
# adf Tests
Argomenti: <@var="ordine"> <@var="lista-variabili">
Opzioni: <@lit="--nc"> (test senza costante)
<@lit="--c"> (solo con la costante)
<@lit="--ct"> (con costante e trend)
<@lit="--ctt"> (con costante, trend e trend al quadrato)
<@lit="--seasonals"> (include variabili dummy stagionali)
<@lit="--gls"> (rimuove la media o il trend usando GLS)
<@lit="--verbose"> (mostra i risultati della regressione)
<@lit="--quiet"> (non mostra i risultati)
<@lit="--difference"> (usa la differenza prima della variabile)
<@lit="--test-down">[=<@var="criterio">] (ordine di ritardo automatico)
Esempi: <@lit="adf 0 y">
<@lit="adf 2 y --nc --c --ct">
<@lit="adf 12 y --c --test-down">
Vedi anche <@inp="jgm-1996.inp">
Le opzioni precedenti e la discussione seguente si riferiscono all'uso del comando <@lit="adf"> con serie storiche regolari. La discussione dell'uso con dati panel è esposta più avanti.
Calcola una serie di test Dickey–Fuller sulle variabili specificate, assumendo come ipotesi nulla che le variabili abbiano una radice unitaria. Se si usa l'opzione <@lit="--difference">, i test vengono condotti sulla differenza prima delle variabili e la discussione che segue va riferita a questa trasformazione delle variabili.
Per impostazione predefinita, vengono mostrate due varianti del test: una basata su una regressione che contiene solo una costante, e una che include la costante e un trend lineare. È possibile controllare le varianti specificando una o più opzioni.
In tutti i casi, la variabile dipendente è la differenza prima della variabile specificata, <@itl="y">, e la variabile dipendente più importante è il ritardo (di ordine uno) di <@itl="y">. Il modello è costruito in modo che il coefficiente della variabile ritardata <@itl="y"> è pari a 1 meno la radice. Ad esempio, il modello con una costante può essere scritto come
<@fig="adf1">
Sotto l'ipotesi nulla di radice unitaria il coefficiente della <@itl="y"> ritardata è nullo; sotto l'alternativa che <@itl="y"> sia stazionaria il coefficiente è negativo.
Se l'ordine di ritardi, <@itl="k">, è maggiore di 0, ai regressori di ognuna delle regressioni calcolate per il test saranno aggiunti <@itl="k"> ritardi della variabile dipendente. Se l'ordine è –1, <@itl="k"> è impostato secondo la raccomandazione di <@bib="Schwert (1989);schwert89">, ossia 12(<@itl="T">/100)<@sup="0.25">, dove <@itl="T"> è l'ampiezza campionaria. In tutti e due i casi, comunque, se si usa l'opzione <@opt="--test-down">, <@itl="k"> viene interpretato come ritardo massimo, mentre l'ordine di ritardo effettivamente usato viene ottenuto testando "all'indietro". Il criterio per effettuare il test all'indietro può essere selezionato usando il parametro opzionale e deve essere uno fra <@lit="MAIC">, <@lit="MBIC"> o <@lit="tstat">. I metodi MAIC e MBIC sono descritti in <@bib="Ng and Perron (2001);ng-perron01">; l'ordine dei ritardi viene scelto in modo da ottimizzare rispettivamente una versione modificata del Criterio di Informazione di Akaike o del Criterio Bayesiano di Schwartz. Il metodo MAIC è quello applicato di default quando non viene esplicitamente dichiarato un metodo. Il metodo tstat è il seguente:
<indent>
1. Stima la regressione Dickey–Fuller con <@itl="k"> ritardi della variabile dipendente.
</indent>
<indent>
2. Se questo ordine di ritardi è significativo, esegue il test con l'ordine di ritardo <@itl="k">. Altrimenti, prova il test con <@itl="k"> = <@itl="k"> – 1; se <@itl="k"> = 0, esegue il test con ordine di ritardo 0, altrimenti va al punto 1.
</indent>
Durante il punto 2 spiegato sopra, "significativo" significa che la statistica <@itl="t"> per l'ultimo ritardo abbia un <@itl="p">-value asintotico a due code per la distribuzione normale pari a 0.10 o inferiore.
L'opzione <@opt="--gls"> può essere usata insieme a una delle altre due opzioni <@opt="--c"> e <@opt="--ct"> (il modello con costante o quello con costante e trend). L'effetto di questa opzione è di rimuovere la media o il trend della variabile da testare, usando la procedura GLS suggerita da <@bib="Elliott, Rothenberg and Stock (1996);ERS96">, che fornisce un test di potenza maggiore rispetto a quell'approccio standard di Dickey–Fuller. Questa opzione non è compatibile con le opzioni <@lit="--nc">, <@lit="--ctt"> o <@lit="--seasonals">.
I <@itl="p-">value per questo test sono basati su MacKinnon (1996). Il codice rilevante è incluso per gentile concessione dell'autore. Nel caso del test con trend lineare usando la procedura GLS questi <@itl="P">-value non sono utilizzabili; vengono usati i valori critici contenuti nella Tabella 1 di <@bib="Elliott, Rothenberg and Stock (1996);ERS96">.
<@itl="Panel data">
Quando il comando <@lit="adf"> è usato con dati panel per calcolare un test panel di radici unitarie le opzioni applicabili sono leggermente diverse.
In primo luogo, mentre nel caso di serie storiche regolari è possibile indicare un elenco di variabili da testare, con dati panel ciascun comando può esaminare una sola variabile alla volta. Secondo, le opzioni che governano l'inclusione di trend deterministici diventano mutualmente esclusive: è necessario scegliere fra il caso senza costante, quello con solo la costante, e quello che la costante e il trend; il default è il secondo. L'opzione <@opt="--seasonals">, inoltre, non è disponibile. Terzo, l'opzione <@opt="--verbose"> ha un significato diverso: produce un breve resoconto del test per ciascuna singola serie storica (il default prevede di mostrare solo il risultato complessivo).
Il test complessivo (ipotesi nulla: la variabile in questione ha una radice unitaria per tutte le unità panel) viene calcolata in uno o in entrambi i modi disponibili: usando il metodo di <@bib="Im, Pesaran and Shin (Journal of Econometrics, 2003);IPS03"> oppure quello di <@bib="Choi (Journal of International Money and Finance, 2001);choi01">.
Accesso dal menù: /Variabile/Test Dickey-Fuller aumentato
# anova Statistics
Argomenti: <@var="response"> <@var="treatment"> [ <@var="block"> ]
Opzione: <@lit="--quiet"> (non stampare i risultati)
Analisi della varianza: <@var="response"> è una serie che misura un effetto di interesse e <@var="treatment"> deve essere una variabile discreta che identifica due o più tipi di trattamento (o non trattamento). Nel caso dell'ANOVA a due vie, la variabile <@var="block"> (anch'essa discreta) identifica i valori di qualche variabile di controllo.
Se non è stata selezionata l'opzione <@opt="--quiet">, questo comando stampa una tabella che mostra le somme e le medie dei quadrati, nonché un test <@itl="F">. Il test <@itl="F"> e il suo <@itl="p-">value possono essere recuperati rispettivamente con gli accessori <@lit="$test"> e <@lit="$pvalue">.
L'ipotesi nulla del test <@itl="F"> è che la risposta media sia invariante rispetto al tipo di trattamento; in altre parole, che il trattamento non abbia alcun effetto. Formalmente, la validità del test richiede che la varianza della risposta sia la stessa per tutti i tipi di trattamento.
Si noti che i risultati prodotti da questo comando costituiscono in realtà un sottoinsieme dell'informazione fornita dalla procedura seguente, facilmente implementabile in gretl. Create un insieme di variabili dummy associate a tutti i tipi di trattamento, tranne uno. Nel caso dell'ANOVA a due vie, create anche un insieme di variabili dummy associate a tutti i "blocchi", tranne uno. Una volta fatto questo, regredite <@var="response"> su una costante e le dummy usando <@ref="ols">. Per un'analisi a una via la tabella ANOVA può essere creata ricorrendo all'opzione <@opt="--anova"> del comando <@lit="ols">. Nel caso di un'analisi a due vie il test <@itl="F"> può essere calcolato usando il comando <@ref="omit">. Per esempio, se assumiamo che <@lit="y"> sia la risposta, <@lit="xt"> identifichi il trattamento e <@lit="xb"> identifichi i blocchi:
<code>
# analisi a una via
list dxt = dummify(xt)
ols y 0 dxt --anova
# analisi a due vie
list dxb = dummify(xb)
ols y 0 dxt dxb
# test di significatività congiunta di dxt
omit dxt --quiet
</code>
Accesso dal menù: /Model/Other linear models/ANOVA
# append Dataset
Argomento: <@var="file-dati">
Opzione: <@lit="--time-series"> (si veda oltre)
Apre un file di dati e aggiunge il suo contenuto al dataset attuale, se i nuovi dati sono compatibili. Il programma cerca di riconoscere il formato del file di dati (interno, testo semplice, CSV, Gnumeric, Excel, ecc.).
I dati aggiunti possono avere la forma di osservazioni aggiuntive su variabili già presenti nel dataset, o di nuove variabili. In quest'ultimo caso occorre che il numero delle nuove osservazioni sia pari a quello delle osservazioni presenti nel dataset, oppure che i nuovi dati includano informazioni precise sulle osservazioni in modo che gretl possa capire come aggiungere i valori.
Nel caso di aggiunta di dati a un dataset panel, c'è una possibilità speciale. Detti <@itl="n"> il numero di unità cross-section, <@itl="T"> il numero di periodi temporali, e <@itl="m"> il numero di nuove osservazioni da aggiungere. Se <@itl="m = n"> i nuovi dati saranno considerati invarianti nel tempo, e saranno copiati per ognuno dei periodi temporali. D'altra parte, se <@itl="m = T"> i dati saranno trattati come invarianti tra le unità. Se il panel è "quadrato", ed <@itl="m"> è pari sia ad <@itl="n"> che a <@itl="T">, il comportamento predefinito consiste nel trattare i nuovi casi come invarianti nel tempo, ma è possibile forzare l'interpretazione dei nuovi dati come serie storiche usando l'opzione <@lit="--time-series"> (che verrà ignorata in tutti gli altri casi).
Vedi anche <@ref="join"> per una gestione più sofisticata di più di un file di dati esterno.
Accesso dal menù: /File/Aggiungi dati
# ar Estimation
Argomenti: <@var="ritardi"> ; <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzione: <@lit="--vcv"> (mostra la matrice di covarianza)
Esempio: <@lit="ar 1 3 4 ; y 0 x1 x2 x3">
Calcola le stime parametriche usando la procedura iterativa generalizzata di Cochrane–Orcutt (si veda il Capitolo 9.5 di <@bib="Ramanathan (2002);ramanathan02">. La procedura termina quando le somme dei quadrati degli errori consecutivi non differiscono per più dello 0.005 per cento, oppure dopo 20 iterazioni.
<@var="ritardi"> è una lista di ritardi nei residui, conclusa da un punto e virgola. Nell'esempio precedente, il termine di errore è specificato come
<@fig="arlags">
Accesso dal menù: /Modello/Serie storiche/AR - Stima autoregressiva
# ar1 Estimation
Argomenti: <@var="depvar"> <@var="indepvars">
Opzioni: <@lit="--hilu"> (usa la procedura di Hildreth–Lu)
<@lit="--pwe"> (usa lo stimatore di Prais–Winsten)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--no-corc"> (non affinare i risultati con Cochrane-Orcutt)
Esempi: <@lit="ar1 1 0 2 4 6 7">
<@lit="ar1 y 0 xlist --hilu --no-corc">
<@lit="ar1 y 0 xlist --pwe">
Calcola stime feasible GLS per un modello in cui il termine di errore segue un processo autoregressivo del prim'ordine.
Il metodo predefinito è la procedura iterativa di Cochrane–Orcutt (si veda ad esempio il capitolo 9.4 di Ramanathan, 2002). La procedura termina quando le stime successive del coefficiente di autocorrelazione non differiscono per più di 0.001, oppure dopo 20 iterazioni.
Se si usa l'opzione <@lit="--hilu">, verrà usata la procedura di ricerca di Hildreth–Lu. I risultati sono quindi ottimizzati con la procedura iterativa di Cochrane–Orcutt, a meno che non si usi l'opzione <@lit="--no-corc"> (che viene ignorata se non viene specificata <@lit="--hilu">).
Se si usa l'opzione <@lit="--pwe">, viene usato lo stimatore di Prais–Winsten, che prevede una procedura simile a quella di Cochrane–Orcutt; la differenza è che mentre Cochrane–Orcutt tralascia la prima osservazione, Prais–Winsten ne fa uso. Per i dettagli, si veda per esempio il capitolo 13 di <@itl="Econometric Analysis"> (2000) di Greene.
Accesso dal menù: /Modello/Serie storiche/Cochrane-Orcutt
Accesso dal menù: /Modello/Serie storiche/Hildreth-Lu
Accesso dal menù: /Modello/Serie storiche/Prais-Winsten
# arbond Estimation
Argomento: <@var="p"> [ <@var="q"> ] ; <@var="variabile-dipendente"> <@var="variabili-indipendenti"> [ ; <@var="strumenti"> ]
Opzioni: <@lit="--quiet"> (non mostra il modello stimato)
<@lit="--vcv"> (mostra matrice di covarianza)
<@lit="--two-step"> (usa stima GMM 2-step)
<@lit="--time-dummies"> (aggiunge variabili dummy temporali)
<@lit="--asymptotic"> (calcola gli errori standard asintotici nel modo standard)
Esempi: <@lit="arbond 2 ; y Dx1 Dx2">
<@lit="arbond 2 5 ; y Dx1 Dx2 ; Dx1">
<@lit="arbond 1 ; y Dx1 Dx2 ; Dx1 GMM(x2,2,3)">
Vedi anche <@inp="arbond91.inp">
Esegue la stima di modelli panel dinamici (ossia, modelli panel che includono uno o più ritardi della variabile dipendente) usando il metodo GMM proposto da <@bib="Arellano and Bond (1991);arellano-bond91">. Vedi, tuttavia, il comando <@ref="dpanel"> per una alternativa più avanzata e più flessibile, che offre lo stimatore GMM-SYS oltre al GMM-DIF.
Il parametro <@var="p"> rappresenta l'ordine dell'autoregressione per la variabile dipendente. Il parametro opzionale <@var="q"> indica il massimo ritardo del livello della variabile dipendente da usare come strumento; se si omette questo argomento, o lo si pone uguale a 0, vengono usati tutti i ritardi disponibili.
La variabile dipendente andrebbe specificata in livelli; viene differenziata automaticamente, visto che lo stimatore usa la differenziazione per eliminare gli effetti individuali. Le variabili indipendenti invece non vengono differenziate automaticamente: se si intende usare le differenze (tipicamente lo si vorrà fare per le variabili quantitative, ma non ad esempio per le dummy temporali), occorrerà prima creare le variabili differenziate e poi specificarle come regressori.
L'ultimo campo (opzionale) del comando consente di specificare gli strumenti. Se non viene usato, si assumerà che tutte le variabili indipendenti sono strettamente esogene. Se si specifica uno strumento, occorre includere nell'elenco tutte le variabili indipendenti strettamente esogene. Per i regressori predeterminati, è possibile usare la funzione <@lit="GMM"> per includere un intervallo specifico di ritardi in stile "diagonale". Questo modo di procedere è illustrato nel terzo esempio visto sopra. Il primo argomento di <@lit="GMM"> è il nome della variabile in questione, il secondo è il ritardo minimo da usare, mentre il terzo è quello massimo. Se il terzo argomento è pari a 0, vengono usati tutti i ritardi disponibili.
Per impostazione predefinita, vengono mostrati i risultati della stima a un passo (con errori standard robusti), ma è possibile scegliere una stima a due passi. In entrambi i casi, vengono mostrati i testi per l'autocorrelazione di ordine 1 e 2, oltre al test di sovraidentificazione di Sargan. Si noti che in questo modello differenziato l'autocorrelazione del prim'ordine non contrasta con la validità del modello, mentre quella di ordine 2 viola le ipotesi statistiche che ne sono alla base.
Nel caso della stima in due passi, gli errori standard sono calcolati usando la correzione per campioni finiti suggerita da<@bib="Windmeijer (2005);windmeijer05">. Gli errori standard asintotici calcolati nel modo consueto non sono generalmente ritenuti affidabili nel caso dello stimatore a due passi, ma se per qualche motivo si vuole usarli, è possibile usare l'opzione <@lit="--asymptotic"> per disabilitare la correzione di Windmeijer.
Se si usa l'opzione <@lit="--time-dummies">, viene aggiunto ai regressori un insieme di variabili dummy temporali. Il numero di variabili dummy è pari al numero massimo dei periodi usati nella stima meno uno, per evitare la perfetta collinearità in presenza della costante. Le dummy sono specificate in livelli; se si intende usare variabili dummy sotto forma di differenze temporali, occorre definirle ed aggiungerle manualmente.
Accesso dal menù: /Model/Panel
# arch Estimation
Argomenti: <@var="ordine"> <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Esempio: <@lit="arch 4 y 0 x1 x2 x3">
Questo comando è attualmente mantenuto per ragioni di compatibilità con le versioni precedenti, ma è preferibile usare lo stimatore di massima verosimiglianza disponibile mediante il comando <@ref="garch">; per un modello ARCH puro, fissate a 0 il primo parametro GARCH.
Stima il modello specificato tenendo conto della possibile eteroschedasticità condizionale autoregressiva (ARCH, Autoregressive Conditional Heteroskedasticity). Per prima cosa il modello viene stimato con OLS, quindi viene eseguita una regressione ausiliaria, in cui i quadrati dei residui della prima regressione vengono regrediti sui loro valori ritardati. Il passo finale è una stima con minimi quadrati ponderati, in cui i pesi sono i reciproci delle varianze dell'errore della regressione ausiliaria (se la varianza prevista di qualche osservazione nella regressione ausiliaria non risulta positiva, viene usato il corrispondente residuo al quadrato).
I valori <@lit="alpha"> mostrati sotto i coefficienti sono i parametri del processo ARCH stimati nella regressione ausiliaria.
Si veda anche <@ref="garch"> e <@ref="modtest"> (l'opzione <@lit="--arch">).
Accesso dal menù: /Modello/Serie storiche/ARCH
# arima Estimation
Argomenti: <@var="p"> <@var="d"> <@var="q"> [ ; <@var="P"> <@var="D"> <@var="Q"> ] <@var="variabile-dipendente"> ; [ <@var="variabili-indipendenti"> ]
Opzioni: <@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--hessian"> (si veda sotto)
<@lit="--opg"> (si veda sotto)
<@lit="--nc"> (non include l'intercetta)
<@lit="--conditional"> (usa la massima verosimiglianza condizionale)
<@lit="--x-12-arima"> (usa X-12-ARIMA per la stima)
<@lit="--lbfgs"> (usa il massimizzatore L-BFGS-B)
<@lit="--y-diff-only"> (speciale per ARIMAX, si veda sotto)
<@lit="--save-ehat"> (si veda sotto)
Esempi: <@lit="arima 1 0 2 ; y">
<@lit="arima 2 0 2 ; y 0 x1 x2 --verbose">
<@lit="arima 0 1 1 ; 0 1 1 ; y --nc">
Se non viene fornita una lista di <@var="variabili-indipendenti">, stima un modello autoregressivo integrato a media mobile (ARIMA: Autoregressive, Integrated, Moving Average) univariato. I valori <@var="p">, <@var="d"> e <@var="q"> rappresentano rispettivamente gli ordini dei termini autoregressivi (AR), l'ordine di differenziazione, e quello dei termini a media mobile (MA). Questi valori possono essere indicati in forma numerica o con i nomi di variabili scalari preesistenti. Ad esempio, un valore <@var="d"> pari a 1 significa che prima di stimare i parametri ARMA occorre prendere la differenza della variabile dipendente.
Se si vuole includere solo alcuni specifici ritardi AR o MA (invece che tutti i ritardi fino all'ordine specificato) è possibile sostituire <@var="p"> e/o <@var="q"> in due modi: col nome di una matrice predefinita che contiene un insieme di valori interi, oppure con un'espressione come <@lit="{1 4}">, ossia un insieme di ritardi separati da spazi e racchiusi tra parentesi graffe.
I valori interi opzionali <@var="P">, <@var="D"> e <@var="Q"> rappresentano rispettivamente, l'ordine dei termini AR stagionali, l'ordine di differenziazione stagionale e l'ordine dei termini MA stagionali. Essi sono rilevanti solo la frequenza dei dati è superiore a 1 (ad esempio, dati trimestrali o mensili). Questi valori devono essere indicati in forma numerica o come variabili scalari.
Nel caso univariato la scelta predefinita include un'intercetta nel modello, ma questa può essere soppressa con l'opzione <@lit="--nc">. Se vengono aggiunte delle <@var="variabili-indipendenti">, il modello diventa un ARMAX: in questo caso occorre indicare esplicitamente la costante se si desidera un'intercetta (come nel secondo degli esempi proposti).
È disponibile una sintassi alternativa per questo comando: se non si intende applicare alcuna operazione di differenziazione (stagionale o non stagionale), è possibile omettere totalmente i termini <@var="d"> e <@var="D">, invece che impostarli esplicitamente pari a 0. Inoltre, <@lit="arma"> è un sinonimo di <@lit="arima">, quindi ad esempio il comando seguente è un modo valido per specificare un modello ARMA(2,1):
<code>
arma 2 1 ; y
</code>
Il funzionamento predefinito utilizza la funzionalità ARMA "interna" di gretl, che usa la stima di massima verosimiglianza esatta usando il filtro di Kalman; come opzione è possibile usare la stima di massima verosimiglianza condizionale. Se è stato installato il programma X-12-ARIMA è possibile usare questo al posto del codice interno di gretl. Per i dettagli su queste opzioni si veda la <@pdf="la guida all'uso di gretl">.
Quando si usa il codice ARMA interno, le deviazioni standard sono stimate basandosi su un'approssimazione numerica all'inversa negativa dell'Hessiana, passando automaticamente al prodotto esterno del gradiente (OPG) in caso di problemi numerici. Se si usa l'opzione <@lit="--opg"> il prodotto esterno del gradiente viene usato in ogni caso. L'opzione <@lit="--hessian">, invece, disabilita il passaggio automatico all'OPG in caso di problemi. Si noti, peraltro, che l'impossibilità di calcolare numericamente l'hessiana è per solito indice di un modello mal specificato.
L'opzione <@opt="--lbfgs"> è riservata alla stima basata su codice ARMA nativo e MV esatta; quando viene indicata, la stima usa l'algoritmo L-BFGS a "memoria limitata" anziché l'ottimizzatore BFGS consueto. Questa variante può essere utile in alcune situazioni nelle quali la convergenza all'ottimo è problematica.
L'opzione <@opt="--y-diff-only"> è riservata alla stima di modelli ARIMAX (modelli con ordine di integrazione non nullo e che includono regressori esogeni), e si applica solo con la stima di MV esatta nativa di gretl. Per questi modelli il comportamento di default consiste nel differenziare sia la variabile dipendente che i regressori, ma quando viene indicata questa opzione viene differenziata solo la variabile dipendente, mentre i regressori restano nei livelli.
L'opzione <@opt="--save-ehat"> è applicabile solo alla stima nativa di MV esatta. Il suo effetto è quello di rendere disponibile un vettore contenente la stima ottimale alla data <@itl="t"> del disturbo o innovazione alla stessa data: questo valore può essere recuperato grazie all'accessore <@lit="$ehat">. Questi valori sono diversi dalla variabile dei residui (<@lit="$uhat">) che contiene gli errori di previsione un passo in avanti.
Il valore AIC mostrato nei modelli ARIMA è calcolato secondo la definizione usata in X-12-ARIMA, ossia
<@fig="aic">
dove <@fig="ell"> è la log-verosimiglianza e <@itl="k"> è il numero totale di parametri stimati. Si noti che X-12-ARIMA non produce criteri di informazione come l'AIC quando la stima è effettuata col metodo della massima verosimiglianza condizionale.
Le radici AR e MA mostrate in occasione delkla stima ARMA sono basate sulla seguente rappresentazione di un processo ARMA(p,q):
<mono>
(1 - a_1*L - a_2*L^2 - ... - a_p*L^p)Y =
c + (1 + b_1*L + b_2*L^2 + ... + b_q*L^q) e_t
</mono>
Di conseguenza le radici AR sono la soluzione di
<mono>
1 - a_1*z - a_2*z^2 - ... - a_p*L^p = 0
</mono>
e la stazionarietà del processo richiede che queste radici si trovino al di fuori del cerchio di raggio unitario.
Il valore di "frequenza" mostrato insieme alle radici AR e MA è il valore di λ che risolve <@itl="z"> = <@itl="r"> * exp(i*2*π*λ)dove <@itl="z"> è la radice in questione e <@itl="r"> è il suo modulo.
Accesso dal menù: /Modello/Serie Storiche/ARIMA
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
# biprobit Estimation
Argomenti: <@var="depvar1"> <@var="depvar2"> <@var="indepvars1"> [ ; <@var="indepvars2"> ]
Opzioni: <@lit="--vcv"> (stampa la matrice di covarianze)
<@lit="--robust"> (errori standard robusti)
<@lit="--cluster">=<@var="clustvar"> (vedi <@ref="logit"> per una spiegazione)
<@lit="--opg"> (vedi sotto)
<@lit="--save-xbeta"> (vedi sotto)
<@lit="--verbose"> (stampa informazione extra)
Esempi: <@lit="biprobit y1 y2 0 x1 x2">
<@lit="biprobit y1 y2 0 x11 x12 ; 0 x21 x22">
Vedi anche <@inp="biprobit.inp">
Stima un modello probit bivariato massimizzando la verosimiglianza con il metodo di Newton–Raphson.
L'elenco degli argomenti inizia con due variabili dipendenti (binarie), seguite da una lista di regressori. Un'eventuale seconda lista, separata dalla precedente da un punto e virgola, viene interpretata come contenente l'insieme dei regressori specifici alla seconda equazione, mentre <@var="indepvars1"> è specifica alla prima equazione; in caso contrario il comando assume che <@var="indepvars1"> rappresenti un insieme di regressori comuni alle due equazioni.
Per default, gli errori standard sono calcolati usando un'approssimazione numerica dell'Hessiana calcolata in corrispondenza delle stime dei parametri. L'opzione <@opt="--opg"> permette di stimare la matrice di covarianza usando il prodotto esterno del gradiente (Outer Product of the Gradient, OPG); l'opzione <@opt="--robust"> permette di calcolare gli standard error QML a partire dalla matrice di covarianza "sandwich" che usa sia l'inversa dell'Hessiana che la matrice OPG.
Una volta completata con successo la stima, l'accessore <@lit="$uhat"> consente di recuperare una matrice di due colonne contenente i residui generalizzati delle due equazioni; in altre parole, i valori attesi degli errori condizionali ai valori osservati delle variabili dipendenti e delle covariate. Di default <@lit="$yhat"> restituisce una matrice di quattro colonne contenente le stime delle probabilità dei quattro possibili esiti congiunti per (<@itl="y"><@sub="1">, <@itl="y"><@sub="2">), nell'ordine (1,1), (1,0), (0,1), (0,0). In alternativa, se il comando è seguito dall'opzione <@opt="--save-xbeta"> , <@lit="$yhat"> ha due colonne contenenti i valori delle funzioni indice delle rispettive equazioni.
L'output comprende un test del rapporto di verosimiglianza dell'ipotesi nulla che gli errori delle due equazioni siano incorrelati fra loro.
# boxplot Graphs
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--notches"> (mostra l'intervallo di confidenza al 90 per cento per la mediana)
<@lit="--factorized"> (vedi sotto)
<@lit="--panel"> (vedi sotto)
<@lit="--matrix">=<@var="name"> (opera su colonne di una matrice)
<@lit="--output">=<@var="filename"> (manda l'output a un file specificato)
Questo tipo di grafici (da Tukey e Chambers) mostra la distribuzione di una variabile. La "scatola" centrale (box) racchiude il 50 per cento centrale dei dati, ossia è delimitato dal primo e terzo quartile. I "baffi" (whiskers) si estendono fino ai valori minimo e massimo. Una linea trasversale sulla scatola indica la mediana, mentre un segno "+" indica la media. Se viene selezionata l'opzione di mostrare un intervallo di confidenza per la mediana, quetso viene calcolato via bootstrap e mostrato sotto forma di lnee tratteggiate orizzontali sopra e sotto la mediana.
L'opzione "factorized" permette di esaminare la distribuzione di una variabile condizionata ai valori di un fattore discreto. Ad esempio, se un dataset contiene salari e una variable binaria per il genere, si può scegliere di analizzare la distribuzione del salario condizionata al genere e visualizzare boxplot dei salri per i maschi e per le femmine uno di fianco all'altro, come ad esempio
<code>
boxplot wage gender --factorized
</code>
Si noti che, in questo caso, bisogna specificare esattamente due variabili, col fattore per secondo.
Se il dataset corrente è un panel ed è stata specificata una sola variabile, l'opzione <@opt="--panel"> produce una serie di grafici boxplot affiancati, uno per ogni "unità" o gruppo panel.
In generale l'argomento <@var="varlist"> è necessario e deve indicare una o più variabili nel dataset corrente (usando il nome o il numero di ID). Se viene fornita una matrice usando l'opzione <@opt="--matrix">, tuttavia, questo argomento diventa opzionale: di default viene mostrato un grafico per ciascuna delle colonne della matrice specificata.
Il grafici boxplot di gretl sono generati usando gnuplot, ed è possibile arricchire il grafico specificando altri comandi gnuplot, includendoli fra parentesi graffa. Per maggiori dettagli consultate per favore l'help del comando <@ref="gnuplot">.
In modalità interattiva il risultato viene mostrato immediatamente. In batch il comportamento di default di gretl è di scrivere nella directory di lavoro dell'utente un file di comandi gnuplot chiamato <@lit="gpttmpN.plt">, iniziando da N = <@lit="01">. I grafici veri e propri possono essere generati in seguito usando gnuplot (in MS Windows, wgnuplot). Questo comportamento può essere modificato usando l'opzione <@opt="--output="><@var="filename">. Per ulteriori dettagli, si veda il comando <@ref="gnuplot">.
Accesso dal menù: /Visualizza/Grafico/Boxplot
# break Programming
Esce da un ciclo. Questo comando può essere usato solo all'interno di un ciclo e causa l'immediata interruzione dell'esecuzione del ciclo (o di quello più interno, nel caso di cicli nidificati). Si veda anche il comando <@ref="loop">.
# catch Programming
Sintassi:
<@lit="catch"> <@var="command">
Non si tratta di un vero e proprio comando, quanto piuttosto di un prefisso applicabile alla maggior parte dei comandi consueti; il suo effetto è quello di prevenire l'interruzione di uno script nel caso in cui si verifichi un errore nell'esecuzione di un comando. Un eventuale errore viene registrato in un codice d'errore interno cui è possibile accedere con <@lit="$error"> (un valore nullo indica che l'esecuzione ha avuto successo). Il valore di <@lit="$error"> dovrebbe sempre essere controllato subito dopo aver usato <@lit="catch">, in modo da adottare le misure più opportune nel caso in cui il comando non dovesse aver avuto successo.
<@lit="catch"> non può essere usato prima di <@lit="if">, <@lit="elif"> o <@lit="endif">.
# chow Tests
Argomento: <@var="osservazione">
Opzione: <@lit="--quiet"> (non mostra le stime del modello aumentato)
Esempi: <@lit="chow 25">
<@lit="chow 1988:1">
Va eseguito dopo una regressione OLS e fornisce un test per l'ipotesi nulla che non esista un break strutturale del modello in corrispondenza del punto di rottura specificato. La procedura consiste nel creare una variabile dummy che vale 1 a partire dal punto di rottura specificato da <@var="osservazione"> fino alla fine del campione, 0 altrove; inoltre vengono creati dei termini di interazione tra questa dummy e i regressori originali. Viene quindi stimata una regressione che include questi termini.
Per impostazione predefinita viene calcolata una statistica <@itl="F">, prendendo la regressione aumentata come non vincolata e la regressione originale come vincolata. Se il modello originale usa uno stimatore robusto per la matrice di covarianza, come statistica test viene usato un valore chi-quadro di Wald, basato su uno stimatore robusto della matrice di covarianza della regressione aumentata.
Accesso dal menù: Finestra del modello, /Test/CHOW
# clear Programming
Opzioni: <@lit="--dataset"> (cancella solo il dataset)
<@lit="--other"> (cancella tutto fuorché il dataset)
Senza alcuna opzione, cancella dalla memoria tutti gli oggetti salvati, compreso l'eventuale campione corrente. Si noti che anche aprire un nuovo dataset o usare il comando <@lit="nulldata"> per creare un dataset vuoto ha lo stesso effetto; per questo motivo di solito non è necessario usare <@lit="clear">.
Con l'opzione <@opt="--dataset"> viene cancellato dalla memoria solo il dataset; tutti gli altri oggetti, come matrici e scalari salvati in precedenza, vengono conservati.
# coeffsum Tests
Argomento: <@var="lista-variabili">
Esempio: <@lit="coeffsum xt xt_1 xr_2">
Vedi anche <@inp="restrict.inp">
Deve essere usato dopo una regressione. Calcola la somma dei coefficienti delle variabili nella <@var="lista-variabili"> e ne mostra l'errore standard e il p-value per l'ipotesi nulla che la loro somma sia zero.
Si noti la differenza tra questo test e <@ref="omit">, che assume come ipotesi nulla l'uguaglianza a zero di <@itl="tutti"> i coefficienti di un gruppo di variabili indipendenti.
Accesso dal menù: Finestra del modello, /Test/Somma dei coefficienti
# coint Tests
Argomenti: <@var="ordine"> <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--nc"> (non include la costante)
<@lit="--ct"> (include la costante e il trend)
<@lit="--ctt"> (include la costante e il trend quadratico)
<@lit="--skip-df"> (non esegue i test DF sulle variabili individuali)
<@lit="--test-down"> (scelta automatica dell'ordine dei ritardi)
<@lit="--verbose"> (mostra dettagli extra sulle regressioni)
Esempi: <@lit="coint 4 y x1 x2">
<@lit="coint 0 y x1 x2 --ct --skip-df">
Test di cointegrazione di Engle–Granger. La procedura predefinita è la seguente: (1) eseguire dei test Dickey–Fuller aumentati, sull'ipotesi nulla che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare la regressione di cointegrazione; (3) eseguire un test DF sui residui della regressione di cointegrazione. Se si usa l'opzione <@lit="--skip-df">, il passo (1) viene saltato.
Se l'ordine di ritardo specificato è positivo, tutti i test Dickey–Fuller utilizzano questo ordine. Se l'ordine indicato viene preceduto da un segno meno, viene interpretato come l'ordine massimo, e l'ordine utilizzato effettivamente viene ricavato con la stessa procedura di test "all'indietro" descritta per il comando <@ref="adf">.
L'impostazione predefinita consiste nell'includere una costante nella regressione di cointegrazione; se si vuole omettere la costante, basta usare l'opzione <@lit="--nc">. Se si vuole aggiungere all'elenco dei termini deterministici della regressione un trend lineare o quadratico, basta usare le opzioni <@lit="--ct"> o <@lit="--ctt">. Queste opzioni sono mutualmente esclusive.
Test di cointegrazione di Engle–Granger. La procedura predefinita è la seguente: (1) eseguire dei test Dickey–Fuller aumentati, sull'ipotesi nulla che ognuna delle variabili elencate abbia una radice unitaria; (2) stimare la regressione di cointegrazione; (3) eseguire un test DF sui residui della regressione di cointegrazione. Se si attiva la casella <@lit="Salta i test DF iniziali">, il passo (1) viene saltato.
I <@itl="pvalue"> per questo test si basano su MacKinnon (1996). Il codice relativo è stato incluso per gentile concessione dell'autore.
Accesso dal menù: /Modello/Serie storiche/Test di cointegrazione/Engle-Granger
# coint2 Tests
Argomenti: <@var="ordine"> <@var="lista-y"> [ ; <@var="lista-x"> ] [ ; <@var="lista-rx"> ]
Opzioni: <@lit="--nc"> (senza costante)
<@lit="--rc"> (costante vincolata)
<@lit="--uc"> (costante non vincolata)
<@lit="--crt"> (costante e trend vincolato)
<@lit="--ct"> (costante e trend non vincolato)
<@lit="--seasonals"> (include dummy stagionali centrate)
<@lit="--asy"> (registra i p-value asintotici)
<@lit="--silent"> (non mostra nulla)
<@lit="--quiet"> (mostra solo i test)
<@lit="--verbose"> (mostra i dettagli delle regressioni ausiliarie)
Esempi: <@lit="coint2 2 y x">
<@lit="coint2 4 y x1 x2 --verbose">
<@lit="coint2 3 y x1 x2 --rc">
Esegue il test di Johansen per la cointegrazione tra le variabili della <@var="lista-y"> per l'ordine specificato di ritardi. Per dettagli, si veda <@pdf="la guida all'uso di gretl"> oppure <@bib="Hamilton (1994);hamilton94">, capitolo 20. I valori critici sono calcolati con l'approssimazione gamma di J. Doornik (Doornik, 1998). Per il test traccia, vengono formiti due set di valori critici: asintotici e aggiustati per l'ampiezza campionaria. Di default, l'accessore <@lit="$pvalue"> riporta la variante aggiustata, ma i valori asintotici possono essere ottenuti usando l'opzione <@opt="--asy">
L'inclusione di trend deterministici nel modello è controllata dalle opzioni del comando. Se non si indica alcuna opzione, viene inclusa una "costante non vincolata", che permette la presenza di un'intercetta diversa da zero nelle relazioni di cointegrazione e di un trend nei livelli delle variabili endogene. Nella letteratura originata dal lavoro di Johansen (si veda ad esempio il suo libro del 1995), si fa riferimento a questo come al "caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di questi casi e i criteri per scegliere tra di essi sono spiegati nella <@pdf="la guida all'uso di gretl">.
Le liste opzionali <@var="lista-x"> e <@var="lista-rx"> permettono di controllare per specifiche variabili esogene che entrano nel sistema in modo non vincolato (<@var="lista-x">) o vincolate allo spazio di cointegrazione (<@var="lista-rx">). Queste liste vanno separate tra di loro e dalla <@var="lista-y"> usando il carattere punto e virgola.
L'opzione <@lit="--seasonals">, che può accompagnare una qualsiasi delle altre opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.
La tabella seguente fornisce un esempio di interpretazione dei risultati del test nel caso di 3 variabili. <@lit="H0"> denota l'ipotesi nulla, <@lit="H1"> l'ipotesi alternativa e <@lit="c"> il numero delle relazioni di cointegrazione.
<code>
Rango Test traccia Test Lmax
H0 H1 H0 H1
---------------------------------------
0 c = 0 c = 3 c = 0 c = 1
1 c = 1 c = 3 c = 1 c = 2
2 c = 2 c = 3 c = 2 c = 3
---------------------------------------
</code>
Si veda anche il comando <@ref="vecm">.
Accesso dal menù: /Modello/Serie storiche/Test di cointegrazione/Johansen
# corr Statistics
Argomento: [ <@var="lista-variabili"> ]
Opzioni: <@lit="--uniform"> (assicura l'uniformità del campione)
<@lit="--spearman"> (Rho di Spearman)
<@lit="--kendall"> (Tau di Kendall)
<@lit="--verbose"> (mostra i ranghi)
Esempi: <@lit="corr y x1 x2 x3">
<@lit="corr ylist --uniform">
<@lit="corr x y --spearman">
Per impostazione predefinita, mostra le coppie di coefficienti di correlazione (la correlazione del prodotto dei momenti di Pearson) per le variabili date nella <@var="lista-variabili">, o per tutte le variabili del dataset se non viene specificata alcuna <@var="lista-variabili">. Il comportamento predefinito consiste nell'usare tutte le osservazioni disponibili per calcolare ognuno dei coefficienti, ma se si usa l'opzione <@lit="--uniform"> il campione verrà limitato (se necessario) in modo che per tutti i coefficienti venga usato lo stesso insieme di osservazioni. Questa opzione ha effetto solo se le diverse variabili contengono un numero diverso di valori mancanti.
Le opzioni (mutualmente esclusive) <@opt="--spearman"> e <@opt="--kendall"> producono rispettivamente, la correlazione di rango di Spearman (rho) e la correlazione di rango di Kendall (tau), invece del solito coefficiente di Pearson. Quando si usa una di queste opzioni, la <@var="lista-variabili"> deve contenere solo due variabili.
Quando viene calcolata la correlazione di rango, si può usare l'opzione <@lit="--verbose"> per mostrare i dati originali e ordinati (altrimenti questa opzione verrà ignorata).
Accesso dal menù: /Visualizza/Matrice di correlazione
Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)
# corrgm Statistics
Argomenti: <@var="variabile"> [ <@var="max-ritardo"> ]
Opzione: <@lit="--plot">=<@var="mode-or-filename"> (si veda sotto)
Esempio: <@lit="corrgm x 12">
Mostra i valori della funzione di autocorrelazione per la <@var="variabile"> specificata (dal nome o dal numero). I valori sono definiti come ρ(<@itl="u"><@sub="t">, <@itl="u"><@sub="t-s">) dove <@itl="u"><@sub="t"> è la <@itl="t">-esima osservazione della variabile <@itl="u"> e <@itl="s"> è il numero dei ritardi.
Vengono mostrate anche le autocorrelazioni parziali (calcolate con l'algoritmo di Durbin–Levinson), ossia al netto dell'effetto dei ritardi intermedi. Il comando produce anche un grafico del correlogramma e mostra la statistica <@itl="Q"> di Ljung–Box per testare l'ipotesi nulla che la serie sia "white noise" (priva di autocorrelazione). La statistica si distribuisce asintoticamente come chi-quadro con gradi di libertà pari al numero di ritardi specificati.
Se viene specificato un valore <@var="max-ritardo">, la lunghezza del correlogramma viene limitata al numero di ritardi specificato, altrimenti viene scelta automaticamente in funzione della frequenza dei dati e del numero di osservazioni.
Di default viene mostrato un grafico del correlogramma: un grafico gnuplot in modalità interattiva o un grafico ASCII in modalità batch. Questo comportamento può essere modificato con l'opzione <@opt="--plot">. Per questa opzione i parametri accettabili sono <@lit="none"> (per eliminare il grafico); <@lit="ascii"> (per produrre un grafico in formato testo anche in modalità interattiva); <@lit="display"> (per produrre un grafico gnuplot anche in modalità batch); oppure il nome di un file. In quest'ultimo caso l'effetto è quello descritto per l'opzione <@opt="--output"> del comando <@ref="gnuplot">.
Se il comando va a buon fine, gli accessori <@lit="$test"> e <@lit="$pvalue"> conterranno i valori corrispondenti per la statistica di Ljung–Box, per l'ordine <@var="max-ritardo">. Peraltro, se si vuole semplicemente calcolare la statistica <@itl="Q"> senza che il programma produca alcun output, consigliamo di usare la funzione <@xrf="ljungbox"> anziché questo comando.
Accesso dal menù: /Variabile/Correlogramma
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
# cusum Tests
Opzioni: <@lit="--squares"> (esegue il test CUSUMSQ)
<@lit="--quiet"> (stampa solamente il test di Harvey–Collier)
Va eseguito dopo la stima di un modello OLS. Esegue il test CUSUM (o, se si usa l'opzione <@lit="--squares">, il test CUSUMSQ ) per la stabilità dei parametri. Viene calcolata una serie di errori di previsione per il periodo successivo, attraverso una serie di regressioni: la prima usa le prime <@itl="k"> osservazioni e viene usata per generare la previsione della variabile dipendente per l'osservazione <@itl="k"> + 1; la seconda usa le prime <@itl="k"> + 1 osservazioni per generare una previsione per l'osservazione <@itl="k"> + 2 e cos via (dove <@itl="k"> è il numero dei parametri nel modello originale).
Viene mostrata, anche graficamente, la somma cumulata degli errori scalati di previsione (o dei quadrati degli errori). L'ipotesi nulla della stabilità dei parametri è rifiutata al livello di significatività del 5 per cento se la somma cumulata va al di fuori delle bande di confidenza al 95 per cento.
Nel caso di test CUSUM, viene mostrata anche la statistica <@itl="t"> di Harvey–Collier per testare l'ipotesi nulla della stabilità dei parametri. Si veda il Capitolo 7 di <@itl="Econometric Analysis"> di Greene, per i dettagli. Per il test CUSUMSQ, la banda di confidenza al 95% è calcolata usando l'algoritmo descritto in Edgerton e Wells (1994).
Accesso dal menù: Finestra del modello, /Test/CUSUM(SQ)
# data Dataset
Argomento: <@var="lista-variabili">
Opzione: <@lit="--quiet"> (non mostra i risultati tranne che in caso di errore)
Legge le variabili nella <@var="lista-variabili"> da un database (gretl, RATS 4.0 o PcGive), che deve essere stato precedentemente aperto con il comando <@ref="open">. La frequenza dei dati l'intervallo del campione possono essere impostati usando i comandi <@ref="setobs"> e <@ref="smpl"> prima di questo comando. Ecco un esempio completo:
<code>
open macrodat.rat
setobs 4 1959:1
smpl ; 1999:4
data GDP_JP GDP_UK
</code>
Questi comandi aprono un database chiamato <@lit="macrodat.rat">, impostano un dataset trimestrale che inizia nel primo trimestre del 1959 e finisce nel quarto trimestre del 1999 e infine importano le serie <@lit="GDP_JP"> e <@lit="GDP_UK">.
Se non si specificano <@lit="setobs"> e <@lit="smpl"> nel modo descritto, la frequenza dei dati e l'intervallo del campione vengono impostati usando la prima variabile letta dal database.
Se le serie da leggere hanno frequenza maggiore di quella impostata nel dataset, è possibile specificare un metodo di compattamento, come mostrato di seguito
<code>
data (compact=average) LHUR PUNEW
</code>
I quattro metodi di compattamento disponibili sono "average" (usa la media delle osservazioni ad alta frequenza), "last" (usa l'ultima osservazione), "first" e "sum". Se non si specifica alcun metodo, verrà usata la media delle osservazioni.
Accesso dal menù: /File/Database
# dataset Dataset
Argomenti: <@var="parola-chiave"> <@var="parametri">
Esempi: <@lit="dataset addobs 24">
<@lit="dataset compact 1">
<@lit="dataset compact 4 last">
<@lit="dataset expand interp">
<@lit="dataset transpose">
<@lit="dataset sortby x1">
<@lit="dataset resample 500">
<@lit="dataset renumber x 4">
<@lit="dataset clear">
Esegue varie operazioni sull'intero dataset, a seconda della <@var="parola-chiave"> usata, che può essere <@lit="addobs">, <@lit="insobs">, <@lit="clear">, <@lit="compact">, <@lit="expand">, <@lit="transpose">, <@lit="sortby">, <@lit="dsortby">, <@lit="resample"> o <@lit="renumber">. Nota: questi comandi non sono disponibili quando sul dataset è definito un sotto-campione ottenuto selezionando le osservazioni con un criterio Booleano.
<@lit="addobs">: deve essere seguito da un intero positivo. Aggiunge il numero specificato di osservazioni alla fine del dataset, tipicamente a scopo di ottenere delle previsioni. I valori della maggior parte delle variabili nell'intervallo aggiunto sono impostati come valori mancanti, ma alcune variabili deterministiche, ad esempio le tendenze lineari e le variabili dummy periodiche, sono riconosciute ed estese.
<@lit="insobs">: Deve essere seguito da un intero positivo inferiore o uguale al numero corrente di osservazioni. Inserisce una singola ossrevazione nella posizione specificata. Tutti i dati successivi sono spostati di una posizione e il dataset è allungato di un'osservazione. In corrispondenza della nuova osservazione a tutte le variabili, a parte la costante, vengono assegnati valori mancanti. Questa azione non è disponibile in dataset panel.
<@lit="clear">: Non richiede parametri. Elimina il campione corrente e riporta gretl al suo stato iniziale senza dati.
<@lit="compact">: deve essere seguito da un intero positivo che rappresenta la nuova frequenza dei dati, che dovrebbe essere minore di quella attuale (ad esempio un valore 4 quando la frequenza attuale è 12 significa che si compatterà un dataset mensile in uno trimestrale). Questo comando è disponibile solo se il dataset contiene serie storiche: compatta tutte le serie del dataset alla nuova frequenza. È possibile dare un secondo parametro, tra <@lit="sum">, <@lit="first"> o <@lit="last">, per specificare, rispettivamente, di compattare usando la somma dei valori alla frequenza maggior, i valori di inizio periodo, o di fine periodo. Il comportamento predefinito consiste nel prendere la media dei valori sul periodo.
<@lit="expand">: Questo comando è disponibile solo per serie storiche annuali o trimestrali. I dati annuali vengono espansi a trimestrali, quelli trimestrali a mensili. Per default, tutte le serie nel dataset verranno espanse assegnando alle nuove osservazioni i valori del periodo corrispondente nel vecchio dataset, ma con il modificatore <@lit="interp"> le serie vengono espanse usando l'interpolazione di Chow–Lin (si veda <@bib="Chow e Lin, 1971;chowlin71">): i regressori sono costante e trend quadratico; il disturbo è assunto AR(1).
<@lit="transpose">: non richiede parametri aggiuntivi. Traspone il dataset attuale: ogni osservazione (riga) del dataset attuale diventerà una variabile (colonna), e ogni variabile un'osservazione. Questo comando è utile quando si importano da fonti esterne dei dati organizzati con le variabili disposte per riga.
<@lit="sortby">: richiede il nome di una variabile o di una lista. Con una variabile, questa viene usata come criterio di ordinamento. Le osservazioni di tutte le altre variabili del dataset sono riordinate secondo valori crescenti della variabile indicata. Nel caso di una lista, il comando procede gerarchicamente: il primo criterio di rdinamento è la prima variabile, e così via. Questo comando è disponibile solo per dati non datati.
<@lit="dsortby">: funziona come <@lit="sortby"> ma riordina le osservazioni secondo i valori decrescenti della variabile specificata.
<@lit="resample">: costruisce un nuovo dataset attraverso un campionamento causale, con reimmissione, delle righe del dataset attuale. È richiesto un argomento, ossia il numero di righe da includere, che può essere minore, uguale o maggiore del numero di osservazioni nei dati originali. Il dataset originale può essere recuperato usando il comando <@lit="smpl full">.
<@lit="renumber">: Richiede il nome di una variabile esistente seguito da un intero compreso fra 1 e il numero delle variabili nel campione meno 1. Sposta la serie specificata nel dataset nella posizione indicata, rinumerando le altre variabili di conseguenza. (La posizione 0 è occupata dalla costante che non può essere spostata.)
Accesso dal menù: /Dati
# debug Programming
Argomento: <@var="function">
Un debugger sperimentale per funzioni definite dall'utente, disponibile a partire dalla linea di comando, gretlcli e dalla console GUI. Il comando <@lit="debug"> dovrebbe essere utilizzato dopo aver definito la funzione in questione ma prima di chiamarla. Il suo effetto è quello di sospendere l'esecuzione quando la funzione viene chiamata; la sospensione è segnalata dalla presenza di un prompt speciale.
Una volta attivato il prompt di debug è possibile digitare <@lit="next"> per eseguire il comando successivo della funzione, o <@lit="continue"> per far proseguire l'esecuzione della funzione senza ulteriori arresti. Questi comandi possono essere rispettivamente abbreviati con <@lit="n"> e <@lit="c">. Al prompt di debug è anche possibile interpolare un'istruzione, per esempio un comando <@lit="print"> per esaminare il valore corrente di qualche variabile di interesse.
# delete Dataset
Argomento: [ <@var="lista-variabili"> ]
Opzioni: <@lit="--db"> (rimuove dal database aperto)
<@lit="--type">=<@var="nome di tipo"> (tutte le variabili di un dato tipo)
Questo comando è uno strumento multi-uso per eliminare variabili con un nome (serie, scalari, matrici, stringhe o bundle). Deve essere usato con cautela: non viene chiesta alcuna conferma.
Nel caso di variabili, <@var="varname"> può essere il nome di una lista, e in questo caso vengono eliminate tutte le variabili incluse in essa, oppure può essere una lista esplicita di variabili indicate per nome o numero ID. Si noti che quando cancellate variabili, quelle con numeri ID maggiori di quelli inclusi nella lista da cancellare saranno rinumerati.
Se si usa l'opzione <@lit="--db">, il comando rimuove le variabili elencate non dal dataset attuale ma da un database gretl, assumendo che questo sia stato aperto in precedenza e che l'utente abbia il permesso di scrittura sul file che contiene il database. Si veda anche il comando <@ref="open">.
Se viene indicata l'opzione <@opt="--type"> è necessario accompagnarla con uno dei nomi di tipi seguenti: <@lit="matrix">, <@lit="bundle">, <@lit="string">, <@lit="list"> o <@lit="scalar">. L'effetto è quello di cancellare tutte le variabili di un certo tipo. Solo in questo caso non è necessario fornire l'argomento <@var="varname">.
Accesso dal menù: Pop-up nella finestra principale (selezione singola)
# diff Transformations
Argomento: <@var="lista-variabili">
Calcola la differenza prima di ogni variabile nella <@var="lista-variabili"> e la salva in una nuova variabile il cui nome è prefissato con <@lit="d_">. Quindi <@lit="diff x y"> crea le nuove variabili
<code>
d_x = x(t) - x(t-1)
d_y = y(t) - y(t-1)
</code>
Accesso dal menù: /Aggiungi/Differenze
# difftest Tests
Argomenti: <@var="var1"> <@var="var2">
Opzioni: <@lit="--sign"> (Test del segno, scelta predefinita)
<@lit="--rank-sum"> (Test "rank-sum" di Wilcoxon)
<@lit="--signed-rank"> (Test "signed-rank" di Wilcoxon)
<@lit="--verbose"> (Mostra informazioni aggiuntive)
Esegue un test non parametrico per la differenza tra due popolazioni o gruppi; il tipo di test dipende dall'opzione usata.
Con l'opzione <@lit="--sign">, viene eseguito il test del segno, che si basa sul fatto che per due campioni <@itl="x"> e <@itl="y"> estratti casualmente dalla stessa distribuzione, la probabilità che valga <@itl="x"><@sub="i"> > <@itl="y"><@sub="i"> per ogni osservazione <@itl="i"> dovrebbe valere 0.5. La statistica test è <@itl="w">, ossia il numero di osservazioni per cui vale <@itl="x"><@sub="i"> > <@itl="y"><@sub="i">. Sotto l'ipotesi nulla, questa grandezza si distribuisce come una binomiale con parametri (<@itl="n">, 0.5), dove <@itl="n"> è il numero di osservazioni.
Con l'opzione <@lit="--rank-sum">, viene eseguito il test "rank-sum" di Wilcoxon. Questo test procede ordinando le osservazioni estratte da entrambi i campioni dalla più piccola alla più grande, e quindi calcolando la somma dei ranghi delle osservazioni da uno dei campioni. I due campioni non devono necessariamente avere la stessa dimensione: se sono diversi, viene usato il campione più piccolo per calcolare la somma dei ranghi. Sotto l'ipotesi nulla che i campioni siano estratti da popolazioni con la stessa mediana, la distribuzione di probabilità della somma dei ranghi può essere calcolata per ogni valore dell'ampiezza dei due campioni, mentre per campioni abbastanza ampi essa approssima la distribuzione normale.
Con l'opzione <@lit="--signed-rank">, viene eseguito il test "signed-rank" di Wilcoxon. Questo test è valido per "coppie di campioni", come possono essere ad esempio i valori di una variabile in un gruppo di individui prima e dopo un certo trattamento. Il test procede calcolando le differenze tra le coppie di osservazioni <@itl="x"><@sub="i"> – <@itl="y"><@sub="i">, ordinando queste differenze per valore assoluto e assegnando ad ogni coppia un valore di rango con segno, in cui il segno rispecchia il segno della differenza. Quindi viene calcolato <@itl="W"><@sub="+">, la somma di tutti i ranghi con segno positivo. Come avviene per il test rank-sum, questa statistica ha una distribuzione precisa nell'ipotesi nulla che la differenza mediana sia zero, distribuzione che converte alla normale nel caso di campioni abbastanza ampi.
Usando l'opzione <@lit="--verbose"> con i test di Wilcoxon viene mostrato l'ordinamento delle osservazioni (l'opzione non ha effetto se usata con il test del segno).
# discrete Transformations
Argomento: <@var="lista-variabili">
Opzione: <@lit="--reverse"> (marca le variabili come continue)
Marca ogni variabile della <@var="lista-variabili"> come discreta. In modalità predefinita, tutte le variabili sono considerate come continue; marcando una variabile come discreta, essa viene trattata in modo speciale nei diagrammi di frequenza, e può esere usata con il comando <@ref="dummify">.
Usando l'opzione <@lit="--reverse">, l'operazione viene invertita, ossia, le variabili nella <@var="lista-variabili"> sono marcate come continue.
Accesso dal menù: /Variabile/Modifica attributi
# dpanel Estimation
Argomento: <@var="p"> ; <@var="depvar"> <@var="indepvars"> [ ; <@var="instruments"> ]
Opzioni: <@lit="--quiet"> (non mostra il modello stimato)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--two-step"> (calcola la stima GMM a due passi)
<@lit="--system"> (aggiunge equazioni nei livelli)
<@lit="--time-dummies"> (aggiunge variabili dummy temporali)
<@lit="--dpdstyle"> (emula il pacchetto DPD per Ox)
<@lit="--asymptotic"> (errori standard asintotici non modificati)
Esempi: <@lit="dpanel 2 ; y x1 x2">
<@lit="dpanel 2 ; y x1 x2 --system">
<@lit="dpanel {2 3} ; y x1 x2 ; x1">
<@lit="dpanel 1 ; y x1 x2 ; x1 GMM(x2,2,3)">
Vedi anche <@inp="bbond98.inp">
Stima modelli dinamici per dati di panel (in altre parole, modelli panel con uno o più ritardi della variabile dipendente) usando il metodo GMM-DIF o quello GMM-SYS.
Il paramtro <@var="p"> rappresenta l'ordine autoregressivo della variabile dipendente. Nel caso più semplice si tratta di uno scalare, ma per specificare un insieme di ritardi (non consecutivi) da è possibile indicare una matrice definita in precedenza.
La variabile dipendente e i regressori dovrebbero essere indicati in livelli; il comando provvede autonomamente a differenziarli (dato che questo stimatore usa le differenze per eliminare gli effetti individuali).
L'ultimo campo (opzionale) nel comando serve a specificare strumenti. Se questi ultimi non vengono indicati si assume che tutte le variabili indipendenti siano strettamente esogene. Se si sceglie di specificare alcuni strumenti è opportuno includere nell'elenco anche le variabili indipendenti strettamente esogene. Nel caso di regressori predeterminati è possibile usare la funzione <@lit="GMM"> per includere uno specifico intervallo di ritardi seguendo uno schema diagonale a blocchi. Una situazione di questo tipo è stata illustrata in precedenza nel terzo esempio. Il primo argomento di <@lit="GMM"> è il nome della variabile in questione, il secondo è il ritardo minimo da usare come strumento e il terzo è il ritardo massimo. La stessa sintassi può essere utilizzata con la funzione <@lit="GMMlevel"> per specificare strumenti di tipo GMM per le equazioni nei livelli.
Di default vengono riportati (con errori standard robusti) i risultati della stima al primo stadio; la stima al secondo stadio può essere richiesta indicato l'opzione corrispondente. In entrambi i casi vengono forniti i test di autocorrelazione del primo e del secondo ordine, così come il test di sovraidentificazione di Sargan e un test di Wald della significatività congiunta dei regressori. Si noti che in questo modello nelle differenze l'autocorrelazione del primo ordine non impedisce che il modello sia valido; l'autocorrelazione al secondo ordine, tuttavia, viola le ipotesi statistiche che ne sono alla base.
Nel caso della stima a due passi, gli errori standard sono per default calcolati usando la correzione per campioni finiti suggerita da <@bib="Windmeijer (2005);windmeijer05">. In generale l'inferenza basata sugli errori standard asintotici associati allo stimatore al secondo stadio è considerata inaffidabile, ma se per qualche ragione desiderate conoscere il loro valore potete usare l'opzione <@opt="--asymptotic"> per disattivare la correzione di Windmeijer.
Se viene indicata l'opzione <@opt="--time-dummies"> il comando aggiunge ai regressori specificati un insieme di variabili dummy. Il numero di queste ultime è pari al numero massimo di periodi usati nella stima meno uno, allo scopo di evitare di avere collinearità perfetta con la costante. Le dummy vengono incluse in differenza, a meno che non sia indicata l'opzione <@opt="--dpdstyle">; in questo caso le dummy sono incluse in livello.
Per ulteriori dettagli ed esempi, si veda <@pdf="la guida all'uso di gretl">.
Accesso dal menù: /Model/Panel/Dynamic panel model
# dummify Transformations
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--drop-first"> (omette dalla codifica il valore minimo)
<@lit="--drop-last"> (omette dalla codifica il valore massimo)
Per ogni variabile rilevante nella <@var="lista-variabili">, crea un insieme di variabili dummy che codificano i valori distinti di quella variabile. Le variabili rilevanti sono quelle che sono state marcate esplicitamente come discrete, o quelle che assumono un numero limitato di valori che devono essere "abbastanza arrotondati" (multipli di 0.25).
Per impostazione predefinita, viene aggiunta una variabile dummy per ognuno dei valori distinti della variabile in questione. Ad esempio, se una variabile discreta <@lit="x"> ha 5 valori distinti, verranno create 5 variabili dummy, di nome <@lit="Dx_1">, <@lit="Dx_2"> e così via. La prima variabile dummy avrà valore 1 per le osservazioni in cui <@lit="x"> assume il suo valore minimo, e 0 altrove; la successiva variabile dummy avrà valore 1 dove <@lit="x"> assume il secondo tra i suoi valori, e così via. Se viene usata una delle opzioni <@lit="--drop-first"> o <@lit="--drop-last">, il più basso o il più alto dei valori della variabile viene omesso dalla codifica (questa funzione può essere utile per evitare la cosiddetta "trappola delle variabili dummy").
Questo comando può anche essere usato nel contesto di una regressione. Ad esempio, la riga seguente specifica un modello in cui <@lit="y"> viene regredita sull'insieme di variabili dummy che codificano <@lit="x"> (in questo contesto non è possibile passare opzioni al comando <@lit="dummify">).
<code>
ols y dummify(x)
</code>
# duration Estimation
Argomenti: <@var="depvar"> <@var="indepvars"> [ ; <@var="censvar"> ]
Opzioni: <@lit="--exponential"> (usa la distribuzione esponenziale)
<@lit="--loglogistic"> (usa la distribuzione log-logistica)
<@lit="--lognormal"> (usa la distribuzione log-normale)
<@lit="--medians"> (i valori previsti sono mediane)
<@lit="--robust"> (errori standard robusti (QML))
<@lit="--cluster">=<@var="clustvar"> (v. <@ref="logit"> per una spiegazione)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra dettagli delle iterazioni)
Esempi: <@lit="duration y 0 x1 x2">
<@lit="duration y 0 x1 x2 ; cens">
Stima un modello di durata: la variabile dipendente (che deve essere positiva) rappresenta la durata di un certo fenomeno, per esempio la lunghezza di un periodo di disoccupazione per una cross-section di intervistati. Di default viene utilizzata una distribuzione Weibull, ma sono disponibili anche le distribuzioni esponenziale, log-logistica e log-normale.
Se alcune delle durate misurate sono censurate a destra (e.g. il periodo di disoccupazione di un individuo non si è concluso all'interno del periodo di osservazione), deve essere specificato l'argomento accessorio <@var="censvar"> che indica una variabile i cui valori positivi segnalano osservazioni censurate a destra.
Di default i valori stimati ottenuti mediante l'accessore <@lit="$yhat"> rappresentano le medie condizionali delle durate; se tuttavia viene indicata l'opzione <@opt="--medians">, <@lit="$yhat"> fornisce le mediane condizionali.
Vedi <@pdf="la guida all'uso di gretl"> per ulteriori dettagli.
Accesso dal menù: /Model/Nonlinear models/Duration data...
# elif Programming
Si veda <@ref="if">.
# else Programming
Si veda <@ref="if">. Si noti che <@lit="else"> dev'essere su un linea a sé stante, prima del comando corrispondente. Si può aggiungere un commento, come ad esempio
<code>
else # OK, fa' un'altra cosa
</code>
ma nn si può aggiungere un comando, come in
<code>
else x = 5 # wrong!
</code>
# end Programming
Termina un blocco di comandi di qualsiasi tipo. Ad esempio, <@lit="end system"> termina un <@ref="system"> (sistema di equazioni).
# endif Programming
Si veda <@ref="if">.
# endloop Programming
Indica la fine di un ciclo (loop) di comandi. Si veda <@ref="loop">.
# eqnprint Printing
Argomento: [ <@var="-f nomefile"> ]
Opzione: <@lit="--complete"> (crea un documento completo)
Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto forma di equazione LaTeX. Se viene specificato un nome di file usando l'opzione <@lit="-f">, il risultato viene scritto in quel file, altrimenti viene scritto in un file il cui nome ha la forma <@lit="equation_N.tex">, dove <@lit="N"> è il numero di modelli stimati finora nella sessione in corso. Si veda anche <@ref="tabprint">.
Usando l'opzione <@lit="--complete">, il file LaTeX è un documento completo, pronto per essere processato; altrimenti il file va incluso in un documento.
Accesso dal menù: Finestra del modello, /LaTeX
# equation Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Esempio: <@lit="equation y x1 x2 x3 const">
Specifica un'equazione all'interno di un sistema di equazioni (si veda <@ref="system">). La sintassi per specificare un'equazione in un sistema SUR è la stessa usata ad esempio in <@ref="ols">. Per un'equazione in un sistema con minimi quadrati a tre stadi, invece è possibile usare una specificazione simile a quella usata per OLS e indicare una lista di strumenti comuni usando l'istruzione <@lit="instr"> (si veda ancora <@ref="system">), oppure si può usare la stessa sintassi di <@ref="tsls">.
# estimate Estimation
Argomenti: [ <@var="nome-sistema"> ] [ <@var="stimatore"> ]
Opzioni: <@lit="--iterate"> (itera fino alla convergenza)
<@lit="--no-df-corr"> (nessuna correzione per i gradi di libertà)
<@lit="--geomean"> (si veda oltre)
<@lit="--quiet"> (non mostra i risultati)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
Esempi: <@lit="estimate "Klein Model 1" method=fiml">
<@lit="estimate Sys1 method=sur">
<@lit="estimate Sys1 method=sur --iterate">
Esegue la stima di un sistema di equazioni, che deve essere stato definito in precedenza usando il comando <@ref="system">. Per prima cosa va indicato il nome del sistema, racchiuso tra virgolette se contiene spazi, quindi il tipo di stimatore, preceduto dalla stringa <@lit="method=">. Gli stimatori disponibili sono: <@lit="ols">, <@lit="tsls">, <@lit="sur">, <@lit="3sls">, <@lit="fiml"> o <@lit="liml">. Questi argomento sono opzionali si il sistema in questione è già stato stimato e occupa il posto dell'"ultimo modello"; in tal caso, per default viene usato il metodo di stima precedente.
Se al sistema in questione sono stati imposti dei vincoli (si veda il comando <@ref="restrict">), la stima sarà soggetta a tali vincoli.
Se il metodo di stima è <@lit="sur"> o <@lit="3sls"> e viene usata l'opzione <@lit="--iterate">, lo stimatore verrà iterato. Nel caso di SUR, se la procedura converge, i risultati saranno stime di massima verosimiglianza. Invece l'iterazione della procedura dei minimi quadrati a tre stadi non produce in genere risultati di massima verosimiglianza a informazione completa. L'opzione <@lit="--iterate"> viene ignorata con gli altri metodi di stima.
Se vengono scelti gli stimatori "equazione per equazione" <@lit="ols"> o <@lit="tsls">, nel calcolo degli errori standard viene applicata in modo predefinito una correzione per i gradi di libertà, che può essere disabilitata usando l'opzione <@lit="--no-df-corr">. Questa opzione non ha effetti nel caso vengano usati altri stimatori, che non prevedono correzioni per i gradi di libertà.
La formula usata in modo predefinito per calcolare gli elementi della matrice di covarianza tra equazioni è
<@fig="syssigma1">
Se viene usata l'opzione <@lit="--geomean">, viene applicata una correzione per i gradi di libertà secondo la formula
<@fig="syssigma2">
dove i <@itl="k"> indicano il numero di parametri indipendenti in ogni equazione.
Se si usa l'opzione <@lit="--verbose"> e un metodo iterativo, vengono mostrati i dettagli delle iterazioni.
# fcast Prediction
Argomenti: [ <@var="oss-iniziale oss-finale"> ] [ <@var="passi-avanti"> ] [ <@var="nome-variabile"> ]
Opzioni: <@lit="--dynamic"> (crea previsioni dinamiche)
<@lit="--static"> (crea previsioni statiche)
<@lit="--out-of-sample"> (genera previsioni fuori dal campione)
<@lit="--no-stats"> (non mostra le statistiche di previsione)
<@lit="--quiet"> (non mostra le previsioni)
<@lit="--rolling"> (vedi sotto)
<@lit="--plot">=<@var="nome di file"> (vedi sotto)
Esempi: <@lit="fcast 1997:1 2001:4 f1">
<@lit="fcast fit2">
<@lit="fcast 2004:1 2008:3 4 rfcast --rolling">
Deve seguire un comando di stima. Calcola previsioni per l'intervallo specificato. A seconda del tipo di modello, calcola anche gli errori standard (si veda oltre).
Deve seguire un comando di stima. Calcola previsioni per un certo intervallo delle osservazioni. L'intervallo può essere specificato indicando <@var="oss-iniziale"> e <@var="oss-finale">, oppure con l'opzione <@lit="--out-of-sample"> (in questo caso la previsione sarà per le osservazioni successive a quelle su cui è stato stimato il modello); se non si usa alcuna opzione, l'intervallo sarà quello attualmente impostato. Se si sceglie una previsione fuori dal campione ma non sono disponibili osservazioni, viene segnalato un errore. A seconda del tipo di modello, calcola anche gli errori standard (si veda oltre). L'opzione <@lit="--rolling"> produce un comportamento speciale spiegato oltre.
Se l'ultimo modello stimato consiste in un'equazione singola, l'argomento opzionale <@var="nome-variabile"> ha l'effetto seguente: i valori della previsione non sono mostrati, ma vengono salvati nel dataset con il nome di variabile indicato. Se l'ultimo modello stimato è un sistema di equazioni, <@var="nome-variabile"> ha un effetto diverso, ossia seleziona una particolare varabile endogena per cui effettuare la previsione (l'impostazione predefinita consiste nel produrre previsioni per tutte le variabili endogene). Nel caso del sistema, o se non viene specificata <@var="nome-variabile">, i valori della previsione possono essere recuperati usando la varaiabile accessoria <@lit="$fcast">, mentre gli errori standard, se disponibili, con <@lit="$fcerr">.
La scelta tra previsione statica e dinamica è rilevante solo nel caso di modelli dinamici, che comprendono un processo di errore autoregressivo, o che comprendono uno o più valori ritardati della variabile dipendente come regressori. Le previsioni statiche sono per il periodo successivo, basate sui valori effettivi nel periodo precedente, mentre quelle dinamiche usano la regola della previsione a catena. Ad esempio, se la previsione per <@itl="y"> nel 2008 richiede come input il valore di <@itl="y"> nel 2007, non è possibile calcolare una previsione statica se non si hanno dati per il 2007. È possibile calcolare una previsione dinamica per il 2008 se si dispone di una precedente previsione per <@itl="y"> nel 2007.
La scelta predefinita consiste nel fornire una previsione statica per ogni porzione dell'intervallo di previsione che fa parte dell'intervallo del campione su cui il modello è stato stimato, e una previsione dinamica (se rilevante) fuori dal campione. L'opzione <@lit="dynamic"> richiede di produrre previsioni dinamiche a partire dalla prima data possibile, mentre l'opzione <@lit="static"> richiede di produrre previsioni statiche anche fuori dal campione.
L'opzione <@lit="rolling"> al momento è disponibile solo per i modelli composti da una singola equazione e stimati via OLS. Quando si usa questa opzione, le previsioni calcolate sono ricorsive, ossia: ogni previsione è generata da una stima del modello che usa i dati a partire da un certo punto fisso (ossia l'inizio dell'intervallo del campione usato per la stima originaria) fino alla data di previsione meno <@itl="k"> osservazioni, dove <@itl="k"> è il numero di <@lit="passi-avanti"> specificato come argomento. Le previsioni sono sempre dinamiche quando è possibile. Si noti che l'argomento <@lit="passi-avanti"> deve essere utilizzato solo insieme all'opzione <@lit="rolling">.
L'opzione <@opt="--plot"> (disponibile solo nel caso della stima di un modello uniequazionale) consente di ottenere un file con un grafico delle previsioni. L'estensione dell'argomento <@var="filename"> di questa opzione controlla il formato del grafico: <@lit=".eps"> per EPS, <@lit=".pdf"> per PDF, <@lit=".png"> per PNG, <@lit=".plt"> per un file di comandi gnuplot. Il nome di file dummy <@lit="display"> può essere usato per mostrare il grafico in una finestra. Per esempio,
<code>
fcast --plot=fc.pdf
</code>
genererà un grafico in formato PDF. Vengono rispettati gli indirizzi di file assoluti; in caso contrario i fail vengono scritti nella directory di lavoro di gretl.
La natura degli errori standard della previsione (se disponibili) dipende dalla natura del modello e della previsione. Per i modelli lineari statici, gli errori standard sono calcolati seguendo il metodo delineato in Davidson and MacKinnon (2004); essi incorporano sia l'incertezza dovuta al processo d'errore, sia l'incertezza dei parametri (sintetizzata dalla matrice di covarianza delle stime dei parametri). Per modelli dinamici, gli errori standard della previsione sono calcolati solo nel caso di previsione dinamica, e non incorporano incertezza dei parametri. Per modelli non lineari, al momento non sono disponibili errori standard della previsione.
Accesso dal menù: Finestra del modello, /Analisi/Previsioni
# foreign Programming
Sintassi: <@lit="foreign language="><@var="lang">
Opzioni: <@lit="--send-data"> (pre-carica il dataset attuale)
<@lit="--quiet"> (sopprime l'output dal programma esterno)
Questo comando apre una modalità speciale, in cui vengono accettati comandi che verranno eseguiti da un programma esterno. Con il comando <@lit="end foreign"> si esce da questa modalità e i comandi verranno eseguiti.
Al momento, i programmi esterni compatibili con questa modalità sono (<@lit="language=R">), Ox di Jurgen Doornik Ox (<@lit="language=Ox">), GNU Octave (<@lit="language=Octave">), Python e, in minor misura, Stata. I nomi dei programmi esterni sono case-insensitive.
Con R, Octave e Stata l'opzione <@opt="--send-data"> ha l'effetto di rendere disponibile all'interno del programma di destinazione l'intero dataset corrente.
Si veda la <@pdf="la guida all'uso di gretl"> per dettagli ed esempi.
# fractint Statistics
Argomenti: <@var="series"> [ <@var="order"> ]
Opzioni: <@lit="--gph"> (calcola il test di Geweke e Porter-Hudak)
<@lit="--all"> (calcola entrambi i test)
<@lit="--quiet"> (non mostra i risultati)
Verifica la presenza di integrazione frazionale ("long memory") per la variabile specificata. L'ipotesi nulla è che l'ordine di integrazione della variabile sia zero. Di default viene utilizzato lo stimatore locale di Whittle <@bib="(Robinson, 1995);robinson95">, ma se si indica l'opzione <@opt="--gph"> il comando usa il test GPH <@bib="(Geweke and Porter-Hudak, 1983);GPH83">. L'opzione <@opt="--all"> permette di ottenere i risultati di entrambi i test.
Per maggiori dettagli su questo tipo di test, v. <@bib="Phillips e Shimotsu (2004);phillips04">.
Se non si specifica l'argomento opzionale <@var="order">, l'ordine del test (o dei test) è automaticamente fissato al più piccolo fra <@itl="T">/2 e <@itl="T"><@sup="0.6">.
I risultati possono essere recuperati usando gli accessori <@lit="$test"> e <@lit="$pvalue">. Questi valori sono basati sullo stimatore locale di Whittle a meno che non sia stata indicata l'opzione <@opt="--gph">.
Accesso dal menù: /Variable/Unit root tests/Fractional integration
# freq Statistics
Argomento: <@var="variabile">
Opzioni: <@lit="--nbins">=<@var="n"> (specifica il numero di intervalli)
<@lit="--min">=<@var="minval"> (specifica il valore minimo, v. oltre)
<@lit="--binwidth">=<@var="width"> (specifica l'ampiezza degli intervalli, v. oltre)
<@lit="--quiet"> (non mostra il grafico)
<@lit="--normal"> (test per la distribuzione normale)
<@lit="--gamma"> (test per la distribuzione gamma)
<@lit="--silent"> (non mostra nulla)
<@lit="--show-plot"> (v. oltre)
<@lit="--matrix">=<@var="nome"> (usa una colonna di una matrice indicata per nome)
Esempi: <@lit="freq x">
<@lit="freq x --normal">
<@lit="freq x --nbins=5">
<@lit="freq x --min=0 --binwidth=0.10">
Se non vengono indicate opzioni, mostra la distribuzione di frequenza per la <@var="variabile"> (indicata con il nome o il numero).
Se viene indicata l'opzione <@opt="--matrix">, <@var="var"> (che deve essere un intero) viene invece interpretato come un indice di base 1 che individua una colonna in una matrice indicata per nome.
Per controllare la presentazione della distribuzione è possibile specificare <@itl="o"> il numero di intervalli o il valore minimo più l'ampiezza degli intervalli, come illustrato negli ultimi due esempi precedenti. L'opzione <@opt="--min"> fissa il limite inferiore dell'intervallo più a sinistra.
Usando l'opzione <@lit="--normal">, vengono mostrati i risultati del test chi-quadro di Doornik–Hansen per la normalità. Usando l'opzione <@lit="--gamma">, al posto del test di normalità viene eseguito il test non parametrico di Locke per l'ipotesi nulla che la variabile segua la distribuzione gamma; si veda <@bib="Locke (1976);locke76">, <@bib="Shapiro e Chen (2001);shapiro-chen01">. Si noti che la parametrizzazione della distribuzione gamma in gretl è (forma, scala).
In modalità interattiva viene mostrato anche un grafico della distribuzione, a meno che non si usi l'opzione <@lit="--quiet">. Per converso, il grafico non viene mostrato quando il comando è invocato da script, a meno che non venga usata l'opzione <@opt="--show-plot">. (Questo non si applica alla versione di gretl a linea di comando, <@lit="gretlcli">.)
L'opzione <@lit="--silent"> sopprime interamente l'output mostrato di solito. Ha senso usarla insieme a una delle opzioni riguardanti la distribuzione: in questo modo la statistica test e il suo p-value verranno salvati nelle variabili accessorie <@lit="$test"> e <@lit="$pvalue">.
Accesso dal menù: /Variabile/Distribuzione di frequenza
# function Programming
Argomento: <@var="nome_funzione">
Apre un blocco di istruzioni che definiscono una funzione. Il blocco va chiuso con <@lit="end function">. Per i dettagli, si veda la <@pdf="la guida all'uso di gretl">.
# garch Estimation
Argomenti: <@var="p"> <@var="q"> ; <@var="variabile-dipendente"> [ <@var="variabili-indipendenti"> ]
Opzioni: <@lit="--robust"> (errori standard robusti)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--nc"> (non include una costante)
<@lit="--stdresid"> (standardizza i residui)
<@lit="--fcp"> (usa l'algoritmo di Fiorentini, Calzolari e Panattoni)
<@lit="--arma-init"> (parametri di varianza iniziale da ARMA)
Esempi: <@lit="garch 1 1 ; y">
<@lit="garch 1 1 ; y 0 x1 x2 --robust">
Stima un modello GARCH (Generalized Autoregressive Conditional Heteroskedasticity) univariato, o, se sono specificate delle <@var="variabili-indipendenti">, includendo delle variabili esogene. I valori interi <@var="p"> e <@var="q"> (che possono essere indicati in forma numerica o col nome di variabili scalari preesistenti) rappresentano gli ordini di ritardo nell'equazione della varianza condizionale.
<@fig="garch_h">
Il parametro <@var="p"> rappresenta quindi l'ordine generalizzato (o "AR"), mentre <@var="q"> rappresenta il consueto ordine ARCH (o "MA"). Se <@var="p"> è diverso da zero, anche <@var="q"> deve essere diverso da zero, altrimenti il modello non è identificato. Comunque, è possibile stimare un modello ARCH consueto impostando <@var="q"> a un valore positivo e <@var="p"> a zero. La somma di <@var="p"> e <@var="q"> non deve superare 5. Si noti che nell'equazione della media viene automaticamente inclusa una costante, a meno che non si usi l'opzione <@lit="--nc">.
Per impostazione predefinita, i modelli GARCH vengono stimati usando il codice nativo gretl, ma è anche possibile usare l'algoritmo di Fiorentini, Calzolari e Panattoni (1996). Il primo usa il massimizzatore BFGS, mentre il secondo usa la matrice di informazione per massimizzare la verosimiglianza, con un raffinamento usando l'Hessiana.
Sono disponibili varie stime della matrice di covarianza dei coefficienti. Il metodo predefinito è quello dell'Hessiana, a meno che non si usi l'opzione <@lit="--robust">, nel qual caso viene usata la matrice di covarianza QML (White). Altre possibilità (ad es. la matrice di informazione, o lo stimatore di Bollerslev–Wooldridge) possono essere specificate con il comando <@ref="set">.
In modalità predefinita, le stime dei parametri di varianza sono inizializzate usando la varianza dell'errore non condizionale, ottenuta dalla stima OLS iniziale, per la costante, e piccoli valori positivi per i coefficienti dei valori passati dell'errore al quadrato e per la varianza dell'errore. L'opzione <@lit="--arma-init"> fa in modo che i valori iniziali per questi parametri siano ricavati da un modello ARMA iniziale, sfruttando la relazione tra GARCH e ARMA mostrata nel capitolo 21 di <@itl="Time Series Analysis"> di Hamilton. In alcuni casi, questo metodo può aumentare le probabilità di convergenza.
I residui GARCH e la varianza condizionale stimata sono memorizzate rispettivamente nelle variabili <@lit="$uhat"> e <@lit="$h">. Ad esempio, per ottenere la varianza condizionale è possibile scrivere:
<code>
genr ht = $h
</code>
Con l'opzione <@opt="--stdresid">, i valori di <@lit="$uhat"> vengono divisi per la radice di <@itl="h"><@sub="t">.
Accesso dal menù: /Modello/Serie storiche/GARCH
# genr Dataset
Argomenti: <@var="nuova-variabile"> <@var="= formula">
NOTA: questo comando ha subito molti cambiamenti e migliorie da quando l'help seguente è stato scritto, per cui per informazioni complete e aggornate consigliamo di far riferimento alla <@pdf="la guida all'uso di gretl">. D'altro canto, il testo che segue non contiene informazioni erronee, per cui può essere interpretato come "questo ed altro".
In contesti appropriati, <@lit="series">, <@lit="scalar"> e <@lit="matrix"> sono sinonimi per questo comando.
Crea nuove variabili, di solito per mezzo di trasformazioni di variabili esistenti. Si veda anche <@ref="diff">, <@ref="logs">, <@ref="lags">, <@ref="ldiff">, <@ref="sdiff"> e <@ref="square"> per alcune scorciatoie. Nel contesto di una formula <@lit="genr">, le variabili esistenti devono essere referenziate per nome, non per numero identificativo. La formula dev'essere una combinazione ben definita di nomi di variabile, costanti, operatori e funzioni (descritte oltre). Ulteriori dettagli su alcuni aspetti di questo comando si possono trovare nella <@pdf="la guida all'uso di gretl">.
Il comando <@lit="genr"> può produrre come risultato una serie o uno scalare. Ad esempio, la formula <@lit="x2 = x * 2"> produce una serie se la variabile <@lit="x"> è una serie e uno scalare se <@lit="x"> è uno scalare. Le formule <@lit="x = 0"> e <@lit="mx = mean(x)"> producono degli scalari. In alcune circostanze, può essere utile che un risultato scalare sia espanso in una serie o in un vettore: è possibile ottenere questo risultato usando <@lit="series"> come "alias" per il comando <@lit="genr">. Ad esempio, <@lit="series x = 0"> produce una serie con tutti i valori pari a 0. Allo stesso modo, è possibile usare <@lit="scalar"> come alias per <@lit="genr">, ma non è possibile forzare un risultato vettoriale in uno scalare: con questa parola chiave si indica che il risultato <@itl="dovrebbe essere"> uno scalare; se non lo è, viene emesso un messaggio di errore.
Quando una formula produce una serie o un vettore come risultato, l'intervallo su cui essi sono definiti dipende dall'impostazione attuale del campione. È quindi possibile definire una serie a pezzi, alternando l'uso dei comandi <@lit="smpl"> e <@lit="genr">.
Gli <@itl="operatori aritmetici"> supportati sono, in ordine di precedenza: <@lit="^"> (esponenziale); <@lit="*">, <@lit="/"> e <@lit="%"> (modulo o resto); <@lit="+"> e <@lit="-">.
Gli <@itl="operatori Booleani"> disponibili sono (ancora in ordine di precedenza): <@lit="!"> (negazione), <@lit="&&"> (AND logico), <@lit="||"> (OR logico), <@lit=">">, <@lit="<">, <@lit="=">, <@lit=">="> (maggiore o uguale), <@lit="<="> (minore o uguale) e <@lit="!="> (disuguale). Gli operatori Booleani possono essere usati per costuire variabili dummy: ad esempio <@lit="(x > 10)"> produce 1 se <@lit="x"> > 10, 0 altrimenti.
Le costanti predefinite sono <@lit="pi"> e <@lit="NA">. L'ultima rappresenta il codice per i valori mancanti: è possibile inizializzare una variabile con valori mancanti usando <@lit="scalar x = NA">.
Il comando <@lit="genr"> supporta un'ampia gamma di funzioni matematiche e statistiche, da quelle più comuni a quelle di uso specifico in econometria. Inoltre offre l'accesso a numerose variabili interne che vengono definite nel corso della stima di regressioni, dell'esecuzione di test, e così via. Per un elenco delle funzioni e degli accessori, si veda: <@gfr="la guida alle funzioni di gretl">.
Oltre agli operatori e alle funzioni mostrati, ci sono alcuni usi speciali del comando <@lit="genr">:
<indent>
• <@lit="genr time"> crea una variabile trend temporale (1,2,3,…) chiamata <@lit="time">. <@lit="genr index"> fa la stessa cosa, ma chiamando la variabile <@lit="index">.
</indent>
<indent>
• <@lit="genr dummy"> crea una serie di variabili dummy a seconda della periodicità dei dati. Ad esempio, nel caso di dati trimestrali (periodicità 4) il programma crea <@lit="dq1">, che vale 1 nel primo trimestre e 0 altrove, <@lit="dq2"> che vale 1 nel secondo trimestre e 0 altrove, e così via. Nel caso di dati mensili, le dummy si chiamano <@lit="dm1">, <@lit="dm2"> e così via. Con altre frequenze dei dati, i nomi delle dummy sono <@lit="dummy_1">, <@lit="dummy2">, ecc.
</indent>
<indent>
• <@lit="genr unitdum"> e <@lit="genr timedum"> creano insiemi di variabili dummy speciali da usare in un dataset di tipo panel. Il primo comando crea dummy che rappresentano le unità cross section, il secondo i periodi di osservazione.
</indent>
<@itl="Nota">: nella versione a riga di comando del programma, i comandi <@lit="genr"> che estraggono dati relativi al modello si riferiscono sempre al modello stimato per ultimo. Questo vale anche per la versione grafica del programma se si usa <@lit="genr"> nel "terminale di gretl" o si immette una formula usando l'opzione "Definisci nuova variabile" nel menù Variabile della finestra principale. Usando la versione grafica, però, è possibile anche estrarre i dati da qualunque modello mostrato in una finestra (anche se non è il modello più recente) usando il menù "Analisi" nella finestra del modello.
La variabile speciale <@lit="t"> serve da indice per le osservazioni (<@lit="obs"> è un sinonimo). Ad esempio, <@lit="genr dum = (t=15)"> crea una variabile dummy che vale 1 per l'osservazione 15 e 0 altrove. È anche possibile usare questa variabile per selezionare alcune osservazioni particolari secondo la data o il nome. Ad esempio <@lit="genr d = (obs>1986:4)">, <@lit="genr d = (obs>"2008/04/01")">, <@lit="genr d = (obs="CA")">. Quando si usa una data o un nome dell'osservazione, questi vanno racchiusi tra virgolette doppie, mentre non è strettamente necessario farlo per le date trimestrali e mensili.
Nota: quando si usa <@lit="t"> e <@lit="obs"> con serie storiche annuali, il valore corrisponde sempre all'anno dell'osservazione. Quindi se si hanno dati annuali che iniziano nel 1970, l'osservazione per il 1980 corrisponde a <@lit="t=1980">, non a <@lit="t=10">. Con dati trimestrali o mensili, invece, <@lit="t=10"> corrisponde alla decima osservazione.
È possibile estrarre dei valori scalari da una serie usando una formula <@lit="genr"> con la sintassi <@var="nome-variabile"><@lit="["><@var="osservazione"><@lit="]">. Il valore di <@var="osservazione"> può essere specificato con un numero o una data. Esempi: <@lit="x[5]">, <@lit="CPI[1996:01]">. Per i dati giornalieri occorre usare la forma <@var="AAAA/MM/GG">, ad esempio <@lit="ibm[1970/01/23]">.
È possibile modificare una singola osservazione in una serie usando <@lit="genr">. Per farlo, occorre aggiungere un numero di osservazione o una data valida tra parentesi quadre al nome della variabile nel lato sinistro della formula. Ad esempio: <@lit="genr x[3] = 30"> o <@lit="genr x[1950:04] = 303.7">.
Ecco un esempio di utilizzo delle variabili dummy: si supponga che <@lit="x"> abbia valori 1, 2, o 3 e si desiderino tre variabili dummy, <@lit="d1"> = 1 se <@lit="x"> = 1, e 0 altrove, <@lit="d2"> = 1 se <@lit="x"> = 2 e così via. Per crearle, basta usare i comandi:
<code>
genr d1 = (x=1)
genr d2 = (x=2)
genr d3 = (x=3)
</code>
Accesso dal menù: /Variabile/Definisci nuova variabile
Accesso alternativo: Menù pop-up nella finestra principale
# gmm Estimation
Opzioni: <@lit="--two-step"> (Stima a due passi)
<@lit="--iterate"> (GMM iterato)
<@lit="--vcv"> (Mostra la matrice di covarianza)
<@lit="--verbose"> (Mostra i dettagli delle iterazioni)
<@lit="--lbfgs"> (usa il massimizzatore L-BFGS-B anziché il BFGS standard)
Esegue la stima col metodo dei momenti generalizzato (Generalized Method of Moments, GMM) usando l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Occorre specificare uno o più comandi per aggiornare le quantità rilevanti (tipicamente i residui GMM), una o più condizioni di ortogonalità, una matrice iniziale dei pesi e un elenco dei parametri da stimare, il tutto racchiuso tra le parole chiave <@lit="gmm"> e <@lit="end gmm">.
Si veda la <@pdf="la guida all'uso di gretl"> per i dettagli. Quello che segue è un semplice esempio illustrativo.
<code>
gmm e = y - X*b
orthog e ; W
weights V
params b
end gmm
</code>
Nell'esempio si assume che <@lit="y"> e <@lit="X"> siano matrici di dati, <@lit="b"> sia un vettore con i valori dei parametri, <@lit="W"> sia una matrice di strumenti, e <@lit="V"> un'appropriata matrice dei pesi. La dichiarazione
<code>
orthog e ; W
</code>
indica che il vettore dei residui <@lit="e"> è in linea di principio ortogonale ad ognuno degli strumenti che compongono le colonne di <@lit="W">.
Accesso dal menù: /Modello/GMM
# gnuplot Graphs
Argomenti: <@var="variabili-y"> <@var="variabile-x"> [ <@var="variabile-dummy"> ]
Opzioni: <@lit="--with-lines">[=<@var="varspec">] (usa linee invece che punti)
<@lit="--with-lp">[=<@var="varspec">] (usa linee e punti)
<@lit="--with-impulses">[=<@var="varspec">] (usa linee verticali)
<@lit="--time-series"> (mostra rispetto al tempo)
<@lit="--suppress-fitted"> (non mostra la linea stimata)
<@lit="--single-yaxis"> (forza l'uso di un solo asse delle ordinate)
<@lit="--linear-fit"> (mostra fit minimi quadrati)
<@lit="--inverse-fit"> (mostra fit inverso)
<@lit="--quadratic-fit"> (mostra fit quadratico)
<@lit="--cubic-fit"> (mostra fit cubico)
<@lit="--loess-fit"> (mostra fit non-parametrico)
<@lit="--semilog-fit"> (mostra fit semilogaritmico)
<@lit="--dummy"> (si veda sotto)
<@lit="--matrix">=<@var="name"> (mostra le colonne di una data matrice)
<@lit="--output">=<@var="filename"> (ridirige l'output su file)
<@lit="--input">=<@var="filename"> (prende l'input da file)
Esempi: <@lit="gnuplot y1 y2 x">
<@lit="gnuplot x --time-series --with-lines">
<@lit="gnuplot wages educ gender --dummy">
<@lit="gnuplot y1 y2 x --with-lines=y2">
Le variabili nella lista <@var="variabili-y"> vengono mostrate rispetto alla variabile <@var="variabile-x">. Per avere un grafico storico è possibile usare <@lit="time"> come <@var="variabile-x">, oppure usare l'opzione <@lit="--time-series">.
Per default, i dati sono mostrati come punti; ma questa scelta può essere modificata usando una delle opzioni <@opt="--with-lines">, <@opt="--with-lp"> or <@opt="--with-impulses">. Se il grafico contiene più di una serie, l'effetto di queste opzioni può essere limitato ad un sottoinsieme delle variabili usando il parametro <@var="varspec">. Esso deve essere dato sotto forma di una lista separata da virgole dei nomi (o dei numeri) delle variabili da tracciare con linee e/o con impulsi. L'esempio più sotto mostra come tracciare <@lit="y1"> e <@lit="y2"> contro <@lit="x">, in modo tale che <@lit="y2"> sia rappresentata da una linea ma <@lit="y1"> da punti.
Usando l'opzione <@lit="--dummy">, occorre fornire esattamente tre variabili: una variabile <@itl="y">, una variabile <@itl="x">, e una variabile dummy <@var="dumvar">. L'effetto è quello di mostrare <@var="y"> rispetto a <@var="x"> colorando in modo diverso i vari punti, a seconda che <@var="dumvar"> valga 1 o 0.
In generale è necessario specificare sia l'argomento <@var="yvars"> che quello <@var="xvar">; entrambi devono indicare variabili nel dataset corrente (per nome o numero identificativo). Se tuttavia viene specificata con l'opzione <@opt="--matrix"> una matrice definita in precedenza questi argomenti diventano opzionali: se la matrice specificata ha <@itl="k"> colonne, di default le prime <@itl="k"> – 1 sono considerate come <@var="yvars">, e l'ultima come <@var="xvar">. Se viene indicata l'opzione <@opt="--time-series">, tuttavia, il comando fornisce il grafico di tutte le <@itl="k"> variabili rispetto al tempo. Se si desidera il grafico solo di alcune colonne della matrice è necessario identificare <@var="yvars"> e <@var="xvar"> fornendo l'indice delle colonne corrispondenti, dove la prima colonna ha indice 1. Per esempio, se si desidera un grafico a dispersione della colonna 2 della matrice <@lit="M"> rispetto alla colonna 1, il comando da digitare è:
<code>
gnuplot 2 1 --matrix=M
</code>
In modalità interattiva il risultato è mostrato immediatamente. In modalità "batch", viene scritto un file di comandi gnuplot, chiamato <@lit="gpttmpN.plt">, a partire da N = <@lit="01">; il grafico vero e proprio può essere generato usando il programma gnuplot (su MS Windows: wgnuplot). Questo comportamento può essere modificato usando l'opzione <@opt="--output="><@var="filename">, che controlla il nome del file utilizzato e contemporaneamente permette di specificare un particolare formato di output usando l'estensione del nome del file (le tre lettere che seguono il .): <@lit=".eps"> produce un file Encapsulated PostScript (EPS); <@lit=".pdf"> produce un file PDF; <@lit=".png"> produce un formato PNG, <@lit=".emf"> un formato EMF (Enhanced MetaFile), <@lit=".fig"> un file Xfig, e <@lit=".svg"> uno SVG (Scalable Vector Graphics). Se come nome del file si indica "<@lit="display">", il grafico è inviato allo schermo come nella modalità interattiva. Se si indica un nome del file con un'estensione diversa da quelle appena citate viene prodotto un file di comandi gnuplot.
Le varie opzioni "fit" si applicano solo nel caso di un diagramma a dispersione bivariato. Il comportamento predefinito consiste nel mostrare la linea con le stime OLS, se e solo se il coefficiente di pendenza è significativo almeno al 10 per cento. Se si usa l'opzione <@lit="suppress"> non viene mostrata alcuna linea. Se si usa l'opzione <@lit="linear">, la linea OLS viene mostrata a prescindere dalla sua significatività. Le altre opzioni (<@lit="inverse">, <@lit="quadratic"> e <@lit="loess">) mostrano rispettivamente un fit inverso (la regressione di <@itl="y"> su 1/<@itl="x">), un fit quadratico o un fit loess (chiamato a volte anche "lowess", una regressione robusta con pesi locali).
È disponibile un'ulteriore opzione per questo comando: dopo la specificazione delle variabili e le eventuali opzioni, è possibile aggiungere direttamente dei comandi gnuplot per modificare l'aspetto visivo del grafico (ad esempio, impostando il titolo e o gli intervalli degli assi). Questi comandi aggiuntivi vanno inclusi tra parentesi graffe e ogni comando va separato con un punto e virgola; è possibile usare una barra rovesciata (<@lit="\">) per continuare un gruppo di comandi gnuplot sulla riga successiva. Ecco un esempio della sintassi:
<code>
{ set title 'Il mio titolo'; set yrange [0:1000]; }
</code>
Accesso dal menù: /Visualizza/Grafico
Accesso alternativo: Menù pop-up nella finestra principale, pulsante grafico sulla barra degli strumenti
# graphpg Graphs
Varianti: <@lit="graphpg add">
<@lit="graphpg fontscale "><@var="value">
<@lit="graphpg show">
<@lit="graphpg free">
<@lit="graphpg --output="><@var="filename">
La "pagina dei grafici" funzionerà solo se si è installato il sistema di composizione LaTeX e si è in grado di generare e visualizzare file in formato postscript.
Nella finestra della sessione, è possibile trascinare fino a otto grafici sull'icona della pagina dei grafici. Facendo doppio clic sull'icona della pagina dei grafici (o facendo clic col tasto destro e selezionando "Mostra"), la pagina contenente i grafici selezionati verrà composta e aperta con il proprio visualizzatore di file postscript, da cui sarà possibile stamparla.
Per pulire la pagina dei grafici, fare clic col tasto destro sull'icona e selezionare "Pulisci".
Su sistemi diversi da MS Windows, può essere necessario modificare l'impostazione del programma per visualizzare il postscript, che si trova nella sezione "Programmi" della finestra di dialogo delle Preferenze di gretl (nel menù Strumenti della finestra principale).
E' anche possibile operare sulla pagina del grafico usanod uno script oppure usando la console (nel programma GUI). Sono disponibili i comandi seguenti:
Per aggiungere un grafico alla pagina dei grafici, digitate il comando <@lit="graphpg add"> dopo aver salvato un grafico con un nome, come in
<code>
grf1 <- gnuplot Y X
graphpg add
</code>
Per aprire la pagina dei grafici: <@lit="graphpg show">.
Per svuotare la pagina dei grafici: <@lit="graphpg free">.
Per modificare la dimensione del font usato nella pagina dei grafici usate <@lit="graphpg fontscale"> <@var="scale">, dove <@var="scale"> è un moltiplicatore (con un valore di default pari a 1.0). Per rendere il fonto più grande del 50 per cento, dunque, è possibile scrivere
<code>
graphpg fontscale 1.5
</code>
Per stampare su un file la pagina dei grafici usate l'opzione <@opt="--output="> seguita dal nome di un file; questo nome deve avere il suffisso "<@lit=".pdf">", "<@lit=".ps">" o "<@lit=".eps">". Per esempio:
<code>
graphpg --output="myfile.pdf"
</code>
In questo contesto l'output usa linee colorate di default; per usare linee punteggiate o tratteggiate al posto dei colori è possibile aggiungere l'opzione <@opt="--monochrome">.
# hausman Tests
Questo test è disponibile solo dopo aver stimato un modello OLS su dati panel (si veda anche <@lit="setobs">). Testa il semplice modello "pooled" (con tutte le osservazioni mescolate indistintamente) contro le principali alternative: il modello a effetti fissi e quello a effetti casuali.
Il modello a effetti fissi permette all'intercetta della regressione di variare per ogni unità cross section. Viene eseguito un test <@itl="F"> per l'ipotesi nulla che le intercette non differiscano tra loro. Il modello a effetti casuali scompone la varianza dei residui in due parti: una specifica all'unità cross section e una specifica all'osservazione particolare (la stima può essere eseguita solo se il numero delle unità cross section nel dataset è maggiore del numero dei parametri da stimare). La statistica LM di Breusch–Pagan testa l'ipotesi nulla che il modello pooled OLS sia adeguato contro l'alternativo modello a effetti casuali.
Può accadere che il modello pooled OLS sia rifiutato nei confronti di entrambe le alternative, a effetti fissi o casuali. A patto che gli errori specifici di unità o di gruppo siano non correlati con le variabili indipendenti, lo stimatore a effetti casuali è più efficiente dello stimatore a effetti fissi; nel caso contrario lo stimatore a effetti casuali non è consistente e deve essergli preferito lo stimatore a effetti fissi. L'ipotesi nulla per il test di Hausman è che l'errore specifico di gruppo non sia correlato con le variabili indipendenti (e quindi che il modello a effetti casuali sia preferibile). Un basso p-value per questo test suggerisce di rifiutare il modello a effetti casuali in favore del modello a effetti fissi.
Accesso dal menù: Finestra del modello, /Test/HAUSMAN - Diagnosi panel
# heckit Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti"> ; <@var="equazione di selezione">
Opzioni: <@lit="--quiet"> (non mostra i risultati)
<@lit="--robust"> (errori standard QML)
<@lit="--two-step"> (esegue la stima in due passi)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra risultati aggiuntivi)
Esempio: <@lit="heckit y 0 x1 x2 ; ys 0 x3 x4">
Vedi anche <@inp="heckit.inp">
Modello di selezione di tipo Heckman. Nella specificazione, la lista che precede il punto e virgola rappresenta l'equazione principale, mentre la seconda lista rappresenta l'equazione di selezione. La variabile dipendente nell'equazione di selezione (<@lit="ys"> nell'esempio visto sopra) deve essere una variabile binaria.
Per impostazione predefinita, i parametri sono stimati per massima verosimiglianza. La matrice di covarianza dei parametri è calcolata usando l'inversa negativa dell'Hessiana. Se si vuole usare la procedura di stima in due passi, basta usare l'opzione <@lit="--two-step">. In questo caso, la matrice di covarianza dei parametri dell'equazione principale è corretta nel modo descritto da Heckman (1979).
Si noti che nella stima di massima verosimiglianza viene impiegata una matrice hessiana calcolata numericamente; ciò può condurre a una stima inaccurata della matrice di covarianze se l'ordine di grandezza delle variabili esplicative è tale per cui alcuni dei coefficienti stimati risultano molto piccoli in valore assoluto. Il problema verrà affrontato nelle versioni future; nel frattempo, si può aggirare il problema riscalando opportunamente i regressori problematici.
Accesso dal menù: /Modello/Modelli non lineari/Heckit
# help Utilities
Varianti: <@lit="help">
<@lit="help functions">
<@lit="help"> <@var="comando">
<@lit="help"> <@var="funzione">
Opzione: <@lit="--func"> (sceglie l'aiuto sulle funzioni)
Se non vengono indicati argomenti, mostra un elenco dei comandi disponibili. Indicando l'argomento <@lit="functions">, mostra un elenco delle funzioni disponibili (si veda <@ref="genr">).
<@lit="help"> <@var="comando"> descrive il <@var="comando"> (ad es. <@lit="help smpl">). <@lit="help"> <@var="funzione"> descrive la <@var="funzione"> (ad es. <@lit="help ldet">). Alcune funzioni hanno lo stesso nome dei comandi relativi (ad esempio <@lit="diff">): in questo caso verrà mostrato l'aiuto relativo al comando, a meno che non si usi l'opzione <@lit="--func">.
Accesso dal menù: /Aiuto
# hsk Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzione: <@lit="--vcv"> (mostra la matrice di covarianza)
Questo comando è utile in presenza di eteroschedasticità sotto forma di una funzione incognita dei regressori, che può essere approssimata da una relazione quadratica. In questo contesto, offre la possibilità di avere errori standard consistenti e stime dei parametri più efficienti, rispetto alla stima OLS.
La procedura richiede: (a) la stima OLS del modello, (b) una regressione ausiliaria per generare la stima della varianza dell'errore e (c) la stima con minimi quadrati ponderati, usando come peso il reciproco della varianza stimata.
Nella regressione ausiliaria (b) il logaritmo dei quadrati dei residui dalla prima regressione OLS viene regredito sui regressori originali e sui loro quadrati. La trasformazione logaritmica viene effettuata per assicurarsi che le varianze stimate siano non negative. Indicando con <@itl="u"><@sup="*"> i valori stimati da questa regressione, la serie dei pesi per la regressione con minimi quadrati ponderati è data da 1/exp(<@itl="u"><@sup="*">).
Accesso dal menù: /Modello/Altri modelli lineari/HSK - WLS corretti per eteroschedasticità
# hurst Statistics
Argomento: <@var="nome-variabile">
Calcola l'esponente di Hurst (una misura di persistenza, o di memoria lunga) per una serie storica con almeno 128 osservazioni.
L'esponente di Hurst è discusso da Mandelbrot. In termini teorici è l'esponente <@itl="H"> nella relazione
<@fig="hurst">
dove RS è l'"intervallo riscalato" della variabile <@itl="x"> in un campione dell'ampiezza <@itl="n">, mentre <@itl="a"> è una costante. L'intervallo riscalato è l'intervallo (valore massimo meno valore minimo) del valore cumulato, o somma parziale, di <@itl="x"> sul periodo del campione (dopo aver sottratto la media campionaria), diviso per lo scarto quadratico medio campionario.
Come punto di riferimento, se <@itl="x"> è un rumore bianco (media zero, persistenza zero) l'intervallo dei suoi valori cumulati (che forma una passeggiata casuale), scalato per lo scarto quadratico medio, cresce come la radice quadrata dell'ampiezza campionaria, ossia ha un esponente di Hurst atteso pari a 0.5. Valori dell'esponente sensibilmente maggiori di 0.5 indicano persistenza della serie, mentre valori minori di 0.5 indicano anti-persistenza (autocorrelazione negativa). In teoria l'esponente deve essere compreso tra 0 e 1, ma in campioni finiti è possibile ottenere delle stime per l'esponente maggiori di 1.
In gretl, l'esponente è stimato usando il sotto-campionamento binario: si inizia dall'intero intervallo dei dati, quindi si usano le due metà dell'intervallo, poi i quattro quarti, e così via. Il valore RS è la media presa sui vari campioni. L'esponente è quindi stimato come il coefficiente di pendenza della regressione del logaritmo di RS sul logaritmo dell'ampiezza del campione.
Accesso dal menù: /Variabile/Esponente di Hurst
# if Programming
Struttura di controllo per l'esecuzione dei comandi. Sono supportate le tre forme seguenti:
<code>
# forma semplice
if condition
commands
endif
# a due rami
if condition
commands1
else
commands2
endif
# a tre o più rami
if condition1
commands1
elif condition2
commands2
else
commands3
endif
</code>
La <@var="condizione"> deve essere un'espressione Booleana, per la cui sintassi si veda <@ref="genr">. Può essere incluso più di un blocco <@lit="elif">. Inoltre, i blocchi <@lit="if"> … <@lit="endif"> possono essere nidificati.
# include Programming
Argomento: <@var="file-input">
Da usare in uno script di comandi, principalmente per includere definizioni di funzioni. Esegue i comandi nel <@var="file-input"> e ripassa il controllo allo script principale. Per includere una funzione che fa parte di un pacchetto, occorre specificare anche l'estensione del file.
Si veda anche il comando <@ref="run">.
# info Dataset
Mostra le informazioni aggiuntive contenute nel file di dati attuale.
Accesso dal menù: /Dati/Visualizza descrizione
Accesso alternativo: Finestre di esplorazione dei dati
# intreg Estimation
Argomenti: <@var=""> <@var="var-min"> <@var="var-max"> <@var="var-indip">
Opzioni: <@lit="--quiet"> (non mostra i risultati)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--robust"> (errori standard robusti)
Esempio: <@lit="intreg lo hi const x1 x2">
Vedi anche <@inp="wtp.inp">
Stima un modello di regressione per intervallo. Questo modello è adatto al caso in cui la variabile dipendente è osservata in modo imperfetto per alcune osservazioni (o anche tutte). In altre parole, si ipotizza che il processo generatore dei dati sia
<@itl="y* = x b + u">
ma che solo <@itl="m <= y* <= M"> sia osservato (l'intervallo può essere limitato a destra o a sinistra). Si noti che per alcune osservazioni <@itl="m"> può essere uguale a <@itl="M">. Le variabili <@var="var-min"> e <@var="var-max"> devono contenere valori <@lit="NA"> nel caso di osservazioni non limitate a sinistra o a destra.
Il modello è stimato per massima verosimiglianza, ipotizzando la normalità del termine di disturbo.
Per impostazione predefinita, gli errori standard sono calcolati usando l'inversa dell'Hessiana. Se si usa l'opzione <@lit="--robust">, vengono calcolati invece gli errori standard QML o Huber–White. In questo caso la matrice di covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del gradiente.
Accesso dal menù: /Modello/Modelli non lineari/Regressione per intervalli
# join Dataset
Argomenti: <@var="filename"> <@var="varname">
Opzioni: <@lit="--data">=<@var="column-name"> (v. oltre)
<@lit="--filter">=<@var="expression"> (v. oltre)
<@lit="--ikey">=<@var="inner-key"> (v. oltre)
<@lit="--okey">=<@var="outer-key"> (v. oltre)
<@lit="--aggr">=<@var="method"> (v. oltre)
Questo comando importa una serie di dati dal file di origine <@var="filename"> (che deve essere un file di dati testuale delimitato) assegnandoli alla variabile <@var="varname">. Per maggiori dettagli, si veda <@pdf="la guida all'uso di gretl">; in questa sede ci limitiamo a ricordare brevemente le opzioni disponibili.
L'opzione <@opt="--data"> può essere usata per specificare l'intestazione della colonna nel file di origine se quest'ultima è diversa dal nome con il quale dovrebbero essere chiamati i dati in gretl.
L'opzione <@opt="--filter"> può essere usata per specificare un criterio da seguire per filtrare i dati di origine (in altre parole, per selezionare un osttoinsieme di osservazioni).
Le opzioni <@opt="--ikey"> e <@opt="--okey"> possono essere utilizzate per specificare una relazione fra le osservazioni nel dataset corrente e quelle nel file di origine (per esempio, gli individui possono essere assegnati alla famiglia di appartenenza).
L'opzione <@opt="--aggr"> viene usata quando la relazione fra osservazioni nel dataset corrente e nel file di oriogine non è biunivoca.
L'opzione <@opt="--tkey"> è applicabile solo quando il dataset corrente ha una struttura di serie storiche. Viene usato per specificare il nome di una colonna contenete le date da accoppiare al dataset e/o il formato in cui le date sono rappresentate in quella colonna.
V. anche <@ref="append"> per alcune semplici operazioni di unione di dataset.
# kalman Estimation
Opzioni: <@lit="--cross"> (permette la correlazione fra i due vettori di disturbi)
<@lit="--diffuse"> (usa un'inizializzazione diffusa)
Inizia un blocco di istruzioni per impostare un filtro di Kalman. Questo blocco deve terminare con la linea <@lit="end kalman">, alla quale possono essere aggiunte le opzioni elencate sopra. Le istruzioni del blocco specificano le matrici che compongono il filtro. Per esempio,
<code>
kalman
obsy y
obsymat H
statemat F
statevar Q
end kalman
</code>
Vedi <@pdf="la guida all'uso di gretl"> per ulteriori dettagli.
Vedi anche <@xrf="kfilter">, <@xrf="ksimul">, <@xrf="ksmooth">.
# kpss Tests
Argomenti: <@var="ordine"> <@var="lista-variabili">
Opzioni: <@lit="--trend"> (include un trend)
<@lit="--verbose"> (mostra i risultati della regressione)
<@lit="--quiet"> (non mostra i risultati)
<@lit="--difference"> (usa la differenza prima della variabile)
Esempi: <@lit="kpss 8 y">
<@lit="kpss 4 x1 --trend">
For use of this command with panel data please see the final section in this entry.
Calcola il test KPSS (Kwiatkowski, Phillips, Schmidt e Shin, 1992) per la stazionarietà di ognuna delle variabili specificate (o della loro differenza prima, se si usa l'opzione <@lit="--difference">. L'ipotesi nulla è che la variabile in questione sia stazionaria, attorno a un valore fisso o, se è stata usata l'opzione <@lit="--trend">, attorno a un trend deterministico lineare.
L'argomento ordine determina la dimensione della finestra usata per il livellamento di Bartlett. Se si usa l'opzione <@lit="--verbose">, vengono mostrati anche i risultati della regressione ausiliaria, insieme alla varianza stimata della componente random walk della variabile.
Il valori critici riportati per questa statistica test sono basati sulle superfici di risposta stimati da <@bib="Sephton (Economics Letters, 1995);sephton95">, che per piccoli campioni sono più accurati di quelli forniti nell'articolo originale di KPSS. Quando la statistica test si trova fra i valori critici al 10 e all'1 per cento viene mostrato un p-value ottenuto per interpolazione lineare, che non dovrebbe essere accettato in maniera acritica.
<@itl="Panel data">
Quando il comando <@lit="kpss"> viene usato con dati panel per calcolare un test panel di radice unitaria, le opzioni applicabili e i risultati mostrati sono leggermente diversi. Mentre nel caso di serie storiche regolari potete fornire una lista di variabili da testare, con dati panel il comando può testare solo una variabile alla volta. L'opzione <@opt="--verbose">, inoltre, ha un isgnificato diverso: produce un breve resoconto del test per ciascuna singola serie storica (di default viene mostrato solo il risultato complessivo).
Se possibile viene calcolato il test complessivo (ipotesi nulla: la ariabile in questione è stazionaria per tutte le unità panel) usando il metodo di <@bib="Choi (Journal of International Money and Finance, 2001);choi01">. Questo calcolo non è sempre immediato perchè mentre il test di Choi è basato sui p-valu dei test sulle singole serie, attualmente non esiste un modo per calcolare i p-value della statistica test KPSS; dobbiamo perciò basarci su qualche valore critico.
Se per una data variabile la statistica test cade fra i valori critici al 10 e all'1 per cento siamo in grado di interpolare un p-value. Ma se il test cade a sinistra del valore critico al 10 per cento, o supera quello all'1 per cento, non riusciamo a interpolare e tutto ciò che possiamo ottenere è un limite superiore al test globale di Choi. Se le singole statistiche test si trovano a sinistra del valore critico al 10 per cento per alcune unità ma superano quello all'1 per cento per altre non è possibile neppure il calcolo del limite superiore del test globale.
Accesso dal menù: /Variabile/Test KPSS
# labels Dataset
Varianti: <@lit="labels ["> <@var="varlist"> <@lit="]">
<@lit="labels --to-file="><@var="filename">
<@lit="labels --from-file="><@var="filename">
<@lit="labels --delete">
Nella sua prima forma mostra le etichette informative (se presenti) per le variabili in <@var="varlist">, oppure per tutte le variabili nel dataset se <@var="varlist"> non è specificata.
Con l'opzione <@opt="--to-file">, scrive nel file indicato le etichette di tutte le variabili nel dataset, una per linea. Se non sono presenti etichette viene emesso un messaggio d'errore; se alcune variabili hanno etichette e altre no, per le seconde viene mostrata una linea vuota.
Con l'opzione <@opt="--from-file">, legge il file specificato (che deve essere di testo) e assegna le etichette alle variabili nel dataset, leggendo un'etichetta per linea e interpretando linee vuote come etichette vuote.
L'opzione <@opt="--delete"> da quello che vi attendete: rimuove dal dataset tutte le etichette di variabili.
# lad Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzione: <@lit="--vcv"> (mostra la matrice di covarianza)
Calcola una regressione che minimizza la somma delle deviazioni assolute dei valori stimati dai valori effettivi della variabile dipendente. Le stime dei coefficienti sono derivate usando l'algoritmo del simplesso di Barrodale–Roberts; viene mostrato un messaggio di avvertimento se la soluzione non è unica.
Gli errori standard sono derivati usando la procedura bootstrap con 500 estrazioni. La matrice di covarianza per le stime dei parametri, mostrata se si usa l'opzione <@lit="--vcv">, si basa sulla stessa procedura.
Accesso dal menù: /Modello/Stima robusta/LAD - Minime deviazioni assolute
# lags Transformations
Argomenti: [ <@var="ordine"> ; ] <@var="lista-variabilii">
Esempi: <@lit="lags x y">
<@lit="lags 12 ; x y">
Crea delle nuove variabili come valori ritardati di ognuna delle variabili nella <@var="lista-variabili">. Il numero dei ritardi può essere indicato dal primo parametro opzionale, altrimenti sarà pari alla periodicità del dataset. Ad esempio, se la periodicità è 4 (trimestrale), il comando <@lit="lags x y"> crea
<code>
x_1 = x(t-1)
x_2 = x(t-2)
x_3 = x(t-3)
x_4 = x(t-4)
</code>
Il numero dei ritardi creati può essere indicato come primo parametro opzionale (se presente, deve essere seguito da un punto e virgola).
Accesso dal menù: /Aggiungi/Ritardi delle variabili selezionate
# ldiff Transformations
Argomento: <@var="lista-variabili">
Calcola la differenza prima del logaritmo naturale di ogni variabile della <@var="lista-variabili"> e la salva in una nuova variabile con il prefisso <@lit="ld_">. Così, <@lit="ldiff x y"> crea le nuove variabili
<code>
ld_x = log(x) - log(x(-1))
ld_y = log(y) - log(y(-1))
</code>
Accesso dal menù: /Aggiungi/Differenze logaritmiche
# leverage Tests
Opzione: <@lit="--save"> (salva le variabili)
Deve seguire immediatamente un comando <@lit="ols">. Calcola il "leverage" (<@itl="h">, compreso tra 0 e 1) di ogni osservazione nel campione su cui è stato stimato il precedente modello. Mostra il residuo (<@itl="u">) per ogni osservazione assieme al leverage corrispondente e a una misura della sua influenza sulla stima: <@fig="influence">. I "punti di leverage" per cui il valore di <@itl="h"> supera 2<@itl="k">/<@itl="n"> (dove <@itl="k"> è il numero dei parametri stimati e <@itl="n"> è l'ampiezza del campione) sono indicati con un asterisco. Per i dettagli sui concetti di leverage e influenza, si veda <@bib="Davidson and MacKinnon (1993);davidson-mackinnon93">, capitolo 2.
Vengono mostrati anche i valori DFFITS: questi sono "residui studentizzati" (ossia i residui previsti, divisi per i propri errori standard) moltiplicati per <@fig="dffit">. Per una discussione dei residui studentizzati e dei valori DFFITS si veda <@bib="Maddala's Introduction to Econometrics;maddala92">, cap. 12, oppure <@bib="Belsley, Kuh and Welsch (1980);belsley-etal80">.
In breve, i "residui previsti" sono la differenza tra il valore osservato e il valore stimato della variabile dipendente all'osservazione <@itl="t">, ottenuti da una regressione in cui quell'osservazione è stata omessa (oppure in cui è stata aggiunta una variabile dummy che vale 1 solo per l'osservazione <@itl="t">); il residuo studentizzato si ottiene dividendo il residuo previsto per il proprio errore standard.
Se si usa l'opzione <@lit="--save">, il leverage, il valore di influenza e il valore DFFITS vengono aggiunti al dataset in uso.
Dopo l'esecuzione, l'accessore <@lit="$test"> restituisce il criterio di validazione incrociata, definito come la somma dei quadrati degli scarti fra la variabile dipendente e il suo valore previsto, calcolato a partire da un campione dal quale quell'osservazione è stata esclusa. (Questo stimatore è chiamato <@itl="leave-one-out">). Per una discussione più approfondita del criterio di validazione incrociata, v. Davidson e MacKinnon's <@itl="Econometric Theory and Methods">, pag. 685–686, e i riferimenti bibliografici ivi citati.
Accesso dal menù: Finestra del modello, /Test/LEVERAGE - Osservazioni influenti
# levinlin Tests
Argomenti: <@var="order"> <@var="series">
Opzioni: <@lit="--nc"> (test senza costante)
<@lit="--ct"> (con costante e trend)
<@lit="--quiet"> (non mostra i risultati)
Esempi: <@lit="levinlin 0 y">
<@lit="levinlin 2 y --ct">
<@lit="levinlin {2,2,3,3,4,4} y">
Calcola il test di radice unitaria per dati panel di <@bib="Levin, Lin and Chu (2002);LLC2002">. L'ipotesi nulla che tutte le singole serie storiche contengano una radica unitaria, mentre l'alternativa è che nessuna delle serie storiche ne contenga una. (In altre parole, si assume un coefficiente AR(1) comune a tutte le serie, anche se altre proprietà statistiche delle serie possono variare da un'unità di osservazione all'altra.)
Di default le regressioni dei test ADF contengono una costante; per eliminarla usate l'opzione <@opt="--nc">; per aggiungere un trend lineare usate l'opzione <@opt="--ct">. (V. il comando <@ref="adf"> per una spiegazione delle regressioni ADF.)
Il valore (non negativo) <@var="order"> del numero di ritardi della variabile dipendente da usare nel test può essere indicato in due modi diversi. Se si fornisce uno scalare, questo viene applicato a tutte le serie nel panel. In alternativa è possibile fornire una matrice che contiene un particolare ordine di ritardo per ogni serie. La matrice deve essere un vettore con numero di elementi pari a quello delle unità di osservazione nel sottoinsieme corrente del campione, e può essere indicata per nome o costruita usando parentesi graffe come illustrato nell'ultimo degli esempi precedenti.
Accesso dal menù: /Variable/Unit root tests/Levin-Lin-Chu test
# logistic Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--ymax">=<@var="value"> (specifica il massimo della variabile dipendente)
<@lit="--vcv"> (mostra la matrice di covarianza)
Esempi: <@lit="logistic y const x">
<@lit="logistic y const x --ymax=50">
Regressione logistica: esegue una regressione OLS usando la trasformazione logistica sulla variabile dipendente:
<@fig="logistic1">
La variabile dipendente dev'essere strettamente positiva. Se è una frazione decimale, compresa tra 0 e 1, il valore predefinito per <@itl="y"><@sup="*"> (il massimo asintotico della variabile dipendente) è 1. Se la variabile dipendente è una percentuale, compresa tra 0 e 100, il valore predefinito di <@itl="y"><@sup="*"> è 100.
È possibile indicare un valore diverso per il massimo, usando l'opzione <@opt="--ymax">. Il valore fornito deve essere maggiore di tutti i valori osservati della variabile dipendente.
I valori stimati e i residui della regressione sono trasformati automaticamente usando
<@fig="logistic2">
dove <@itl="x"> rappresenta un valore stimato oppure un residuo della regressione OLS, usando la variabile dipendente trasformata. I valori riportati sono dunque confrontabili con la variabile dipendente originale.
Si noti che se la variabile dipendente è binaria, occorre usare il comando <@ref="logit"> invece di questo comando.
Accesso dal menù: /Modello/Modelli non lineari/Logistico
# logit Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--robust"> (errori standard robusti)
<@lit="--cluster">=<@var="clustvar"> (errori standard clusterizzati)
<@lit="--multinomial"> (stima un logit multinomiale)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--p-values"> (mostra i p-value invece delle pendenze)
Se la variabile dipendente è binaria (i suoi valori sono 0 o 1), esegue una stima di massima verosimiglianza dei coefficienti per le <@var="variabili-indipendenti"> con il metodo BRMR ("binary response model regression") descritto in Davidson e MacKinnon (2004). Visto che il modello è nonlineare, le pendenze dipendono dai valori delle variabili indipendenti: per impostazione predefinita, al posto dei p-value vengono mostrate le pendenze rispetto ad ognuna delle variabili indipendenti, calcolate in corrispondenza della media della variabile. Questo comportamento può essere soppresso usando l'opzione <@lit="--p-values">. La statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne la costante siano pari a zero.
In modalità predefinita, gli errori standard sono calcolati con l'inversa negativa dell'Hessiana. Se si usa l'opzione <@lit="--robust">, verranno calcolati gli errori standard QML o quelli di Huber–White. In questo caso, la matrice di covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10.
Se la variabile dipendente non è binaria, ma è discreta, si ottengono stime Logit ordinate. Tuttavia, se viene fornita l'opzione <@opt="--multinomial">, la variabile dipendente è interpretata come non ordinale, e vengono prodotte stime Logit Multinomiali. (In ambo i casi, verrà dato un errore se la dipendente non è discreta.) Nel caso multinomiale, l'accessore <@lit="$mnlprobs"> sarà disponibile dopo la stima; esso conterrà una matrice con le probabilità stimate dei possibili valori della dipendente per ogni osservazione (osservazioni per riga, valori per colonna).
Per condurre un'analisi delle proporzioni (dove la variabile dipendente è la proporzione dei casi che hanno una certa caratteristica in ogni osservazione, invece che una variabile binaria che indica se la caratteristica è presente o no), non bisogna usare il comando <@lit="logit">, ma occorre costruire la variabile logit come
<code>
genr lgt_p = log(p/(1 - p))
</code>
e usare questa come variabile dipendente in una regressione OLS. Si veda <@bib="Ramanathan (2002);ramanathan02">, capitolo 12.
Accesso dal menù: /Modello/Modelli non lineari/Logit
# logs Transformations
Argomento: <@var="lista-variabili">
Calcola il logaritmo naturale di ognuna delle variabili della <@var="lista-variabili"> e lo salva in una nuova variabile col prefisso <@lit="l_">, ossia una "elle" seguita da un trattino basso. Ad esempio <@lit="logs x y"> crea le nuove variabili <@lit="l_x"> = ln(<@lit="x">) e <@lit="l_y"> = ln(<@lit="y">).
Accesso dal menù: /Aggiungi/Logaritmi delle variabili selezionate
# loop Programming
Argomento: <@var="controllo">
Opzioni: <@lit="--progressive"> (abilita modalità speciali di alcuni comandi)
<@lit="--verbose"> (mostra i dettagli dei comandi genr)
<@lit="--quiet"> (non mostra il numero di iterazioni eseguite)
Esempi: <@lit="loop 1000">
<@lit="loop 1000 --progressive">
<@lit="loop while essdiff > .00001">
<@lit="loop i=1991..2000">
<@lit="loop for (r=-.99; r<=.99; r+=.01)">
<@lit="loop foreach i xlist">
Questo comando apre una modalità speciale, in cui il programma accetta comandi da eseguire più volte. Si esce dalla modalità loop con l'istruzione <@lit="endloop">: solo a questo punto i comandi indicati vengono eseguiti.
Il parametro <@var="controllo"> deve assumere uno dei cinque valori mostrati negli esempi: un numero di volte per cui ripetere i comandi all'interno del loop; "<@lit="while">" seguito da una condizione booleana; un intervallo di valori interi per una variabile indice; "<@lit="for">" seguito da tre espressioni tra parentesi, separate da punti e virgola (in modo simile all'istruzione <@lit="for"> nel linguaggio di programmazione C); infine, "<@lit="foreach">" seguito da una variabile indice e una lista.
Si veda la <@pdf="la guida all'uso di gretl"> per altri dettagli ed esempi, oltre che per la spiegazione dell'opzione <@lit="--progressive"> (che è destinata ad essere usata nelle simulazioni Monte Carlo) e per l'elenco dei comandi di gretl che possono essere usati all'interno di un loop.
# mahal Statistics
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--quiet"> (non mostra nulla)
<@lit="--save"> (salva le distanze nel dataset)
<@lit="--vcv"> (mostra la matrice di covarianza)
La distanza di Mahalanobis è la distanza tra due punti in uno spazio <@itl="k">-dimensionale, scalata rispetto alla variazione statistica in ogni dimensione dello spazio. Ad esempio, se <@itl="p"> e <@itl="q"> sono due osservazioni su un insieme di <@itl="k"> variabili con matrice di covarianza <@itl="C">, la distanza di Mahalanobis tra le due osservazioni è data da
<@fig="mahal">
dove <@fig="mahal2"> è un vettore a <@itl="k"> dimensioni. Se la matrice di covarianza è la matrice identità, la distanza di Mahalanobis corrisponde alla distanza Euclidea.
Lo spazio in cui vengono calcolate le distanze è definito dalle variabili selezionate; per ogni osservazione nell'intervallo attuale viene calcolata la distanza tra l'osservazione e il centroide delle variabili selezionate. La distanza è la controparte multidimensionale di uno <@itl="z">-score standard e può essere usata per giudicare se una certa osservazione "appartiene" a un gruppo di altre osservazioni.
Se si usa l'opzione <@lit="--vcv">, vengono mostrate la matrice di covarianza e la sua inversa. Se si usa l'opzione <@lit="--save">, le distanze vengono salvate nel dataset con il nome <@lit="mdist"> (o <@lit="mdist1">, <@lit="mdist2"> e così via, se esiste già una variabile con quel nome).
Accesso dal menù: /Visualizza/Distanze di Mahalanobis
# makepkg Programming
Argomento: <@var="filename">
Opzioni: <@lit="--index"> (crea un file ausiliario di indicizzazione)
<@lit="--translations"> (crea un file ausiliario di stringhe)
Permette la creazione di un "function package" da linea di comando. Il nome di file indica il nome del pacchetto da creare e deve avere estensione <@lit=".gfn">. Si veda <@pdf="la guida all'uso di gretl"> per dettagli.
Le opzioni consentono la scrittura di file ausiliari per l'uso con gli "addon" di gretl. Il file indice è un breve documento XML contenente alcune informazioni base sul pacchetto; ha lo stesso nome del pacchetto stesso ed estensione <@lit=".xml">. Il file di traduzioni contiene le stringhe da tradurre del pacchetto, in formato C; per il pacchetto <@lit="pippo"> questo file deve chiamarsi <@lit="pippo-i18n.c">.
Accesso dal menù: /File/Function files/New package
# markers Dataset
Varianti: <@lit="markers --to-file="><@var="nomefile">
<@lit="markers --from-file="><@var="nomefile">
<@lit="markers --delete">
Con l'opzione <@opt="--to-file">, scrive nel file indicato le stringhe marcatrici delle osservazioni presenti nel dataset corrente, una per ogni linea. Se il dataset non contiene stringhe viene emesso un messaggio d'errore.
Con l'opzione <@opt="--from-file">, legge dal file specificato (che deve essere in formato testo) e assegna alle righe del dataset i marcatori di osservazione, leggendone uno per riga. In generale il file dovrebbe contenere tanti marcatori quante sono le osservazioni nel dataset, ma se quest'ultimo è un panel il numero di marcatori nel file potrebbe anche essere pari al numero di unità in cross-section (nel qual caso i marcatori sono ripetuti a ogni data).
L'opzione <@opt="--delete"> fa quello che vi aspettate: cancella le stringhe marcatrici delle osservazioni dal dataset.
# meantest Tests
Argomenti: <@var="var1"> <@var="var2">
Opzione: <@lit="--unequal-vars"> (assume varianze diverse)
Calcola la statistica <@itl="t"> per l'ipotesi nulla che le medie della popolazione siano uguali per le variabili <@var="var1"> e <@var="var2">, mostrando il suo p-value.
L'impostazione predefinita prevede di assumere che le varianze delle due variabili siano uguali, mentre usando l'opzione <@lit="--unequal-vars">, si assume che esse siano diverse. Questo è rilevante per la statistica test solo se le due variabili contengono un diverso numero di osservazioni valide (non mancanti).
Accesso dal menù: /Modello/Modelli bivariati/Differenza delle medie
# mle Estimation
Argomenti: <@var="funzione di log-verosimiglianza"> <@var="derivate">
Opzioni: <@lit="--quiet"> (non stampa il modello stimato)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--hessian"> (calcola la matrice di covarianza a partire dall'Hessiana)
<@lit="--robust"> (matrice di covarianza QML)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--no-gradient-check"> (si veda sotto)
<@lit="--lbfgs"> (usa L-BFGS-B invece di BFGS)
Esempio: <@inp="weibull.inp">
Esegue la stima di massima verosimiglianza (ML, Maximum Likelihood) usando l'algoritmo BFGS (Broyden, Fletcher, Goldfarb, Shanno). Occorre specificare la funzione di log-verosimiglianza e indicare dei valori iniziali per i parametri della funzione (utilizzando il comando <@lit="genr">. Se possibile è consigliabile indicare anche espressioni per le derivate di questa funzione, rispetto ad ognuno dei parametri; se non si indicano le derivate analitiche, verrà calcolata un'approssimazione numerica.
Esempio: si supponga di avere una serie <@lit="X"> con valori 0 o 1 e di voler ottenere la stima di massima verosimiglianza della probabilità <@lit="p"> che <@lit="X"> valga 1 (è semplice intuire che la stima ML di <@lit="p"> corrisponderà alla proporzione dei valori 1 nel campione).
Occorre per prima cosa aggiungere <@lit="p"> al dataset e assegnargli un valore iniziale; ad esempio, <@lit="scalar p = 0.5">.
Quindi costruiamo il blocco di comandi per la stima di massima verosimiglianza:
<code>
mle loglik = X*log(p) + (1-X)*log(1-p)
deriv p = X/p - (1-X)/(1-p)
end mle
</code>
La prima riga specifica la funzione di log-verosimiglianza: inizia con la parola chiave <@lit="mle">, quindi contiene la variabile dipendente e una specificazione per la log-verosimiglianza usando la stessa sintassi del comando <@lit="genr">. La riga seguente (che è opzionale), inizia con la parola chiave <@lit="deriv"> e fornisce la derivata della funzione di log-verosimiglianza rispetto al parametro <@lit="p">. Se non vengono indicate derivate, occorre includere una dichiarazione che identifica i parametri liberi (separati da spazi) utilizzando la parola chiave <@lit="params">. Ad esempio si sarebbe potuto scrivere:
<code>
mle loglik = X*log(p) + (1-X)*log(1-p)
params p
end mle
</code>
e in questo caso la derivata verrebbe calcolata numericamente.
Si noti che eventuali opzioni vanno indicate nella riga finale del blocco MLE.
Per impostazione predefinita, gli errori standard sono basati sul prodotto esterno del gradiente. Se si usa l'opzione <@lit="--hessian">, vengono basati sull'inversa negativa dell'Hessiana (che è approssimata numericamente). Se si usa l'opzione <@lit="--robust">, viene usato uno stimatore QML (ossia, un sandwich dell'inversa negativa dell'Hessiana e della matrice di covarianza del gradiente).
Se vengono fornite derivate analitiche, per default gretl effettua un controllo numerico per valutarne l'attendibilità. Talvolta questo controllo può produrre dei falsi positivi; altre parole derivate corrette sembrano essere errate e il comando si rifiuta di completare la stima. Per evitare questa possibilità o per realizzare un piccolo guadagno in termini di tempo è possibile ricorrere all'opzione <@opt="--no-gradient-check">. Naturalmente è opportuno ricorrere a questa opzione solo se si è convinti convinti della correttezza del gradiente specificato.
Per una descrizione molto più approfondita di <@lit="mle">, per favore consultate <@pdf="la guida all'uso di gretl">.
Accesso dal menù: /Modello/Massima verosimiglianza
# modeltab Utilities
Varianti: <@lit="modeltab add">
<@lit="modeltab show">
<@lit="modeltab free">
<@lit="modeltab --output="><@var="nomefile">
Manipola la "tabella modelli" di gretl. Si veda la <@pdf="la guida all'uso di gretl"> per i dettagli. Le opzioni hanno i seguenti effetti: <@lit="add"> aggiunge l'ultimo modello stimato alla tabella modelli, se possibile; <@lit="show"> mostra la tabella modelli in una finestra; <@lit="free"> pulisce la tabella.
Per stampare la tabella del modello usate l'opzione <@opt="--output="> seguita dal nome di un file. Se quest'ultimo ha il suffisso "<@lit=".tex">", l'output sarà in formato TeX; se il suffisso è "<@lit=".rtf">" l'output sarà RTF; in caso contrario sarà in formato di testo. Nel caso di output in formato TeX per default verrà prodotto un "frammento" pronto per essere inserito in un documento; se invece si preferisce ottenere un documento completo, usate l'opzione <@opt="--complete">; per esempio,
<code>
modeltab --output="myfile.tex" --complete
</code>
Accesso dal menù: Finestra delle icone, Icona Tabella Modelli
# modprint Printing
Argomenti: <@var="matcoeff"> <@var="nomi"> [ <@var="stat"> ]
Stampa la tabella dei coefficienti e le statistiche aggiuntive opzionali per un modello stimato "a mano". Utile principalmente per le funzioni definite dall'utente.
L'argomento <@var="matcoeff"> deve essere una matrice <@itl="k"> per 2 che contiene <@itl="k"> coefficienti e <@itl="k"> errori standard associati, mentre <@var="nomi"> deve essere una stringa che contiene almeno <@itl="k"> nomi, separati da virgole, per i coefficienti.
L'argomento opzionale <@var="stat"> è un vettore che contiene <@itl="p"> statistiche aggiuntive da stampare sotto la tabella dei coefficienti. Se si usa questo argomento, <@var="nomi"> deve contenere <@itl="k + p"> stringhe separate da virgola, di cui le ultime <@itl="p"> sono associate alle statistiche aggiuntive.
# modtest Tests
Argomento: [ <@var="ordine"> ]
Opzioni: <@lit="--normality"> (normalità dei residui)
<@lit="--logs"> (non-linearità, logaritmi)
<@lit="--autocorr"> (correlazione seriale)
<@lit="--arch"> (ARCH)
<@lit="--squares"> (non-linearità, quadrati)
<@lit="--white"> (eteroschedasticità, test di White)
<@lit="--white-nocross"> (eteroschedasticità, test di White (solo quadrati))
<@lit="--breusch-pagan"> (eteroschedasticità, test di Breusch–Pagan)
<@lit="--robust"> (stima robusta della varianza per Breusch–Pagan)
<@lit="--panel"> (eteroschedasticità, a gruppi)
<@lit="--comfac"> (restrizione a fattore comune, (solo modelli AR1))
<@lit="--quiet"> (non mostra la regressione ausiliaria)
Deve seguire immediatamente un comando di stima. A seconda dell'opzione usata, il comando esegue uno dei test seguenti: test di Doornik–Hansen per la normalità del termine di errore; test dei moltiplicatori di Lagrange per la non-linearità (logaritmi o quadrati); test di White (con o senza i prodotti incrociati) o test di Breusch–Pagan per l'eteroschedasticità (<@bib="Breusch and Pagan, 1979;breusch-pagan79">), test LMF per la correlazione seriale (si veda <@bib="(Kiviet, 1986);kiviet86">); test per il modello ARCH (Autoregressive Conditional Heteroskedasticity, si veda anche il comando <@lit="arch">); o restrizione a fattore comune, (solo modelli AR1). La maggior parte delle opzioni sono disponibili solo per modelli stimati con OLS, ma si veda oltre per alcuni dettagli riguardanti la stima con i minimi quadrati a due stadi.
L'argomento opzionale <@lit="ordine"> è rilevante solo nel caso si scelga l'opzione <@lit="--autocorr"> o l'opzione <@lit="--arch">. Per impostazione predefinita, questi test sono eseguiti usando un ordine di ritardo pari alla periodicità dei dati, ma è possibile anche impostare un ordine di ritardo specifico.
L'opzione <@lit="--robust"> ha effetto solo se viene scelto il test di Breusch–Pagan; l'effetto è quello di usare lo stimatore robusto per la varianza proposto da <@bib="Koenker (1981);koenker81">, rendendo il test meno sensibile all'ipotesi di normalità.
L'opzione <@lit="--panel"> è disponibile solo se il modello viene stimato su dati panel: in questo caso viene eseguito un test per eteroschedasticità a gruppi (ossia per una varianza dell'errore diversa fra le unità cross section).
L'opzione <@opt="--comfac"> è disponibile solo quando il modello è stimato usando un metodo AR(1), come quello di Hildreth–Lu. La regressione ausiliaria ha la struttura di un modello dinamico relativamente poco vincolato ed è usata per verificare il vincolo di fattori comuni implicito nella specificazione AR(1).
Per impostazione predefinita, il programma mostra la regressione ausiliaria su cui si basa la statistica test, ma è possibile evitarlo usando l'opzione <@lit="--quiet">. La statistica test e il suo p-value possono essere recuperati usando le variabili accessorie <@lit="$test"> e <@lit="$pvalue">.
Nel caso di modelli stimati col metodo dei minimi quadrati a due stadi (si veda <@ref="tsls">), non è possibile usare il test LM, quindi gretl offre alcuni test equivalenti; in questo caso, l'opzione <@lit="--autocorr"> calcola il test di Godfrey per l'autocorrelazione (si veda Godfrey 1994), mentre l'opzione <@lit="--white"> produce il test HET1 per l'eteroschedasticità (si veda Pesaran e Taylor 1999).
Accesso dal menù: Finestra del modello, /Test
# mpols Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--simple-print"> (non mostra le statistiche ausiliarie)
<@lit="--quiet"> (non mostra i risultati)
Calcola le stime OLS per il modello indicato usando aritmetica in virgola mobile a precisione multipla. Questo comando è disponibile solo se gretl è compilato con il supporto per la libreria Gnu Multiple Precision (GMP). Per impostazione predefinita, vengono usati 256 bit di precisione nei calcoli, ma è possibile aumentare questo valore usando la variabile d'ambiente <@lit="GRETL_MP_BITS">. Ad esempio, usando l'interprete dei comandi bash, è possibile aumentare la precisione a 1024 bit eseguendo il comando seguente prima di avviare gretl
<code>
export GRETL_MP_BITS=1024
</code>
Per questo comando è disponibile un'opzione abbastanza speciale (utile soprattutto a scopo di test): se la lista <@var="variabili-indipendenti"> è seguita da un punto e virgola, e da un'ulteriore lista di numeri, questi numeri vengono interpretati come potenze di <@var="x"> da aggiungere alla regressione, dove <@var="x"> è l'ultima variabile della lista <@var="variabili-indipendeti">. Questi termini addizionali vengono calcolati e memorizzati in precisione multipla. Nell'esempio seguente, <@lit="y"> è regredita su <@lit="x"> e sulla seconda, terza e quarta potenza di <@lit="x">:
<code>
mpols y 0 x ; 2 3 4
</code>
Accesso dal menù: /Modello/Altri modelli lineari/MPOLS - Minimi quadrati in alta precisione
# negbin Estimation
Argomenti: <@var="depvar"> <@var="indepvars"> [ ; <@var="offset"> ]
Opzioni: <@lit="--model1"> (usa il modello NegBin 1)
<@lit="--robust"> (matrice di covarianza QML)
<@lit="--cluster">=<@var="clustvar"> (vedi <@ref="logit"> per una spegazione)
<@lit="--opg"> (vedi sotto)
<@lit="--vcv"> (stampa la matrice di covarianze)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
Stima un modello Binomiale Negativo. Il comando assume che la variabile dipendente rappresenti un conteggio del numero di volte in cui si è verificato un certo evento e deve assumere solo valori interi non negativi. Di default, viene usata la distribuzione NegBin 2, in cui la varianza condizionale è data da μ(1 + αμ), dove μ denota la media condizionale. Tuttavia, se vien data l'opzione <@opt="--model1"> allora la varianza condizionale sarà data da μ(1 + α).
L'argomento opzionale <@lit="offset"> funziona come per il comando <@ref="poisson">. In effetti, il modello di Poisson è un caso particolare del binomiale negativo con α = 0.
Di default, gli errori standard vengono calcolati unsando un'approssimazione numerica dell'Hessiana sul punto di massimo. Con l'opzione <@opt="--opg"> la matrice di covarianze verrà invece calcolata tramite il prodotto esterno dei gradienti (OPG), o via QML con l'opzione <@opt="--robust"> usando un "sandwich" dell'hessiana inversa e dell'OPG.
Accesso dal menù: /Model/Nonlinear models/Count data...
# nls Estimation
Argomenti: <@var="funzione"> [ <@var="derivate"> ]
Opzioni: <@lit="--quiet"> (non stampa il modello stimato)
<@lit="--robust"> (errori standard robusti)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
Esempio: <@inp="wg_nls.inp">
Esegue una stima con minimi quadrati non-lineari (NLS: Nonlinear Least Squares) usando una versione modificata dell'algoritmo di Levenberg–Marquardt. Occorre fornire una specificazione di funzione e dichiarare i parametri della funzione (usando il comando <@lit="genr">) prima della stima. Opzionalmente, è anche possibile specificare le espressioni per le derivate della funzione rispetto a ognuno dei parametri. Se non si indicano le derivate, occorre fornire una lista dei parametri da stimare (separati da spazi o virgole), preceduta dalla parola chiave <@lit="params">. In quest'ultimo caso, viene calcolata un'approssimazione numerica del Jacobiano.
È più semplice mostrare il funzionamento con un esempio. Quello che segue è uno script completo per stimare la funzione di consumo non-lineare presentata in <@itl="Econometric Analysis"> di William Greene (capitolo 11 della quarta edizione, o capitolo 9 della quinta). I numeri alla sinistra delle righe sono dei punti di riferimento e non fanno parte dei comandi. Si noti che le opzioni, come ad esempio <@lit="--vcv"> per mostrare la matrice di covarianza delle stime dei parametri, vanno aggiunte al comando finale <@lit="end nls">.
<code>
1 open greene11_3.gdt
2 ols C 0 Y
3 genr a = $coeff(0)
4 genr b = $coeff(Y)
5 genr g = 1.0
6 nls C = a + b * Y^g
7 deriv a = 1
8 deriv b = Y^g
9 deriv g = b * Y^g * log(Y)
10 end nls --vcv
</code>
Spesso è comodo inizializzare i parametri con riferimento a un modello lineare collegato, come è mostrato nelle righe da 2 a 5. I parametri alfa, beta e gamma possono essere impostati a qualunque valore iniziale (non necessariamente sulla base di un modello stimato con OLS), ma la convergenza della procedura NLS non è garantita per qualunque punto di partenza.
I veri comandi NLS occupano le righe da 6 a 10. Sulla riga 6 viene dato il comando <@lit="nls">: viene specificata una variabile dipendente, seguita dal segno uguale, seguito da una specificazione di funzione. La sintassi per l'espressione a destra è la stessa usata per il comando <@lit="genr">. Le tre righe successive specificano le derivate della funzione di regressione rispetto a ognuno dei parametri. Ogni riga inizia con il comando <@lit="deriv">, indica il nome di un parametro, il segno di uguale e un'espressione che indica come calcolare la derivata (anche qui la sintassi è la stessa di <@lit="genr">). In alternativa, invece di fornire le derivate, è possibile sostituire le righe dalla 7 alla 9 con la seguente:
<code>
params a b g
</code>
La riga 10, <@lit="end nls">, completa il comando ed esegue la stima.
Per ulteriori dettagli sulla stima NLS si veda la <@pdf="la guida all'uso di gretl">.
Accesso dal menù: /Modello/Modelli non lineari/NLS - Minimi quadrati non lineari
# normtest Tests
Argomento: <@var="series">
Opzioni: <@lit="--dhansen"> (test Doornik–Hansen)
<@lit="--swilk"> (test di Shapiro–Wilk)
<@lit="--lillie"> (test di Lilliefors)
<@lit="--jbera"> (test di Jarque–Bera)
<@lit="--all"> (esegue tutti i test)
<@lit="--quiet"> (non mostra i dettagli dei risultati)
Conduce un test di normalità per la <@var="serie"> specificata. Il tipo di test eseguito è determinato dalle opzioni del comando (se non ne viene usata alcuna, viene eseguito il test di Doornik–Hansen). Si noti che il test di Jarque–Bera test, sebbene semplice da calcolare, ha un'accuratezza relativamente bassa in campioni limitati, quindi se ne raccomanda l'uso principalmente a scopo di confronto.
La statistica test e il suo p-value possono essere recuperati usando gli accessori <@lit="$test"> e <@lit="$pvalue">. Se si usa l'opzione <@lit="--all">, i risultati salvati saranno queslli del test di Doornik–Hansen.
# nulldata Dataset
Argomento: <@var="lunghezza_serie">
Opzione: <@lit="--preserve"> (preserva le matrici)
Esempio: <@lit="nulldata 500">
Crea un dataset "vuoto", che contiene solo una costante e una variabile indice, con periodicità 1 e il numero indicato di osservazioni. Ad esempio, è possibile creare un dataset a scopo di simulazione usando alcuni comandi <@lit="genr"> (come <@lit="genr uniform()"> e <@lit="genr normal()">) per generare dati di prova. Questo comando può essere usato insieme a <@lit="loop">. Si veda anche l'opzione "seed" del comando <@ref="set">.
Per impostazione predefinita, questo comando cancella tutti i dati presenti nell'ambiente di lavoro di gretl. Usando l'opzione <@lit="--preserve">, verranno mantenute tutte le matrici attualmente definite.
Accesso dal menù: /File/Nuovo dataset
# ols Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--robust"> (errori standard robusti)
<@lit="--jackknife"> (vedi sotto)
<@lit="--simple-print"> (non mostra le statistiche ausiliarie)
<@lit="--quiet"> (non mostra i risultati)
<@lit="--anova"> (stampa una tabella ANOVA)
<@lit="--no-df-corr"> (sopprime la correzione per i gradi di libertà)
<@lit="--print-final"> (si veda sotto)
Esempi: <@lit="ols 1 0 2 4 6 7">
<@lit="ols y 0 x1 x2 x3 --vcv">
<@lit="ols y 0 x1 x2 x3 --quiet">
Calcola le stime minimi quadrati ordinari (OLS: Ordinary Least Squares) usando la <@var="variabile-dipendente"> e la lista di <@var="variabili-indipendenti">, che possono essere specificate per nome o numero. Il termine costante può essere indicato usando il numero 0.
Oltre alle stime dei coefficienti e agli errori standard, il programma mostra i p-value per le statistiche <@itl="t"> (a due code) e <@itl="F">. Un p-value inferiore a 0.01 indica significatività al livello dell'1 per cento ed è denotato con <@lit="***">. <@lit="**"> indica invece la significatività tra l'1 e il 5 per cento, mentre <@lit="*"> indica un livello di significatività tra il 5 e il 10 per cento. Vengono mostrate anche le statistiche di selezione del modello (il criterio di informazione di Akaike, AIC, e il criterio di informazione bayesiana di Schwarz, BIC). La formula usata per AIC è descritta in Akaike (1974), ossia meno due volte la log-verosimiglianza massimizzata più il doppio del numero di parametri stimati.
Usando l'opzione <@lit="--no-df-corr"> la correzione per i gradi di libertà non viene applicata nel calcolo della varianza stimata dell'errore (e quindi anche dell'errore standard delle stime dei parametri).
L'opzione <@lit="--print-final"> è utilizzabile solo nel contesto di un <@ref="loop">. L'effetto è quello di eseguire la regressione in modo silenzioso per tutte le iterazioni del loop tranne l'ultima. Si veda la <@pdf="la guida all'uso di gretl"> per i dettagli.
È possibile salvare alcune variabili interne generate durante la stima, usando il comando <@ref="genr"> subito dopo questo comando.
La formula usata per generare gli errori standard robusti (quando viene usata l'opzione <@lit="--robust">) può essere modificata con il comando <@ref="set">. L'opzione <@lit="--jackknife"> equivale a impostare <@lit="hc_version"> a <@lit="3a">, in modo da emulare il vecchio comando <@lit="hccm">.
Accesso dal menù: /Modello/OLS - Minimi quadrati ordinari
Accesso alternativo: Pulsante Beta-hat sulla barra degli strumenti
# omit Tests
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--wald"> (esegue un test di Wald invece che un test F)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--quiet"> (non mostra le stime per il modello ridotto)
<@lit="--silent"> (non mostra nulla)
<@lit="--auto">=<@var="alpha"> (eliminazione sequenziale, si veda oltre)
<@lit="--inst"> (omette come strumento, solo per TSLS)
<@lit="--both"> (omette come regressore e come strumento, solo per TSLS)
Esempi: <@lit="omit 5 7 9">
<@lit="omit seasonals --quiet">
<@lit="omit --auto">
<@lit="omit --auto=0.05">
Questo comando deve seguire un comando di stima e calcola un test per la significatività congiunta delle variabili nella <@var="lista-variabili">, che deve essere un sottoinsieme delle variabili indipendenti del modello stimato in precedenza. In alternativa, se si usa l'opzione <@lit="--auto"> viene attivata la procedura di eliminazione sequenziale: ad ogni passo viene omessa la variabile con il p-value più alto, fino a che tutte le variabili restanti hanno un p-value inferiore a una certa soglia. La soglia predefinita è del 10 per cento (con due code), che può essere modificata aggiungendo "<@lit="=">" e un valore tra 0 e 1 (senza spazi), come nel quarto esempio mostrato sopra.
Se il modello originale è stato stimato con OLS, la statistica test è un valore <@itl="F">, basato sulle somme dei quadrati dei residui del modello vincolato e di quello originale, a meno che quest'ultimo sia stato stimato usando errori standard robusti. In questo caso, il valore <@itl="F"> viene calcolato delle stime robuste della matrice di covarianza del modello originale (è la versione <@itl="F"> di un test di Wald).
Per gli stimatori diversi da OLS, o se si usa l'opzione <@lit="--wald">, la statistica usata è un valore chi-quadro asintotico di Wald, basato sulla matrice di covarianza del modello originale.
Per impostazione predefinita, viene stimato il modello vincolato, vengono mostrate le stime e il modello vincolato rimpiazza quello originale come "modello attuale" nel caso si voglia, ad esempio, recuperare i residui con <@lit="$uhat"> (o eseguire test ulteriori, come <@lit="add"> o <@lit="omit">).
Usando l'opzione Wald, il modello vincolato non viene stimato (quindi il modello attuale non viene rimpiazzato). L'opzione <@lit="--quiet"> sopprime la stampa dei risultati del modello vincolato (se esso viene stimato): viene mostrato solo il risultato del test. Se il modello vincolato viene stimato e ne viene chiesta la stampa, l'opzione <@lit="--vcv"> ha l'effetto di mostrare la matrice di covarianza dei coefficienti del modello vincolato, altrimenti quest'opzione è ignorata.
Se si usa l'opzione <@lit="--silent">, non viene mostrato alcun risultato; tuttavia, i risultati del test possono essere recuperati usando le variabili speciali <@lit="$test"> e <@lit="$pvalue">.
Se il modello originale è stato stimato con i minimi quadrati a due stadi, può sorgere un'ambiguità: le nuove variabili vanno omesse come regressori, come strumenti o con entrambe le funzioni? Per risolvere l'ambiguità, nella modalità predefinita le variabili sono omesse dall'elenco dei regressori, se si usa l'opzione <@lit="--inst"> sono omesse dall'elenco degli strumenti, mentre se si usa l'opzione <@lit="--both"> sono rimosse totalmente dal modello. Queste due opzioni sono incompatibili con l'opzione <@lit="--wald">; se uno o più strumenti vengono omessi, il modello va ri-stimato.
Accesso dal menù: Finestra del modello, /Test/OMIT - Ometti variabili
# open Dataset
Argomento: <@var="file-dati">
Opzioni: <@lit="--www"> (usa un database sul server di gretl)
Si veda oltre per le opzioni specifiche per i fogli elettronici
Esempi: <@lit="open data4-1">
<@lit="open voter.dta">
<@lit="open fedbog --www">
Apre un file di dati. Se è già stato aperto un file di dati, esso viene sostituito da quello selezionato. Se non si specifica un percorso completo, il programma cercherà automaticamente il file in alcuni percorsi predefiniti. Se non si specifica un'estensione per il file, come nel primo degli esempi, gretl assume che si tratti di un file di dati standard, con estensione <@lit=".gdt">. A seconda del nome del file e di alcune sue caratteristiche, gretl cerca di indovinare il formato dei dati (standard, testo semplice, CSV, MS Excel, Stata, ecc).
Quando si apre un file di un foglio elettronico (Gnumeric, Open Document o XLS), è possibile fornire fino a tre parametri aggiuntivi, oltre al nome del file. Per prima cosa, è possibile selezionare un particolare foglio di lavoro all'interno del file, indicando il suo numero con la sintassi <@lit="--sheet=2">, oppure indicando il suo nome tra virgolette doppie, usando la sintassi <@lit="--sheet="MacroData"">. L'impostazione predefinita consiste nel leggere il primo foglio di lavoro del file. È anche possibile specificare la riga/colonna da cui iniziare a leggere, usando la sintassi
<code>
--coloffset=3 --rowoffset=2
</code>
che indica a gretl di ignorare le prime 3 colonne e le prime 2 righe. L'impostazione predefinita consiste nel leggere tutte le celle del foglio, a partire dalla prima in alto a sinistra.
Questo comando può essere usato anche per aprire un database (gretl, RATS 4.0 o PcGive) per la lettura. In questo caso, dev'essere seguito dal comando <@ref="data"> per estrarre una particolare serie dal database. Se si usa l'opzione <@lit="www">, il programma cercherà di accedere al database specificato sul server di gretl — ad esempio il database "Federal Reserve interest rates" nel terzo degli esempi visti sopra.
Accesso dal menù: /File/Apri dati
Accesso alternativo: Trascinare un file di dati in gretl (MS Windows o Gnome)
# orthdev Transformations
Argomento: <@var="lista-variabili">
Utilizzabile solo con dati panel. Per ognuna delle variabili nella <@var="lista-variabili"> viene generata una serie di deviazioni ortogonali in avanti, salvata col nome della variabile prefissata da <@lit="o_">. Quindi, <@lit="orthdev x y"> crea le nuove variabili <@lit="o_x"> e <@lit="o_y">.
I valori sono salvati con un periodo di ritardo rispetto alla loro collocazione temporale (ossia, <@lit="o_x"> all'osservazione <@itl="t"> contiene la deviazione che, in senso stretto, corrisponde al periodo <@itl="t"> – 1). Questo comportamento è coerente con quello delle differenze prime: viene persa la prima osservazione di ogni serie, non l'ultima.
# outfile Printing
Argomenti: <@var="file-output"> <@var="opzione">
Opzioni: <@lit="--append"> (aggiunge al file)
<@lit="--close"> (chiude il file)
<@lit="--write"> (sovrascrive il file)
Esempi: <@lit="outfile --write regress.txt">
<@lit="outfile --close">
Scrive i risultati sul <@var="file-output">, fino a nuovo ordine. Usando l'opzione <@lit="--append">, i risultati vengono aggiunti a un file esistente, mentre <@lit="--write"> apre un nuovo file (o ne sovrascrive uno esistente). Può essere aperto solo un file alla volta.
L'opzione <@lit="--close"> può essere usata per chiudere un file di output aperto in precedenza, tornando a scrivere i risultati sul canale predefinito.
Nel primo degli esempi precedenti viene aperto il file <@lit="regress.txt">, mentre nel secondo viene chiuso. Se prima del comando <@lit="--close"> fosse eseguito un comando <@lit="ols">, i risultati della regressione verrebbero scritti su <@lit="regress.txt"> invece che sullo schermo.
Esiste una variante: se si usa la parola chiave <@lit="null"> al posto di un nome di file insieme all'opzione <@lit="--write">, l'effetto è quello di sopprimere la stampa dei risultati fino alla successiva istruzione <@lit="outfile --close">.
# panel Estimation
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--fixed-effects"> (stima con effetti di gruppo fissi)
<@lit="--random-effects"> (effetti casuali o modello GLS)
<@lit="--between"> (stima il modello tra i gruppi)
<@lit="--time-dummies"> (include variabili dummy temporali)
<@lit="--unit-weights"> (minimi quadrati ponderati)
<@lit="--iterate"> (stima iterativa)
<@lit="--quiet"> (mostra meno risultati)
<@lit="--verbose"> (mostra più risultati)
Stima un modello panel, per impostazione predefinita usando lo stimatore a effetti fissi; la stima è implementata sottraendo le medie di gruppo o delle unità dai dati originali.
Se si usa l'opzione <@lit="--random-effects">, viene usato il modello GLS a effetti casuali, usando il metodo di Swamy e Arora.
In alternativa, con l'opzione <@lit="--unit-weights">, il modello viene stimato con i minimi quadrati ponderati, con i pesi costruiti a partire dalla varianza residua per le rispettive unità cross section nel campione. Solo in questo caso, è possibile usare l'opzione <@lit="--iterate"> per produrre stime iterative: nel caso di convergenza, le stime sono di massima verosimiglianza.
Come ulteriore alternativa, se si usa l'opzione <@lit="--between">, viene stimato il modello tra i gruppi, ossia una regressione OLS usando le medie dei gruppi.
Per maggiori dettagli sulla stima panel, si veda la <@pdf="la guida all'uso di gretl">.
Accesso dal menù: /Modello/Panel
# pca Statistics
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--covariance"> (usa la matrice di covarianza)
<@lit="--save"> (salva le componenti principali)
<@lit="--save-all"> (salva tutte le componenti)
Analisi delle componenti principali. Mostra gli autovalori della matrice di correlazione (o della matrice di covarianza, se si usa l'opzione <@lit="--covariance">) per le variabili nella <@var="lista-variabili">, insieme alla proporzione della varianza comune spiegata da ogni componente. Mostra anche i corrispondenti autovettori (o "pesi della componente").
Usando l'opzione <@lit="--save">, le componenti con autovalori maggiori di 1.0 vengono salvati nel dataset come variabili, con i nomi <@lit="PC1">, <@lit="PC2"> e così via. Queste variabili artificiali sono definite come la somma del peso della componente moltiplicato per <@lit="Xi"> standardizzato, dove <@lit="Xi"> denota la <@itl="i">-esima variabile nella <@var="lista-variabili">.
Usando l'opzione <@lit="--save-all">, vengono salvate tutte le componenti, come descritto sopra.
Accesso dal menù: /Visualizza/Componenti principali
Accesso alternativo: Pop-up nella finestra principale (selezione multipla)
# pergm Statistics
Argomenti: <@var="nome-variabile"> [ <@var="banda"> ]
Opzioni: <@lit="--bartlett"> (usa la finestra di Bartlett)
<@lit="--log"> (usa una scala logaritmica)
Calcola e mostra (graficamente se non si è in modalità batch) lo spettro della variabile specificata. Per impostazione predefinita viene mostrato il periodogramma nel campione, mentre usando l'opzione <@lit="--bartlett">, lo spettro viene stimato usando una finestra di Bartlett per i ritardi (si veda ad esempio <@itl="Econometric Analysis"> di Greene per una discussione su questo argomento). L'ampiezza predefinita della fiestra di Bartlett è pari a due volte la radice quadrata dell'ampiezza campionaria, ma questo valore può essere impostato manualmente usando il parametro <@var="banda">, fino a un massimo pari a metà dell'ampiezza campionaria. Usando l'opzione <@lit="--log">, lo spettro viene rappresentato su una scala logaritmica.
Quando viene mostrato il periodogramma del campione, vengono mostrati anche due test per l'integrazione frazionale ("memoria lunga") della serie, ossia il test di Geweke e Porter-Hudak (GPH), e lo stimatore locale di Whittle. L'ipotesi nulla in entrambi i casi è che l'ordine di integrazione sia zero. Per impostazione predefinita, l'ordine per questi test è il valore minore tra <@itl="T">/2 e <@itl="T"><@sup="0.6">; anche questo valore può essere modificato con il parametro di banda.
Accesso dal menù: /Variabile/Spettro
Accesso alternativo: Menù pop-up nella finestra principale (selezione singola)
# poisson Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti"> [ ; <@var="offset"> ]
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
Esempi: <@lit="poisson y 0 x1 x2">
<@lit="poisson y 0 x1 x2 ; S">
Stima una regressione di Poisson, in cui la variabile dipendente rappresenta le occorrenze di un qualche tipo di evento e può assumere solo valori interi non negativi.
Se una variabile casuale discreta <@itl="Y"> segue la distribuzione di Poisson,
<@fig="poisson1">
per <@itl="y"> = 0, 1, 2,…. La media e la varianza della distribuzione sono entrambe uguali a <@itl="v">. Nel modello di regressione di Poisson, il parametro <@itl="v"> è rappresentato da una funzione di una o più varabili indipendenti. La versione più comune del modello (e l'unica supportata da gretl) ha
<@fig="poisson2">
ossia il logaritmo di <@itl="v"> è una funzione lineare delle variabili indipendenti.
Opzionalmente è possibile aggiungere una variabile "offset" alla specificazione, ossia una variabile di scala, il cui logaritmo viene aggiunto alla funzione di regressione lineare (con un coefficiente implicito di 1.0). Ciò ha senso se si ipotizza che il numero di occorrenze dell'evento in questione sia proporzionale a qualche fattore noto, a parità di altre condizioni. Ad esempio, il numero di incidenti stradali può essere ipotizzato proporzionale al volume del traffico, che potrebbe essere specificato come una variabile di "offset" in un modello di Poisson per il tasso di incidenti. La variabile di offset dev'essere strettamente positiva.
Accesso dal menù: /Modello/Modelli non lineari/Poisson
# print Printing
Argomenti: <@var="lista-variabili"> o <@var="stringa-letterale">
Opzioni: <@lit="--byobs"> (per osservazione)
<@lit="--no-dates"> (usa i numeri delle osservazioni)
Esempi: <@lit="print x1 x2 --byobs">
<@lit="print "Questa è una stringa"">
Se viene indicata una <@var="lista-variabili">, stampa i valori delle variabili specificate, altrimenti stampa i valori di tutte le variabili nel dataset in uso. Usando l'opzione <@lit="--byobs"> i dati vengono stampati per osservazione, altrimenti sono stampati per variabile.
Se si usa l'opzione <@lit="--byobs"> e i dati sono mostrati per osservazione, il comportamento predefinito è quello di mostrare la data (per serie storiche) o il marcatore (se esiste) all'inizio di ogni riga. L'opzione <@lit="--no-dates"> sopprime la visualizzazione delle date o dei marcatori: viene mostrato solo un semplice numero di osservazione.
Se l'argomento di <@lit="print"> è una stringa letterale (che deve iniziare con le virgolette doppie <@lit=""">), la stringa viene stampata così come è stata indicata. Si veda anche <@ref="printf">.
Nota: c'è un "trucco" con questo comando, usando l'opzione <@lit="--byobs">, che può essere utile quando si lavora su un dataset con valori mancanti. Se si fornisce una lista di variabili seguite da un punto e virgola e da una variabile finale, la variabile finale non viene mostrata, ma viene usata per selezionare le osservazioni da mostrare. Le osservazioni per cui la variabile finale assume valore 0 non verranno mostrate. Ad esempio, si supponga di avere la serie giornaliera <@lit="x"> e di volere la lista delle date per cui <@lit="x"> ha valori mancanti. Si può procedere nel modo seguente:
<code>
genr filt = missing(x)
print x ; filt --byobs
</code>
Accesso dal menù: /Dati/Mostra valori
# printf Printing
Argomenti: <@var="formato"> <@lit=", "><@var="argomenti">
Stampa valori scalari, serie, matrici o stringhe formattandoli secondo le indicazioni di una stringa di formato (che supporta un piccolo sottoinsieme del comando <@lit="printf()"> del linguaggio di programmazione C). I formati numerici riconosciuti sono <@lit="%e">, <@lit="%E">, <@lit="%f">, <@lit="%g">, <@lit="%G"> e <@lit="%d">, con i vari modificatori disponibili in C. Esempi: la stringa di formato <@lit="%.10g"> stampa un valore con 10 cifre significative; <@lit="%12.6f"> stampa un valore con 6 cifre decimali e una larghezza di 12 caratteri. Per formattare le stringhe occorre usare la stringa di formato <@lit="%s">.
La stringa di formato deve essere racchiusa tra virgolette doppie, i valori da stampare devono seguire la stringa di formato, separati da virgole. I valori possono avere tre forme: a) nomi di variabili; b) espressioni valide per il comando <@lit="genr">; c) le funzioni speciali <@lit="varname()"> o <@lit="date()">. L'esempio seguente stampa i valori di due variabili e quello di un'espressione calcolata:
<code>
ols 1 0 2 3
genr b = $coeff(2)
genr se_b = $stderr(2)
printf "b = %.8g, standard error %.8g, t = %.4f\n", b, se_b, b/se_b
</code>
Le prossime righe mostrano l'uso delle funzioni varname e date, che rispettivamente mostrano il nome di una variabile dato il suo numero identificativo, e una stringa data, dato un numero di osservazione.
<code>
printf "Il nome della variabile %d è %s\n", i, varname(i)
printf "La data dell'osservazione %d è %s\n", j, date(j)
</code>
Se si usa un argomento matrice insieme a un formato numerico, l'intera matrice verrà stampata usando per ogni elemento il formato numerico indicato. La stessa cosa vale per le serie, tranne per il fatto che l'intervallo di valori stampato è controllato dall'impostazione del campione corrente.
La lunghezza massima di una stringa di formato è di 127 caratteri. Vengono riconosciute le sequenze di escape <@lit="\n"> (newline), <@lit="\t"> (tab), <@lit="\v"> (tab verticale) e <@lit="\\"> (barra inversa). Per stampare un segno di percentuale, si usi <@lit="%%">.
Come in C, i valori numerici che fanno parte del formato (larghezza e precisione) possono essere dati direttamente come numeri, come in <@lit="%10.4f">, o come variabili. Nell'ultimo caso, si inseriscono asterischi nella stringa di formato e si forniscono nell'ordine gli argomenti corrispondenti. Ad esempio:
<code>
scalar larghezza = 12
scalar precisione = 6
printf "x = %*.*f\n", larghezza, precisione, x
</code>
# probit Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--robust"> (errori standard robusti)
<@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
<@lit="--p-values"> (mostra i p-value invece degli effetti
marginali)
<@lit="--random-effects"> (stima un modello panel a effetti casuali (RE))
<@lit="--quadpoints">=<@var="k"> (numero di punti di quadratura per la stima RE)
Se la variabile dipendente è binaria (tutti i suoi valori sono 0 o 1), esegue una stima di massima verosimiglianza dei coefficienti delle <@var="variabili-indipendenti"> con il metodo Newton-Raphson. Visto che il modello è nonlineare, gli effetti marginali (pendenze) dipendono dai valori delle variabili indipendenti: per impostazione predefinita, al posto dei p-value vengono mostrate le pendenze rispetto ad ognuna delle variabili indipendenti, calcolate in corrispondenza della media della variabile. Questo comportamento può essere soppresso usando l'opzione <@lit="--p-values">. La statistica chi-quadro testa l'ipotesi nulla che tutti i coefficienti tranne la costante siano pari a zero.
In modalità predefinita, gli errori standard sono calcolati tramite l'Hessiana. Se si usa l'opzione <@lit="--robust">, verranno calcolati gli errori standard QML (Huber–White). In questo caso, la matrice di covarianza stimata è un "sandwich" dell'inversa dell'Hessiana stimata e del prodotto esterno del gradiente. Per i dettagli, si veda Davidson e MacKinnon 2004, cap. 10.
Con l'opzione <@opt="--random-effects">, il termine di errore è composto per ipotesi da due componenti gaussiane: una, specifica per l'unità cross-sezionale e invariante nel tempo (nota come "effetto individuale") e l'altra specifica per quella particolare osservazione.
Il calcolo della log-verosimiglianza per questo modello viene effettuato tramite la quadratura di Gauss-Hermite per approssimare il valore di valori attesi di funzioni di variabili casuali normali. Il numero di punti di quadratura usati si può scegliere tramite l'opzione <@opt="--quadpoints"> (il default è 32). Un numero elevato di questi aumenta l'accuratezza dei risultati, ma al costo di tempi di calcolo più lunghi; in questo caso la stima può richiedere molto tempo con dataset grandi.
Oltre ai parametri standard (e statistiche associate) relativi alle variabili esplicative, dopo la stima di questo tipo di modello vengono presentati alcuni risultati aggiuntivi:
<indent>
• <@lit="lnsigma2">: la stima ML del logaritmo della varianza dell'effetto individuale;
</indent>
<indent>
• <@lit="sigma_u">: la stima dell'errore quadratico medio dell'effetto individuale;
</indent>
<indent>
• <@lit="rho">: la quota stima dell'effetto individuale sulla varianza totale del termine di errore composito (anche nota come correlazione intra-classe).
</indent>
Il test LR per l'ipotesi <@lit="rho">=0 consente di stabilire se la specificazione a effetti random è in effetti necessaria. Sotto la nulla, una semplice specificazione probit è del tutto adeguata.
Se la variabile dipendente non è binaria, ma è discreta, si ottengono stime Probit ordinali. Se la variabile scelta come dipendente non è discreta, viene emesso un messaggio di errore.
Il probit per l'analisi delle proporzioni non è ancora stato implementato in gretl.
Accesso dal menù: /Modello/Modelli non lineari/Probit
# pvalue Utilities
Argomenti: <@var="distribuzione"> [ <@var="parametri"> ] <@var="valore-x">
Esempi: <@lit="pvalue z zscore">
<@lit="pvalue t 25 3.0">
<@lit="pvalue X 3 5.6">
<@lit="pvalue F 4 58 fval">
<@lit="pvalue G forma scala x">
<@lit="pvalue B bprob 10 6">
<@lit="pvalue P lambda x">
<@lit="pvalue W shape scale x">
Calcola l'area alla destra del <@var="valore-x"> nella distribuzione indicata (<@lit="z"> per la Gaussiana, <@lit="t"> per la <@itl="t"> di Student, <@lit="X"> per la chi-quadro, <@lit="F"> per la <@itl="F">, <@lit="G"> per la gamma, <@lit="B"> per la binomiale, <@lit="P"> per la Poisson e <@lit="W"> for Weibull).
A seconda della distribuzione, occorre fornire le seguenti informazioni, prima del <@var="valore-x">: per le distribuzioni <@itl="t"> e chi-quadro occorre indicare i gradi di libertà; per la <@itl="F"> sono richiesti i gradi di libertà al numeratore e al denominatore; per la gamma sono richiesti il parametro di forma e quello di scala; per la binomiale sono richieste la probabilità di "successo" e il numero di prove; per la distribuzione di Poisson va indicato il parametro λ (che rappresenta sia la media che la varianza); per la distribuzione Weibull, i parametri di forma e scala. Come si vede dagli esempi precedenti, gli argomenti numerici possono essere indicati sotto forma di numero o come nomi di variabili.
Si noti che talvolta la distribuzione gamma viene caratterizzata dai parametri di media e varianza, invece che da quelli di forma e scala. La media è il prodotto di forma e scala, mentre la varianza è il prodotto tra la forma e il quadrato della scala. Quindi la scala si può ottenere come la varianza divisa per la media, mentre la forma come la media divisa per la scala.
Accesso dal menù: /Strumenti/Calcola p-value
# qlrtest Tests
Per un modello stimato con OLS su serie storiche, esegue il test del rapporto di verosimiglianza di Quandt (QLR) per un break strutturale in un punto incognito del campione, escludendo il 15% delle osservazioni all'inizio e ella fine del campione.
Per ogni possibile punto di rottura compreso nel 70% centrale delle osservazioni, viene eseguito un test di Chow (si veda <@ref="chow">). La statistica del test QLR è il massimo dei valori <@itl="F"> di questi test; segue una distribuzione non standard, i cui valori critici sono presi da <@itl="Introduction to Econometrics"> di Stock e Watson (2003). Se la statistica QLR eccede il valore critico per un dato livello di significatività, è possibile inferire che i parametri del modello non sono costanti. Questa statistica può essere usata per riconoscere forme di instabilità diverse da un singolo punto di rottura, ad esempio più punti di rottura o un lento cambiamento dei parametri.
Accesso dal menù: Finestra del modello, /Test/QLR
# qqplot Graphs
Varianti: <@lit="qqplot"> <@var="y">
<@lit="qqplot"> <@var="y"> <@var="x">
Opzioni: <@lit="--z-scores"> (v. oltre)
<@lit="--raw"> (v. oltre)
Con una sola serie come argomento, mostra un grafico della distribuzione empirica della serie stessa (indicata col nome o con il suo numero ID) contro i quantili della normale. La serie deve includere almeno 20 valori validi nel campione selezionato al momento. Per impostazione predefinita, i quantili empirici vengono disegnati contro quelli della normale avente media e varianza uguali a quelli campionari della serie, ma sono disponibili due alternative: con l'opzione <@opt="--z-scores">, i dati vengono standardizzati prima, oppure, con l'opzione <@opt="--raw">, i quantili empirici possono essere disegnati contro quelli della normale standardizzata.
Con due argomenti, <@var="y"> and <@var="x">, mostra un grafico dei quantili empirici di <@var="y"> contro quelli di <@var="x">. I dati non vengono standardizzati.
Accesso dal menù: /Variabile/Q-Q normale
Accesso dal menù: /Visualizza/Grafico/Q-Q
# quantreg Estimation
Argomenti: <@var="tau"> <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--robust"> (errori standard robusti)
<@lit="--intervals">=<@var="level"> (calcola gli intervalli di confidenza)
<@lit="--vcv"> (mostra la matrice di covarianza)
Esempi: <@lit="quantreg 0.25 y 0 xlist">
<@lit="quantreg 0.5 y 0 xlist --intervals">
<@lit="quantreg 0.5 y 0 xlist --intervals=.95">
<@lit="quantreg tauvec y 0 xlist --robust">
Vedi anche <@inp="mrw_qr.inp">
Regressione quantile. Il primo argomento, <@var="tau">, è il quantile condizionale per cui si desiderano le stime. Può essere un valore numerico o il nome di una variabile scalare predefinita; il valore deve essere compreso nell'intervallo da 0.01 a 0.99 (in alternativa, può essere indicato un vettore di valori, si veda sotto per i dettagli). Gli argomenti dal secondo in poi compongono un elenco di regressori sul modello di quello usato in <@ref="ols">.
Senza l'opzione <@lit="--intervals">, vengono mostrati gli errori standard per le stime quantili; questi sono calcolati con la formula asintotica di Koenker e Bassett (1978), ma se si usa l'opzione <@lit="--robust">, verrà usata la variante robusta per l'eteroschedasticità di Koenker e Zhao (1994).
Se si usa l'opzione <@lit="--intervals">, gretl calcolerà gli intervalli di confidenza invece degli errori standard. Questi intervalli sono calcolati col metodo dell'inversione del rango e in generale sono asimmetrici rispetto alle stime puntuali dei parametri. Se non si usa l'opzione "--robust", gli intervalli sono calcolati nell'ipotesi di errori IID (Koenker, 1994), mentre se viene indicata, sono calcolati con lo stimatore robusto sviluppato da Koenker e Machado (1999).
Per impostazione predefinita vengono prodotti intervalli di confidenza al 90%. È possibile specificare un altro livello di confidenza (sotto forma di frazione decimale), aggiungendolo all'opzione, come in <@lit="--intervals=0.95">.
Invece di indicare <@var="tau"> come uno scalare, è possibile usare un vettore, indicando il nome di una matrice predefinita. In questo caso le stime vengono eseguite per tutti i valori di <@var="tau">, e i risultati mostrano la sequenza delle stime quantili per ognuno dei regressori.
Accesso dal menù: /Modello/Stima robusta/Regressione quantile
# quit Utilities
Esce dal programma, dando la possibilità di salvare i risultati della sessione.
Accesso dal menù: /File/Esci
# rename Dataset
Varianti: <@lit="rename"> <@var="numero-var">
<@var="nuovo-nome">
<@lit="rename"> <@var="nome-var">
<@var="nuovo-nome">
Modifica il nome di una variabile con numero identificativo <@var="numero-var"> o nome <@var="nome-var"> in <@var="nuovo-nome">. Il <@var="numero-var"> deve essere compreso tra 1 e il numero di variabili nel dataset. Il nuovo nome deve essere lungo al massimo 15 caratteri, deve iniziare con una lettera e deve essere composto di sole lettere, numeri e il carattere trattino basso.
Accesso dal menù: /Variabile/Modifica attributi
Accesso alternativo: Menù pop-up nella finestra principale (selezione
singola)
# reset Tests
Opzioni: <@lit="--quiet"> (non mostra la regressione ausiliaria)
<@lit="--squares-only"> (calcola il test coi soli quadrati)
<@lit="--cubes-only"> (calcola il test coi soli cubi)
Va eseguito dopo la stima di un modello via OLS. Esegue il test RESET di Ramsey per la specificazione del modello (non-linearità), aggiungendo alla regressione il quadrato e/o il cubo dei valori stimati (a meno che non siano specificate le opzioni <@lit="--squares-only"> o <@lit="--cubes-only">) e calcolando la statistica <@itl="F"> per l'ipotesi nulla che i coefficienti dei due termini aggiunti siano pari a zero.
Vengono aggiunti sia i quadrati che i cubi, a meno che siano usate le opzioni <@lit="--squares-only"> o <@lit="--cubes-only">.
Accesso dal menù: Finestra del modello, /Test/RESET - Ramsey
# restrict Tests
Impone un insieme di vincoli lineari sull'ultimo modello stimato o su un sistema di equazioni definito in precedenza. La sintassi del comando è leggermente diversa in ognuno dei due casi.
In entrambi i casi, l'insieme di vincoli deve essere racchiuso tra i comandi "restrict" e "end restrict". Nel caso della singola equazione, i vincoli sono applicati implicitamente all'ultimo modello e vengono valutati appena viene terminato il comando "restrict". Nel caso del sistema, il comando iniziale "restrict" deve essere seguito immediatamente dal nome di un sistema di equazioni definito in precedenza (si veda <@ref="system">). I vincoli vengono valutati nella successiva stima del sistema effettuata con il comando <@ref="estimate">.
Ogni vincolo nell'insieme va indicato sotto forma di equazione con una combinazione lineare dei parametri al primo membro e un valore numerico al secondo. Nel caso della singola equazione, i parametri sono indicati con la sintassi <@lit="b["><@var="i"><@lit="]">, dove <@var="i"> rappresenta la posizione nella lista dei regressori, a partire da uno, oppure con <@lit="b["><@var="variabile"><@lit="]">, dove <@var="variabile"> è il nome del regressore in questione. estion. Nel caso del sistema, i parametri vengono indicati con la sintassi <@lit="b"> seguita da due numeri tra parentesi quadre. Il primo numero rappresenta la posizione dell'equazione all'interno del sistema, mentre il secondo indica la posizione nella lista dei regressori. Ad esempio <@lit="b[2,1]"> indica il primo parametro della seconda equazione, mentre <@lit="b[3,2]"> il secondo parametro della terza equazione.
I termini <@lit="b"> nell'equazione che rappresenta un vincolo possono essere prefissati da un moltiplicatore numerico, usando il segno <@lit="*"> per indicare la moltiplicazione, ad esempio <@lit="3.5*b[4]">.
Ecco un esempio di un insieme di vincoli per un modello stimato in precedenza:
<code>
restrict
b[1] = 0
b[2] - b[3] = 0
b[4] + 2*b[5] = 1
end restrict
</code>
Ed ecco un esempio di un insieme di vincoli da applicare a un sistema (se il nome del sistema non contiene spazi, è possibile tralasciare le virgolette).
<code>
restrict "Sistema 1"
b[1,1] = 0
b[1,2] - b[2,2] = 0
b[3,4] + 2*b[3,5] = 1
end restrict
</code>
Nel caso dell'equazione singola, i vincoli sono valutati attraverso un test <@itl="F"> di Wald, usando la matrice di covarianza dei coefficienti del modello in questione. In modalità predefinita vengono mostrate le stime dei coefficienti vincolati; se si desidera solo la statistica test, basta aggiungere l'opzione <@lit="--quiet"> al comando <@lit="restrict"> iniziale.
Nel caso del sistema, la statistica test dipende dallo stimatore scelto: un test del rapporto di verosimiglianza nel caso di un sistema stimato con un metodo di massima verosimiglianza, o un test <@itl="F"> asintotico negli altri casi.
Accesso dal menù: Modello, /Test/Vincoli lineari
# rmplot Graphs
Argomento: <@var="nome-variabile">
Grafici Range–mean: questo comando crea un semplice grafico che aiuta a capire se una serie storica <@itl="y">(t) ha varianza costante o no. L'intero campione t=1,...,T viene diviso in piccoli sotto-campioni di dimensione arbitraria <@itl="k">. Il primo sotto-campione è formato da <@itl="y">(1), ... ,<@itl="y">(k), il secondo da <@itl="y">(k+1), ... , <@itl="y">(2k), e così via. Per ogni sotto-campione, vengono calcolati la media e il campo di variazione (range: il valore massimo meno quello minimo) e viene costruito un grafico con le medie sull'asse orizzontale e i campi di variazione su quello verticale, in modo che ogni sotto-campione sia rappresentato da un punto sul piano. Se la varianza della serie è costante, ci si aspetta che il campo di variazione del sotto-campione sia indipendente dalla media del sotto-campione; se i punti si dispongono su una linea crescente, la varianza della serie cresce al crescere della media, viceversa se i punti si dispongono su una linea decrescente.
Oltre al grafico, gretl mostra anche le medie e i campi di variazione per ogni sotto-campione, insieme al coefficiente di pendenza della regressione OLS del campo di variazione sulla media e il p-value per l'ipotesi nulla che la pendenza sia zero. Se il coefficiente di pendenza è significativo al livello del 10 per cento, viene mostrata sul grafico la linea stimata della regressione del campo di variazione sulla media.
Accesso dal menù: /Variabile/Grafico range-mean
# run Programming
Argomento: <@var="file-input">
Esegue i comandi nel <@var="file-input"> e restituisce il controllo al prompt interattivo. Questo comando si intende usato con il programma a riga di comando gretlcli, o con il "terminale di gretl" nel programma con interfaccia grafica.
Si veda anche <@ref="include">.
Accesso dal menù: Icona Esegui nella finestra comandi
# runs Tests
Argomento: <@var="nome-variabile">
Opzioni: <@lit="--difference"> (usa la differenza prima della variabile)
<@lit="--equal"> (i valori positivi e negativi sono equiprobabili)
Esegue il test non parametrico "delle successioni" per la casualità della variabile specificata, dove le successioni sono definite come sequenze di valori consecutivi positivi o negativi. Ad esempio, per testare la casualità delle deviazioni dalla mediana per una variabile chiamata <@lit="x1">, con una mediana diversa da zero, eseguire i comandi seguenti:
<code>
genr signx1 = x1 - median(x1)
runs signx1
</code>
Se si usa l'opzione <@lit="--difference">, la variabile viene differenziata prima dell'analisi, quindi le successioni sono interpretabili come sequenze di incrementi o decrementi consecutivi nel valore della variabile.
Se si usa l'opzione <@lit="--equal">, l'ipotesi nulla incorpora l'assunzione che i valori positivi e negativi siano equiprobabili, altrimenti la statistica test è invariante rispetto all'"equilibrio" del processo che genera la sequenza, focalizzandosi solo sull'indipendenza.
Accesso dal menù: /Strumenti/Test non parametrici
# scatters Graphs
Argomenti: <@var="variabile-y"> ; <@var="lista-variabili-x"> o <@var="lista-variabili-y ; variabile-x">
Opzione: <@lit="--with-lines"> (crea grafici lineari)
Esempi: <@lit="scatters 1 ; 2 3 4 5">
<@lit="scatters 1 2 3 4 5 6 ; 7">
Produce grafici della <@var="variabile-y"> rispetto ad ognuna delle variabili nella <@var="lista-variabili-x">, oppure di tutte le variabili nella <@var="lista-variabili-y"> rispetto alla <@var="variabile-x">. Il primo esempio visto sopra assegna la variabile 1 all'asse <@itl="y"> e produce quattro grafici, il primo con la variabile 2 sull'asse <@itl="x">, il secondo con la variabile 3 sull'asse <@itl="x">, e così via. Il secondo esempio rappresenta ognuna delle variabili da 1 a 6 rispetto alla variabile 7 sull'asse <@itl="x">. Questi gruppi di grafici sono utili nell'analisi esplorativa dei dati. È possibile creare fino a sei grafici alla volta, eventuali variabili in sovrappiù saranno ignorate.
Per impostazione predefinita vengono prodotti dei classici grafici a dispersione, ma se si usa l'opzione <@lit="--with-lines"> vengono mostrate anche le linee di collegamento tra i punti del grafico.
Accesso dal menù: /Visualizza/Grafici multipli
# sdiff Transformations
Argomento: <@var="lista-variabili">
Calcola la differenza stagionale di ogni variabile della <@var="lista-variabili"> e salva il risultato in una nuova variabile con il prefisso <@lit="sd_">. Il comando è disponibile solo per serie storiche stagionali.
Accesso dal menù: /Aggiungi/Differenze stagionali
# set Programming
Argomenti: <@var="variabile"> <@var="valore">
Esempi: <@lit="set svd on">
<@lit="set csv_delim tab">
<@lit="set horizon 10">
Imposta i valori di vari parametri del programma. Il valore impostato rimane in vigore per la durata della sessione di gretl, a meno di non essere modificato da un ulteriore esecuzione del comando <@lit="set">. I parametri che possono essere impostati in questo modo sono elencati di seguito. Si noti che le impostazioni di <@lit="hac_lag">, <@lit="hc_version"> e <@lit="hac_kernel"> sono usate quando viene data l'opzione <@lit="--robust"> a un comando di stima.
Un uso speciale di questo comando è <@lit="set stopwatch">. In questo modo viene avviata la misurazione del tempo della CPU, che viene fermata la prima volta che viene usata la variabile accessoria <@lit="$stopwatch">, ad esempio assegnandola a un'altra variabile, oppure stampandola. <@lit="$stopwatch"> conterrà il numero di secondi usati dalla CPU, dal momento in cui è stato dato il comando <@lit="set stopwatch">.
Se il comando <@lit="set"> è usato senza parametri, vengono mostrate le impostazioni attuali per tutti i parametri rilevanti.
Le impostazioni disponibili sono raggruppate in sei categorie: interazione col programma, metodi numerici, generazione di numeri casuali, stima robusta, filtri e stima di modelli per serie storiche.
<@itl="Interazione con il programma">
Queste impostazioni servono per controllare vari aspetti del modo in cui gretl interagisce con l'utente.
<indent>
• <@lit="csv_delim">: <@lit="comma"> (virgola, valore predefinito), <@lit="space"> (spazio), o <@lit="tab">. Imposta il delimitatore di colonna usato nel salvataggio di dati su file in formato CSV.
</indent>
<indent>
• <@lit="echo">: <@lit="off"> o <@lit="on"> (valore predefinito). Sopprime o ripristina l'indicazione dei comandi eseguiti nell'output dei risultati.
</indent>
<indent>
• <@lit="force_decpoint">: <@lit="on"> o <@lit="off"> (valore predefinito). Forza gretl a usare il carattere punto come separatore decimale, in un ambiente in cui il separatore standard è un'altro carattere (tipicamente la virgola).
</indent>
<indent>
• <@lit="halt_on_error">: <@lit="off"> o <@lit="on"> (valore predefinito). Quando è attivo, se si verifica un errore all'interno di un loop, questo si interromperà. Se si usa il client a riga di comando, il programma terminerà.
</indent>
<indent>
• <@lit="loop_maxiter">: un valore intero non negativo. Imposta il numero massimo di iterazioni consentite prima che un loop di tipo <@lit="while"> si fermi (si veda <@ref="loop">). Si noti che questa impostazione riguarda solo la variante <@lit="while">, visto che lo scopo è quello di interrompere possibili cicli infiniti. Il valore speciale 0 viene usato per rendere tali cicli potenzialmente infiniti, visto che non viene fatto alcun controllo sul numero di iterazioni. Usare con cautela.
</indent>
<indent>
• <@lit="max_verbose">: <@lit="on"> o <@lit="off"> (valore predefinito). Attiva l'output aggiuntivo per la funzione <@lit="BFGSmax"> (si veda la Guida all'uso per i dettagli).
</indent>
<indent>
• <@lit="messages">: <@lit="off"> o <@lit="on"> (valore predefinito). Sopprime o ripristina l'indicazione dei messaggi informativi associati a vari comandi, ad esempio quando viene generata una nuova variabile o viene modificato l'intervallo del campione.
</indent>
<indent>
• <@lit="debug">: <@lit="1">, <@lit="2"> o <@lit="0"> (valore predefinito). Da usare per le funzioni definite dall'utente. Impostare <@lit="debug"> a 1 equivale a impostare <@lit="messages"> in tutte queste funzioni; impostando la variabile a <@lit="2"> ha l'effetto aggiuntivo di impostare <@lit="max_verbose"> in tutte le funzioni.
</indent>
<indent>
• <@lit="shell_ok">: <@lit="on"> o <@lit="off"> (valore predefinito). Abilita l'esecuzione di programmi esterni da gretl attraverso la shell di sistema. Per motivi di sicurezza, la funzione è disabilitata per impostazione predefinita; inoltre è possibile abilitarla solo tramite l'interfaccia grafica (Strumenti/Preferenze/Generali). Una volta abilitata, l'impostazione rimarrà attiva per le successive sessioni, fino a che non sarà disabilitata esplicitamente.
</indent>
<indent>
• <@lit="shelldir">: <@var="percorso">. Imposta la directory di lavoro attuale per i comandi shell.
</indent>
<indent>
• <@lit="use_cwd">: <@lit="on"> o <@lit="off"> (valore predefinito). Questa impostazione modifica il comportamento dei comandi <@ref="outfile"> e <@ref="store">, che scrivono su file esterni. Normalmente, il file verrà scritto nella directory dati predefinita dell'utente: se si imposta <@lit="use_cwd"> a <@lit="on">, al contrario, il file verrà creato nella directory di lavoro da cui gretl è stato eseguito.
</indent>
<@itl="Metodi numerici">
Queste impostazioni vengono usate per controllare gli algoritmi numerici usati da gretl per la stima.
<indent>
• <@lit="bhhh_maxiter">: un intero. Imposta il massimo numero di iterazioni per la routine BHHH, che è usata dal comando <@lit="arma">. Se non viene raggiunta la convergenza dopo <@lit="bhhh_maxiter">, il programma segnala un errore. Il valore predefinito è 500.
</indent>
<indent>
• <@lit="bhhh_toler">: un valore a virgola mobile, oppure la stringa <@lit="default">. Viene usato dalla routine BHHH di gretl per controllare se viene raggiunta la convergenza. L'algoritmo di calcolo ferma le iterazioni non appena l'incremento nella log-verosimiglianza tra le iterazioni è minore di <@lit="bhhh_toler">. Il valore predefinito è 1.0E–06; questo valore può essere reimpostato usando la stringa <@lit="default"> invece di un valore numerico.
</indent>
<indent>
• <@lit="bfgs_maxiter">: un valore intero. Rappresenta il massimo numero di iterazioni per la routine BFGS di gretl, usata da <@lit="mle">, <@lit="gmm"> e altri stimatori. Se non si raggiunge la convergenza nel numero specificato di iterazioni, il programma produce un messaggio di errore. Il valore predefinito dipende dal contesto, ma tipicamente è nell'ordine delle 500 iterazioni.
</indent>
<indent>
• <@lit="bfgs_toler">: un valore in virgola mobile, o la stringa <@lit="default">. Viene usato nella routine BFGS di gretl per controllare se si è raggiunta la convergenza. L'algoritmo si ferma appena l'incremento relativo nella funzione obiettivo tra un'iterazione e l'altra è minore di <@lit="bfgs_toler">. Il valore predefinito è pari alla precisione della macchina elevata alla potenza 3/4; questo valore può essere re-impostato usando la stringa <@lit="default"> invece di un valore numerico.
</indent>
<indent>
• <@lit="initvals">: una matrice pre-specificata. Permette di impostare manualmente le stime dei parametri ARMA. Per i dettagli, si veda la <@pdf="la guida all'uso di gretl">.
</indent>
<indent>
• <@lit="lbfgs">: <@lit="on"> o <@lit="off"> (valore predefinito). Usa la versione a memoria limitata di BFGS, al posto dell'algoritmo standard. Può essere vantaggioso quando la funzione da massimizzare non è globalmente concava.
</indent>
<indent>
• <@lit="nls_toler">: un valore in virgola mobile (il valore predefinito è pari alla precisione della macchina elevata alla potenza 3/4). Imposta la tolleranza usata per stabilire se è stata raggiunta la convergenza nelle procedure iterative di stima con i minimi quadrati non lineari usate dal comando <@ref="nls">.
</indent>
<indent>
• <@lit="svd">: <@lit="on"> o <@lit="off"> (valore predefinito). Usa la decomposizione SVD invece di quella di Cholesky o della QR nel calcolo delle stime OLS. Questa opzione si applica alla funzione <@lit="mols"> e a vari altri calcoli eseguiti internamente, ma non al comando <@ref="ols">.
</indent>
<indent>
• <@lit="fcp">: <@lit="on"> o <@lit="off"> (valore predefinito). Usa l'algoritmo di Fiorentini, Calzolari e Panattoni al posto del codice interno di gretl per calcolare le stime GARCH.
</indent>
<@itl="Generazione di numeri casuali">
<indent>
• <@lit="seed">: un intero senza segno. Imposta il seme per il generatore di numeri pseudo-casuali. Di solito il seme viene impostato a partire dall'ora di sistema, ma se si intende generare sequenze ripetibili di numeri casuali occorre impostare il seme manualmente.
</indent>
<@itl="Stima robusta">
<indent>
• <@lit="bootrep">: un intero. Imposta il numero di replicazioni per il comando <@ref="restrict"> con l'opzione <@lit="--bootstrap">.
</indent>
<indent>
• <@lit="garch_vcv">: <@lit="unset">, <@lit="hessian">, <@lit="im"> (matrice di informazione) , <@lit="op"> (matrice dei prodotti esterni), <@lit="qml"> (stimatore QML), <@lit="bw"> (Bollerslev–Wooldridge). Specifica la variante da usare per stimare la matrice di covarianza dei coefficienti nei modelli GARCH. Se si usa <@lit="unset"> (valore predefinito), viene usata l'Hessiana, a meno di usare l'opzione "robust" col comando garch, nel qual caso viene usato QML.
</indent>
<indent>
• <@lit="arma_vcv">: <@lit="hessian"> (predefinito) o <@lit="op"> (prodotto esterno). Specifica la variante da usare per calcolare la matrice di covarianza per i modelli ARIMA.
</indent>
<indent>
• <@lit="force_hc">: <@lit="off"> (predefinito) o <@lit="on">. Lo stimatore HAC viene usato in modo predefinito con dati serie storiche e quando si usa l'opzione <@lit="--robust"> di <@lit="ols">. Impostando invece <@lit="force_hc"> a "on", si forza l'uso della matrice di covarianza coerente con l'eteroschedasticità (che non tiene conto dell'autocorrelazione).
</indent>
<indent>
• <@lit="hac_lag">: <@lit="nw1"> (valore predefinito), <@lit="nw2">, <@lit="nw3">, o un intero. Imposta il massimo valore di ritardo, o la larghezza di banda, <@itl="p">, usato nel calcolo degli errori standard HAC (Heteroskedasticity and Autocorrelation Consistent) con l'approccio Newey-West, per le serie storiche. <@lit="nw1"> e <@lit="nw2"> rappresentano due varianti di calcolo automatico basate sulla dimensione del campione, <@itl="T">: per nw1, <@fig="nw1">, e per nw2, <@fig="nw2">. <@lit="nw3"> permette di selezionare la larghezza di banda basandosi sui dati. Si veda anche <@lit="qs_bandwidth"> e <@lit="hac_prewhiten">.
</indent>
<indent>
• <@lit="hac_kernel">: <@lit="bartlett"> (valore predefinito), <@lit="parzen">, o <@lit="qs"> (Quadratic Spectral). Imposta il kernel, o struttura di pesi, usato nel calcolo degli errori standard HAC.
</indent>
<indent>
• <@lit="hac_prewhiten">: <@lit="on"> o <@lit="off"> (valore predefinito). Usa le procedure di "prewhitening" e "re-coloring" di Andrews-Monahan nel calcolo degli errori standard HAC. Questo comporta anche la selezione della larghezza di banda basata sui dati.
</indent>
<indent>
• <@lit="hc_version">: 0 (valore predefinito), 1, 2, 3 o 3a. Imposta la variante da usare nel calcolo degli errori standard HAC (Heteroskedasticity and Autocorrelation Consistent) con dati di tipo cross section. Le prime 4 opzioni corrispondono alle HC0, HC1, HC2 e HC3 discusse da Davidson e MacKinnon nel capitolo 5 di <@itl="Econometric Theory and Methods">. HC0 produce quelli che di solito vengono chiamati "errori standard di White". La variante 3a è la procedura "jackknife" di MacKinnon–White.
</indent>
<indent>
• <@lit="pcse">: <@lit="off"> (impostazione predefinita) o <@lit="on">. Di solito, quando si stima un modello con pooled OLS su dati panel usando l'opzione <@lit="--robust">, viene usato lo stimatore di Arellano per la matrice di covarianza. Se si imposta <@lit="pcse"> a "on", verranno usati i Panel Corrected Standard Errors (PCSE) di Beck e Katz, che non tengono conto dell'autocorrelazione.
</indent>
<indent>
• <@lit="qs_bandwidth">: larghezza di banda per la stima HAC nel caso in cui si scelga il kernel "Quadratic Spectral" (a differenza dei kernel Bartlett e Parzen, la larghezza di banda QS non deve essere necessariamente un intero).
</indent>
<@itl="Filtri">
<indent>
• <@lit="hp_lambda">: <@lit="auto"> (valore predefinito), o un valore numerico. Imposta il parametro di livellamento per il filtro di Hodrick–Prescott (si veda la funzione <@lit="hpfilt"> sotto il comando <@lit="genr">). Il valore predefinito è 100 volte il quadrato della periodicità, ossia 100 per i dati annuali, 1600 per i dati trimestrali e così via.
</indent>
<indent>
• <@lit="bkbp_limits">: due interi, il secondo maggiore del primo (i valori predefiniti sono 8 e 32). Imposta i limiti di frequenza per il filtro passa-banda di Baxter–King (si veda la funzione <@lit="bkfilt"> nel comando <@lit="genr">).
</indent>
<indent>
• <@lit="bkbp_k">: un intero (il valore predefinito è 8). Imposta l'ordine di approssimazione per il filtro passa-banda di Baxter–King.
</indent>
<@itl="Serie storiche">
<indent>
• <@lit="horizon">: un intero (il valore predefinito dipende dalla frequenza dei dati). Imposta l'orizzonte per le funzioni impulso-risposta e per la decomposizione della varianza nel contesto delle autoregressioni vettoriali.
</indent>
<indent>
• <@lit="vecm_norm">: <@lit="phillips"> (valore predefinito), <@lit="diag">, <@lit="first"> o <@lit="none">. Usato nel contesto della stima VECM, attraverso il comando <@ref="vecm"> per identificare i vettori di cointegrazione. Si veda la Guida all'uso per i dettagli.
</indent>
# setinfo Dataset
Argomenti: <@var="nome-variabile"> <@lit="-d "><@var="descrizione"> <@lit="-n "><@var="nome-grafici">
Opzioni: <@lit="--discrete"> (marca la variabile come discreta)
<@lit="--continuous"> (marca la variabile come continua)
Esempi: <@lit="setinfo x1 -d "Descrizione di x1" -n "Nome nei grafici"">
<@lit="setinfo z --discrete">
Imposta fino a tre attributi di una variabile, nel modo seguente.
Usando l'opzione <@lit="-d"> seguita da una stringa tra virgolette doppie, la stringa verrà usata come etichetta descrittiva per la variabile indicata, che viene mostrata dal comando <@ref="labels"> e anche nella finestra principale del programma.
Usando l'opzione <@lit="-n"> seguita da una stringa tra virgolette doppie, la stringa verrà usata nei grafici al posto del nome della variabile.
Usando una delle opzioni <@lit="--discrete"> o <@lit="--continuous">, viene impostato il carattere numerico della variabile. In modalità predefinita, tutte le variabili sono considerate come continue; marcando una variabile come discreta, essa viene trattata in modo speciale nei diagrammi di frequenza.
Accesso dal menù: /Variabile/Modifica attributi
Accesso alternativo: Menù pop-up nella finestra principale
# setobs Dataset
Varianti: setobs <@var="periodicità"> <@var="oss-iniziale">
setobs <@var="variabile-unità"> <@var="variabile-periodi">
Opzioni: <@lit="--cross-section"> (interpreta come cross section)
<@lit="--time-series"> (interpreta come serie storiche)
<@lit="--stacked-cross-section"> (interpreta come panel)
<@lit="--stacked-time-series"> (interpreta come panel)
<@lit="--panel-vars"> (usa variabili indice (si veda oltre))
Esempi: <@lit="setobs 4 1990:1 --time-series">
<@lit="setobs 12 1978:03">
<@lit="setobs 1 1 --cross-section">
<@lit="setobs 20 1:1 --stacked-time-series">
<@lit="setobs unita anno --panel-vars">
Forza il programma a interpretare il dataset in uso secondo la struttura specificata.
Nella prima forma del comando, la <@var="periodicità">, che deve essere un valore intero, nel caso delle serie storiche rappresenta la frequenza delle osservazioni (1 = annuale; 4 = trimestrale; 12 = mensile; 52 = settimanale; 5, 6, o 7 = giornaliera; 24 = oraria). Nel caso di dati panel, la periodicità è il numero di righe per ogni blocco di dati, ossia il numero di unità cross section se i dati sono organizzati come pila di dati cross section, o il numero di periodi se i dati sono organizzati come pila di serie storiche. Nel caso di semplici dati cross section, la periodicità dev'essere impostata a 1.
L'osservazione iniziale rappresenta la data iniziale nel caso delle serie storiche. Gli anni possono essere indicati con due o quattro cifre, mentre i sotto-periodi (ad esempio i trimestri o i mesi) devono essere separati dagli anni con un carattere "due punti". Nel caso di dati panel, l'osservazione iniziale va indicata come 1:1, mentre nel caso di dati cross section come 1. L'osservazione iniziale per i dati giornalieri o settimanali va indicata nella forma AA/MM/GG o AAAA/MM/GG (oppure semplicemente 1 per i dati non datati).
La seconda forma del comando (che richiede l'uso dell'opzione <@lit="--panel-vars">) può essere usata per imporre un'interpretazione panel dei dati, quando il dataset contiene variabili che identificano in modo univoco le unità cross section e i periodi. Il dataset verrà ordinato come pila di serie storiche, per valori crescenti della variabile che rappresenta le unità, <@var="variabile-unità">.
Se non viene usata nessuna opzione per indicare esplicitamente la struttura dei dati, il programma cercherà di riconoscerla automaticamente a partire dalle informazioni indicate.
Accesso dal menù: Dati/Struttura dataset
# setmiss Dataset
Argomenti: <@var="valore"> [ <@var="lista-variabili"> ]
Esempi: <@lit="setmiss -1">
<@lit="setmiss 100 x2">
Imposta il programma in modo da interpretare un dato valore numerico (il primo parametro indicato al comando) come codice per i "valori mancanti" nei dati importati. Se questo valore è l'unico parametro fornito, come nel primo degli esempi precedenti, l'interpretazione verrà applicata a tutte le serie del dataset. Se <@var="valore"> è seguito da una lista di variabili, indicate per nome o numero, l'interpretazione è limitata solo alle variabili specificate. Così, nel secondo esempio, il valore 100 è interpretato come codice per "mancante", ma solo per la variabile <@lit="x2">.
Accesso dal menù: /Campione/Imposta codice valori mancanti
# shell Utilities
Argomento: <@var="comando-shell">
Esempi: <@lit="! ls -al">
<@lit="! notepad">
<@lit="launch notepad">
Un <@lit="!">, o la parola chiave <@lit="launch">, all'inizio di una riga di comando è interpretato come passaggio all'interprete di comandi (shell) usato dall'utente nel sistema operativo. In questo modo è possibile eseguire comandi shell arbitrari dall'interno di gretl. Quando si usa <@lit="!">, il comando esterno viene eseguito in modalità sincrona, ossia gretl aspetta il termine della sua esecuzione prima di procedere. Se invece si vuole avviare un altro programma da dentro gretl senza aspettare che abbia completato la sua esecuzione (modalità asincrona), occorre usare <@lit="launch">.
Per motivi di sicurezza, questa funzionalità è disabilitata in modalità predefinita. Per attivarla, occorre selezionare la casella "Abilita comandi shell" nel menù File, Preferenze. In questo modo si renderanno disponibili i comandi shell anche nella modalità a riga di comando di gretl (questo è l'unico modo per farlo).
# smpl Dataset
Varianti: <@lit="smpl"> <@var="oss-iniziale oss-finale">
<@lit="smpl"> <@var="+i -j">
<@lit="smpl"> <@var="variabile-dummy"> <@lit="--dummy">
<@lit="smpl"> <@var="condizione"> <@lit="--restrict">
<@lit="smpl"> <@lit="--no-missing [ "><@var="lista-variabili"> <@lit="]">
<@lit="smpl"> <@var="n"> <@lit="--random">
<@lit="smpl full">
Esempi: <@lit="smpl 3 10">
<@lit="smpl 1960:2 1982:4">
<@lit="smpl +1 -1">
<@lit="smpl x > 3000 --restrict">
<@lit="smpl y > 3000 --restrict --replace">
<@lit="smpl 100 --random">
Reimposta l'intervallo del campione. Il nuovo intervallo può essere definito in vari modi. Nel primo modo (corrispondente ai primi due esempi precedenti) <@var="oss-iniziale"> e <@var="oss-finale"> devono essere coerenti con la periodicità dei dati. Una delle due può essere sostituita da un punto e virgola per lasciare intatto il valore attuale. Nel secondo modo, gli interi <@var="i"> e <@var="j"> (che possono essere positivi o negativi e vanno indicati con il segno) sono presi come spostamenti relativi ai punti iniziale e finale del campione in uso. Nel terzo modo, <@var="variabile-dummy"> deve essere una variabile indicatrice che assume solo valori 0 o 1 e il campione verrà ristretto alle osservazioni per cui la variabile dummy vale 1. Il quarto modo, che usa <@lit="--restrict">, limita il campione alle osservazioni che soddisfano la condizione Booleana specificata secondo la sintassi del comando <@ref="genr">.
Con la forma <@lit="--no-missing">, se viene specificata una <@var="lista-variabili">, vengono selezionate le osservazioni per cui tutte le variabili nella <@var="lista-variabili"> hanno valori validi in corrispondenza dell'osservazione; altrimenti, se non viene indicata alcuna <@var="lista-variabili">, vengono selezionate le osservazioni per cui <@itl="tutte"> le variabili hanno valori validi (non mancanti).
Con la forma <@lit="--random">, viene estratto casualmente dal dataset il numero indicato di osservazioni. Per essere in grado di replicare questa selezione, occorre per prima cosa impostare il seme del generatore di numeri casuali (si veda il comando <@ref="set">).
La forma finale, <@lit="smpl full">, ripristina l'intervallo completo del campione.
Si noti che i vincoli sul campione di solito sono cumulativi: il valore di riferimento di ogni comando <@lit="smpl"> è il campione attuale, così che ogni vincolo si aggiunge a quelli già impostati. Se si vuole che il comando funzioni sostituendo i vincoli esistenti, occorre usare l'opzione <@lit="--replace"> alla fine del comando.
La variabile interna <@lit="obs"> può essere usata con la forma <@lit="--restrict"> di <@lit="smpl"> per escludere particolari osservazioni dal campione. Ad esempio,
<code>
smpl obs!=4 --restrict
</code>
scarterà la quarta osservazione. Se le osservazioni sono identificate da etichette,
<code>
smpl obs!="USA" --restrict
</code>
scarterà l'osservazione a cui è associata l'etichetta "USA".
Per le forme <@lit="--dummy">, <@lit="--restrict"> e <@lit="--no-missing"> di <@lit="smpl">, occore tenere presente che tutte le informazioni "strutturali" contenute nel file dei dati (a proposito della struttura di serie storiche o di panel dei dati) vengono perse. È possibile reimpostare la struttura originale con il comando <@ref="setobs">.
Si veda la <@pdf="la guida all'uso di gretl"> per ulteriori dettagli.
Accesso dal menù: /Campione
# spearman Statistics
Argomenti: <@var="x"> <@var="y">
Opzione: <@lit="--verbose"> (mostra i dati ordinati)
Mostra il coefficiente di correlazione di rango di Spearman per le variabili <@itl="x"> e <@itl="y">. Le variabili non devono essere state ordinate manualmente in precedenza, se ne occupa la funzione.
L'ordinamento automatico è dal massimo al minimo (ossia il valore massimo nei dati assume il rango 1). Se occorre invertire l'ordinamento, creare una variabile che è il negativo della variabile originale, ad esempio:
<code>
genr altx = -x
spearman altx y
</code>
Accesso dal menù: /Modello/Stima robusta/SPEARMAN - Correlazione di rango
# sprintf Printing
Argomenti: <@var="var-stringa"> <@var="formato"> <@lit=", "><@var="argomenti">
Questo comando funziona esattamente come il comando <@ref="printf">, stampando gli argomenti nel modo controllato dalla stringa di formato, tranne per il fatto che il risultato è scritto nella stringa specificata, <@var="var-stringa">.
Per stampare la variabile stringa, basta usare il suo nome preceduto da <@lit="@">, come in questo esempio:
<code>
sprintf variabile "%g", x
print "variabile ha il valore @variabile"
</code>
# square Transformations
Argomento: <@var="lista-variabili">
Opzione: <@lit="--cross"> (genera anche i prodotti incrociati, oltre ai quadrati)
Genera nuove variabili che sono i quadrati delle variabili nella <@var="lista-variabili"> (con anche i prodotti incrociati, se si usa l'opzione <@lit="--cross">). Ad esempio, <@lit="square x y"> genera <@lit="sq_x"> = <@lit="x"> al quadrato, <@lit="sq_y"> = <@lit="y"> al quadrato e (opzionalmente) <@lit="x_y"> = <@lit="x"> per <@lit="y">. Se una particolare variabile è una dummy, non ne viene fatto il quadrato, visto che si otterrebbe la stessa variabile.
Accesso dal menù: /Aggiungi/Quadrati delle variabili selezionate
# store Dataset
Argomenti: <@var="file-dati"> [ <@var="lista-variabili"> ]
Opzioni: <@lit="--csv"> (usa il formato CSV)
<@lit="--omit-obs"> (si veda oltre, a proposito del formato CSV)
<@lit="--gnu-octave"> (usa il formato GNU Octave)
<@lit="--gnu-R"> (usa il formato GNU R)
<@lit="--traditional"> (usa il formato tradizionale ESL)
<@lit="--gzipped"> (comprime con gzip)
<@lit="--jmulti"> (usa il formato ASCII di JMulti)
<@lit="--dat"> (usa il formato ASCII di PcGive)
<@lit="--database"> (usa il formato database di gretl)
<@lit="--overwrite"> (cfr oltre, a proposito del formato dei database)
Salva l'intero dataset, o un sottoinsieme delle variabili se è stata indicata una <@var="lista-variabili">, nel file indicato con <@var="file-dati">.
L'impostazione predefinita è di salvare i dati nel formato "interno" di gretl, ma le opzioni del comando permettono di usare formati alternativi. I dati CSV (Comma-Separated Values, dati separati da virgole) possono essere letti dai programmi di foglio elettronico e possono essere modificati con un editor di testi. I formati Octave, R e PcGive sono destinati ad essere usati con i rispettivi programmi. La compressione con gzip può essere utile per grandi dataset. Si veda la <@pdf="la guida all'uso di gretl"> per i dettagli sui vari formati.
L'opzione <@lit="--omit-obs"> è applicabile solo quando si salvano dati in formato CSV. In modalità predefinita, se i dati sono serie storiche o panel, o se il dataset include marcatori per osservazioni specifiche, il file CSV comprende una prima colonna che identifica le osservazioni (ad esempio per data). Se si usa <@lit="--omit-obs">, questa colonna verrà omessa e verranno salvati solo i dati effettivi.
Si noti che le variabili scalari non saranno salvate automaticamente: per salvarle occorre includerle esplicitamente nella <@var="lista-variabili">.
L'opzione di salvataggio in formato database di gretl è indicata se occorre costruire dei grandi dataset di serie, magari con frequenze diverse e diversi intervalli di osservazioni. Al momento questa opzione è disponibile solo per dati annuali, trimestrali o mensili. Salvando su un file che esiste già, il comportamento predefinito è quello di accodare le nuove serie al contenuto del database preesistente. In questo contesto, se una o più delle variabili da salvare hanno lo stesso nome di una delle variabili già presenti nel database si otterrà un messaggio di errore. L'opzione <@lit="--overwrite"> permette invece di sovrascrivere eventuali variabili del dataset che hanno lo stesso nome delle nuove variabili, in modo che queste ultime rimpiazzino le variabili preesistenti.
Accesso dal menù: /File/Salva dati; /File/Esporta dati
# summary Statistics
Argomento: [ <@var="lista-variabili"> ]
Mostra le statistiche descrittive per le variabili nella <@var="lista-variabili">, o per tutte le variabili nel dataset, se non si indica una <@var="lista-variabili">. L'output comprende media, scarto quadratico medio, coefficiente di variazione (= scarto quadratico medio / media), mediana, minimo, massimo, coefficiente di asimmetria, curtosi.
Accesso dal menù: /Visualizza/Statistiche descrittive
Accesso alternativo: Menù pop-up nella finestra principale
# system Estimation
Varianti: <@lit="system method="><@var="stimatore">
<@var="nome-sistema"><@lit=" <- system">
Esempi: <@lit=""Klein Model 1" <- system">
<@lit="system method=sur">
<@lit="system method=3sls">
Vedi anche <@inp="klein.inp">, <@inp="kmenta.inp">, <@inp="greene14_2.inp">
Inizia un sistema di equazioni. Esistono due versioni del comando, a seconda che si voglia salvare il sistema per poterlo stimare in più modi diversi, oppure stimare il sistema una volta sola.
Per salvare il sistema occorre dargli un nome, come nel primo esempio proposto (se il nome contiene spazi, occorre racchiuderlo tra virgolette). In questo caso, è possibile stimare il sistema con il comando <@ref="estimate">. Una volta che il sistema è stato salvato, è possibile imporre dei vincoli su di esso (compresi vincoli incrociati tra equazioni) usando il comando <@ref="restrict">.
In alternativa, è possibile indicare uno stimatore per il sistema usando <@lit="method="> seguito da una stringa che identifica uno degli stimatori supportati: <@lit="ols"> (ordinary least squares - minimi quadrati ordinari), <@lit="tsls"> (two-stage least squares - minimi quadrati a due stadi), <@lit="sur"> (seemingly unrelated regressions - regressioni apparentemente non collegate), <@lit="3sls"> (three-stage least squares - minimi quadrati a tre stadi), <@lit="fiml"> (full information maximum likelihood - massima verosimiglianza con informazione completa) o <@lit="liml"> (limited information maximum likelihood - massima verosimiglianza con informazione limitata). In questo caso, il sistema viene stimato appena completata la sua definizione.
Un sistema di equazioni termina con la riga <@lit="end system">. All'interno del sistema possono essere definiti i quattro tipi di istruzioni seguenti.
<indent>
• <@ref="equation">: specifica un'equazione del sistema. Occorre indicarne almeno due.
</indent>
<indent>
• <@lit="instr">: per i sistemi da stimare con i minimi quadrati a tre stadi, indica la lista degli strumenti (indicati dal nome o dal numero della variabile). In alternativa, è possibile fornire questa informazione nella riga <@lit="equation"> usando la stessa sintassi accettata dal comando <@ref="tsls">.
</indent>
<indent>
• <@lit="endog">: per i sistemi di equazioni simultanee, indica la lista delle variabili endogene. È indicato principalmente per la stima FIML, ma può essere usato anche nella stima minimi quadrati a tre stadi al posto dell'istruzione <@lit="instr">: in questo modo tutte le variabili non identificate come endogene verranno usate come strumenti.
</indent>
<indent>
• <@lit="identity">: per la stima FIML, un'identità che collega due o più variabili del sistema. Questo tipo di istruzione è ignorata se viene usato uno stimatore diverso da FIML.
</indent>
Dopo la stima eseguita con i comandi <@lit="system"> o <@lit="estimate"> è possibile recuperare informazioni aggiuntive dalle seguenti variabili accessorie:
<indent>
• <@lit="$uhat">: la matrice dei residui, una colonna per equazione.
</indent>
<indent>
• <@lit="$yhat">: la matrice dei valori stimati, una colonna per equazione.
</indent>
<indent>
• <@lit="$coeff">: il vettore colonna dei coefficienti (tutti i coefficienti della prima equazione, seguiti da quelli della seconda equazione, e così via).
</indent>
<indent>
• <@lit="$vcv">: la matrice di covarianza dei coefficienti. Se il vettore <@lit="$coeff"> ha <@itl="k"> elementi, questa matrice ha dimensione <@itl="k"> per <@itl="k">.
</indent>
<indent>
• <@lit="$sigma">: la matrice di covarianza dei residui incrociata tra equazioni.
</indent>
<indent>
• <@lit="$sysGamma">, <@lit="$sysA"> e <@lit="$sysB">: matrici dei coefficienti in forma strutturale (si veda oltre).
</indent>
Se si vuole salvare i residui o i valori stimati per una specifica equazione come serie di dati, basta selezionare la colonna dalla matrice <@lit="$uhat"> o <@lit="$yhat"> e assegnarla a una serie, come in
<code>
series uh1 = $uhat[,1]
</code>
Le matrici in forma strutturale corrispondono alla seguente rappresentazione di un modello ad equazioni simultanee:
<@fig="structural">
Se ci sono <@itl="n"> variabili endogene e <@itl="k"> variabili esogene, <@fig="Gamma"> è una matrice <@itl="n">×<@itl="n"> e <@itl="B"> è <@itl="n">×<@itl="k">. Se il sistema non contiene ritardi delle variabili endogene, la matrice <@itl="A"> non è presente. Se il massimo ritardo di un regressore endogeno è <@itl="p">, la matrice <@itl="A"> è <@itl="n">×<@itl="np">.
Accesso dal menù: /Modello/Equazioni simultanee
# tabprint Printing
Argomento: [ <@var="-f nomefile"> ]
Opzioni: <@lit="--rtf"> (Produce RTF invece di LaTeX)
<@lit="--complete"> (Crea un documento completo)
<@lit="--format="f1|f2|f3|f4""> (Specifica un formato personalizzato)
Va eseguito dopo la stima di un modello. Stampa il modello stimato sotto forma di tabella, in formato LaTeX, o, se viene usata l'opzione <@lit="--rtf">, in formato RTF. Se viene specificato un nome di file dopo l'opzione <@lit="-f">, l'output viene scritto nel file, altrimenti viene scritto in un file col nome <@lit="model_N.tex"> (o <@lit="model_N.rtf">), dove <@lit="N"> è il numero dei modelli stimati finora nella sessione in corso.
Le opzioni illustrate di seguito sono disponibili solo per il formato LaTeX.
Usando l'opzione <@lit="--complete">, il file LaTeX è un documento completo, pronto per essere processato; altrimenti il file va incluso in un documento.
Se si intende modificare lo stile del formato tabulare, è possibile specificare un formato personalizzato usando l'opzione <@lit="--format">, seguita da una stringa di formato. La stringa di formato va inclusa tra virgolette doppie e deve essere unita all'opzione con un segno di uguale. La composizione della stringa di formato è la seguente: ci sono quattro campi, che rappresentano il coefficiente, l'errore standard, il rapporto <@itl="t"> e il p-value. Questi campi vanno separati usando barre verticali e possono contenere una specificazione di formato per valori numerici nello stile della funzione <@lit="printf">, oppure possono essere lasciati in bianco, in modo da sopprimere la visualizzazione del campo nella rispettiva colonna dela tabella (con l'unico vincolo che non è possibile lasciare in bianco tutti i campi). Ecco alcuni esempi:
<code>
--format="%.4f|%.4f|%.4f|%.4f"
--format="%.4f|%.4f|%.3f|"
--format="%.5f|%.4f||%.4f"
--format="%.8g|%.8g||%.4f"
</code>
La prima specificazione stampa i valori di tutte le colonne usando 4 cifre decimali. La seconda sopprime il p-value e mostra il rapporto <@itl="t"> con 3 cifre decimali. La terza omette il rapporto <@itl="t">, mentre l'ultima omette il rapporto <@itl="t"> e mostra sia il coefficiente che l'errore standard con 8 cifre significative.
Una volta che si imposta un formato in questo modo, esso viene ricordato e usato per tutta la sessione di lavoro. Per tornare ad usare il formato predefinito, basta usare la parola chiave <@lit="--format=default">.
Accesso dal menù: Finestra del modello, /LaTeX
# textplot Graphs
Argomento: <@var="lista-variabili">
Opzioni: <@lit="--time-series"> (disegna per osservazione)
<@lit="--one-scale"> (forza l'uso di un'unica scala)
<@lit="--tall"> (usa 40 linee)
Gafica ASCII nuda e cruda. Senza l'opzione <@opt="--time-series">, <@var="varlist"> deve contenere almeno due serie, l'ultima delle quali va sull'asse delle ascisse, e verrà prodotto un diagramma a dispersione. In questo caso, si può usare l'opzione <@opt="--tall"> per produrre un grafico in cui l'asse <@itl="y"> è rappresentato da 40 righe di caratteri (il default è 20 righe).
Con l'opzione <@opt="--time-series">, viene prodotto un grafico per osservazione. In questo caso, l'opzione <@opt="--one-scale"> forza l'uso di una scala singola; altrimenti, se <@var="varlist"> contiene più di una serie i dati potrebbero essere riscalati. Ogni riga rappresenta un'osservazione, con i dati disegnati orizzontalmente.
Vedi anche <@ref="gnuplot">.
# tobit Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--verbose"> (mostra i dettagli delle iterazioni)
Stima un modello Tobit. Il modello può essere appropriato quando la variabile dipendente è "censurata". Ad esempio, vengono osservati valori positivi o nulli della spesa dei consumatori per beni durevoli, ma non valori negativi; tuttavia le decisioni di spesa possono essere pensate come derivanti da una propensione al consumo, sottostante e non osservata, che può anche essere negativa in alcuni casi. Per i dettagli si veda il capitolo 20 di <@itl="Econometric Analysis"> di Greene.
Accesso dal menù: /Modello/Modelli non lineari/Tobit
# tsls Estimation
Argomenti: <@var="variabile-dipendente"> <@var="variabili-indipendenti"> ; <@var="strumenti">
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--robust"> (errori standard robusti)
<@lit="--liml"> (usa massima verosimiglianza a informazione limitata)
<@lit="--gmm"> (usa il metodo generalizzato dei momenti)
Esempio: <@lit="tsls y1 0 y2 y3 x1 x2 ; 0 x1 x2 x3 x4 x5 x6">
Calcola le stime con variabili strumentali, per impostazione predefinita usando i minimi quadrati a due stadi (TSLS), ma è possibile scegliere altre opzioni. Occorre specificare la <@var="variabile-dipendente">, la lista di <@var="variabili-indipendenti"> (che si intende includere alcuni regressori endogeni), e infine gli <@var="strumenti">, la lista completa delle variabili esogene e predeterminate. Se la lista degli <@var="strumenti"> non è lunga almeno quanto quella delle <@var="variabili-indipendenti">, il modello non è identificato.
Nell'esempio precedente, le <@lit="y"> sono le variabili endogene e le <@lit="x"> sono le variabili esogene e predeterminate. Si noti che eventuali regressori esogeni devono essere inclusi in entrambe le liste.
L'output delle stime TSLS comprende il test di Hausman e, se il modello è sovra-identificato, il test di Sargan per la sovra-identificazione. Nel test di Hausman, l'ipotesi nulla è che le stime OLS siano consistenti, o in altre parole che non sia richiesta la stima per mezzo di variabili strumentali. Un modello di questo tipo è sovra-identificato se ci sono più strumenti di quelli strettamente necessari. Il test di Sargan è basato su una regressione ausiliaria dei residui del modello minimi quadrati a due stadi sull'intera lista degli strumenti. L'ipotesi nulla è che tutti gli strumenti siano validi, cosa di cui si dovrebbe dubitare se la regressione ausiliaria ha un significativo potere esplicativo. Davidson e MacKinnon (2004, capitolo 8) forniscono una buona spiegazione di entrambi i test.
Il valore R-quadro mostrato i modelli stimati con i minimi quadrati a due stadi è il quadrato della correlazione tra la variabile dipendente e i valori stimati.
In alternativa al metodo TSLS, il modello può essere stimato usando la massima verosimiglianza a informazione limitata (opzione <@lit="--liml">) o il metodo generalizzato dei momenti (opzione <@lit="--gmm">). Si noti che se il modello è esattamente identificato, questi metodi dovrebbero produrre gli stessi risultati del metodo TSLS, ma se il modello è sovraidentificato, i risultati saranno in genere diversi.
Se si usa la stima GMM, è possibile usare le seguenti opzioni aggiuntive:
<indent>
• <@lit="--two-step">: esegue la stima GMM in due passi, invece che in un passo solo.
</indent>
<indent>
• <@lit="--iterate">: itera il GMM fino alla convergenza.
</indent>
<indent>
• <@lit="--weights="><@var="Pesi">: specifica una matrice quadrata di pesi da usare nel calcolo della funzione criterio del GMM. La dimensione di questa matrice deve essere pari al numero di strumenti. L'impostazione predefinita consiste nell'usare una matrice identità di dimensione opportuna.
</indent>
Accesso dal menù: /Modello/TSLS - Minimi quadrati a due stadi
# var Estimation
Argomenti: <@var="ordine"> <@var="lista-variabili"> [ ; <@var="lista-esogene"> ]
Opzioni: <@lit="--nc"> (non include una costante)
<@lit="--trend"> (include un trend)
<@lit="--seasonals"> (include variabili dummy stagionali)
<@lit="--robust"> (errori standard robusti)
<@lit="--impulse-responses"> (mostra impulso-risposta)
<@lit="--variance-decomp"> (mostra decomposizioni della varianza della previsione)
<@lit="--lagselect"> (mostra i criteri di informazione per la selezione dei ritardi)
Esempi: <@lit="var 4 x1 x2 x3 ; time mydum">
<@lit="var 4 x1 x2 x3 --seasonals">
<@lit="var 12 x1 x2 x3 --lagselect">
Imposta e stima (usando OLS) un'autoregressione vettoriale (VAR). Il primo argomento specifica l'ordine di ritardo (o il massimo ordine di ritardi se è stata usata l'opzione <@lit="--lagselect">). L'ordine può essere indicato numericamente o con il nome di una variabile scalare preesistente. Quindi segue l'impostazione della prima equazione. Non occorre includere i ritardi tra gli elementi della <@var="lista-variabili">: verranno aggiunti automaticamente. Il punto e virgola separa le variabili stocastiche, per cui verrà incluso un numero di ritardi pari a <@var="ordine">, dai termini deterministici o esogeni presenti nella <@var="lista-esogene">. Si noti che viene inclusa automaticamente una costante, a meno che non si usi l'opzione <@lit="--nc">; inoltre è possibile aggiungere un trend con l'opzione <@lit="--trend"> e variabili dummy stagionali con l'opzione <@lit="--seasonals">.
Viene calcolata una regressione separata per ognuna delle variabili nella <@var="lista-variabili">. Il risultato di ogni equazione include i test <@itl="F"> per i vincoli di uguaglianza a zero su tutti i ritardi delle variabili, un test <@itl="F"> per la significatività del ritardo massimo e, se è stata usata l'opzione <@lit="--impulse-responses">, la scomposizione della varianza della previsione e le funzioni di impulso-risposta.
Le decomposizioni della varianza della previsione e le funzioni di impulso-risposta sono basate sulla decomposizione di Cholesky della matrice di covarianza contemporanea, e in questo contesto l'ordine in cui vengono date le variabili stocastiche conta. La prima variabile nella lista viene considerata come la "più esogena" all'interno del periodo. L'orizzonte per le decomposizioni della varianza e le funzioni di impulso-risposta può essere impostato usando il comando <@ref="set">.
Se si usa l'opzione <@lit="--lagselect">, il primo parametro del comando <@lit="var"> viene interpretato come il massimo ordine di ritardo. In questo caso, il comando non produce il solito risultato della stima del VAR, ma una tabella che mostra i valori dei criteri di informazione di Akaike (AIC), Schwartz (BIC) e Hannan–Quinn (HQC) calcolati per VAR dall'ordine 1 fino all'ordine massimo indicato, in modo da aiutare nella scelta dell'ordine di ritardo ottimale.
Accesso dal menù: /Modello/Serie storiche/VAR - Autoregressione vettoriale
# varlist Dataset
Mostra un elenco delle variabili disponibili. <@lit="list"> e <@lit="ls"> sono sinonimi.
# vartest Tests
Argomenti: <@var="var1"> <@var="var2">
Calcola la statistica <@itl="F"> per l'ipotesi nulla che le varianze della popolazione per le variabili <@var="var1"> e <@var="var2"> siano uguali e mostra il p-value.
Accesso dal menù: /Modello/Modelli bivariati/Differenza delle varianze
# vecm Estimation
Argomenti: <@var="ordine"> <@var="rango"> <@var="lista-y"> [ ; <@var="lista-x"> ] [ ; <@var="lista-rx"> ]
Opzioni: <@lit="--nc"> (senza costante)
<@lit="--rc"> (costante vincolata)
<@lit="--crt"> (costante e trend vincolato)
<@lit="--ct"> (costante e trend non vincolato)
<@lit="--seasonals"> (include dummy stagionali centrate)
<@lit="--impulse-responses"> (mostra impulso-risposta)
<@lit="--variance-decomp"> (mostra decomposizioni della varianza delle previsioni)
Esempi: <@lit="vecm 4 1 Y1 Y2 Y3">
<@lit="vecm 3 2 Y1 Y2 Y3 --rc">
<@lit="vecm 3 2 Y1 Y2 Y3 ; X1 --rc">
Vedi anche <@inp="denmark.inp">, <@inp="hamilton.inp">
Un VECM è un tipo di autoregressione vettoriale, o VAR (si veda <@ref="var">), applicabile quando le variabili del modello sono individualmente integrate di ordine 1 (ossia, sono "random walk" con o senza deriva), ma esibiscono cointegrazione. Questo comando è strettamente connesso al test di Johansen per la cointegrazione (si veda <@ref="coint2">).
Il parametro <@var="ordine"> rappresenta l'ordine di ritardo del sistema VAR. Il numero di ritardi nel VECM (dove la variabile dipendente è data da una differenza prima) è pari a <@var="ordine"> meno uno.
Il parametro <@var="rango"> rappresenta il rango di cointegrazione, o in altre parole il numero di vettori di cointegrazione. Questo deve essere maggiore di zero e minore o uguale (in genere minore) al numero di variabili endogene contenute nella <@var="lista-y">.
La <@var="lista-y"> rappresenta l'elenco delle variabili endogene, nei livelli. L'inclusione di trend deterministici nel modello è controllata dalle opzioni del comando. Se non si indica alcuna opzione, viene inclusa una "costante non vincolata", che permette la presenza di un'intercetta diversa da zero nelle relazioni di cointegrazione e di un trend nei livelli delle variabili endogene. Nella letteratura originata dal lavoro di Johansen (si veda ad esempio il suo libro del 1995), si fa riferimento a questo come al "caso 3". Le prime quattro opzioni mostrate sopra, che sono mutualmente esclusive, producono rispettivamente i casi 1, 2, 4 e 5. Il significato di questi casi e i criteri per scegliere tra di essi sono spiegati nella <@pdf="la guida all'uso di gretl">.
Le liste opzionali <@var="lista-x"> e <@var="lista-rx"> permettono di specificare insiemi di variabili esogene che entrano nel modello in modo non vincolato (<@var="lista-x">) o in modo vincolato allo spazio di cointegrazione (<@var="lista-rx">). Queste liste vanno separate dalla <@var="lista-y"> (e tra di loro) da caratteri punto e virgola.
L'opzione <@lit="--seasonals">, che può accompagnare una qualsiasi delle altre opzioni, specifica l'inclusione di un gruppo di variabili dummy stagionali centrate. Questa opzione è disponibile solo per dati trimestrali o mensili.
Il primo degli esempi mostrati sopra specifica un VECM con ordine di ritardo pari a 4 e un unico vettore di cointegrazione. Le variabili endogene sono <@lit="Y1">, <@lit="Y2"> e <@lit="Y3">. Il secondo esempio usa le stesse variabili ma specifica un ritardo di ordine 3 e due vettori di cointegrazione, oltre a specificare una "costante vincolata", che è appropriata se i vettori di cointegrazione possono avere un'intercetta diversa da zero, ma le variabili <@lit="Y"> non hanno trend.
Accesso dal menù: /Modello/Serie storiche/VECM
# vif Tests
Deve seguire la stima di un modello che includa almeno due variabili indipendenti. Calcola e mostra i fattori di inflazione della varianza (Variance Inflation Factors - VIF) per i regressori. Il VIF per il regressore <@itl="j"> è definito come
<@fig="vif">
dove <@itl="R"><@sub="j"> è il coefficiente di correlazione multipla tra il regressore <@itl="j"> e gli altri regressori. Il fattore ha un valore minimo di 1.0 quando la variabile in questione è ortogonale alle altre variabili indipendenti. Neter, Wasserman e Kutner (1990) suggeriscono di usare il VIF maggiore come test diagnostico per la collinearità; un valore superiore a 10 è in genere considerato indice di un grado di collinearità problematico.
Accesso dal menù: Finestra del modello, /Test/collinearità
# wls Estimation
Argomenti: <@var="variabile-pesi"> <@var="variabile-dipendente"> <@var="variabili-indipendenti">
Opzioni: <@lit="--vcv"> (mostra la matrice di covarianza)
<@lit="--robust"> (errori standard robusti)
<@lit="--quiet"> (non mostra i risultati)
Calcola stime con minimi quadrati ponderati (WLS - Weighted Least Squares), prendendo i pesi da <@var="variabile-pesi">. In pratica, detta <@var="w"> la radice quadrata positiva della <@lit="variabile-pesi">, viene calcolata una regressione OLS di <@var="w"> <@lit="*"> <@var="variabile-dipendente"> rispetto a <@var="w"> <@lit="*"> <@var="variabili-indipendenti">. L'<@itl="R">-quadro, comunque, è calcolato in un modo speciale, ossia come
<@fig="wlsr2">
dove ESS è la somma dei quadrati degli errori (somma dei quadrati dei residui) dalla regressione ponderata, mentre WTSS denota la "somma totale ponderata dei quadrati", che è pari alla somma dei quadrati dei residui della regressione della variabile dipendente ponderata sulla sola costante ponderata.
Se <@var="variabile-pesi"> è una variabile dummy, la stima WLS equivale a eliminare tutte le osservazioni per cui essa vale zero.
Accesso dal menù: /Modello/Altri modelli lineari/WLS - Minimi quadrati ponderati
# xcorrgm Statistics
Argomenti: <@var="var1"> <@var="var2"> [ <@var="maxlag"> ]
Esempio: <@lit="xcorrgm x y 12">
Mostra il correlogramma incrociato per le variabili <@var="var1"> e <@var="var2">, che possono essere specificate per nome o per numero. I valori sono i coefficienti di correlazione campionari tra il valore presente di <@var="var1"> e i valori ritardati e anticipati di <@var="var2">.
Se si indica un valore <@var="maxlag">, la lunghezza del correlogramma è limitata al numero di ritardi e anticipi indicati, altrimenti è determinata automaticamente in funzione della frequenza dei dati e del numero di osservazioni.
Accesso dal menù: /Visualizza/Correlogramma
Accesso alternativo: Menù pop-up nella finestra principale (selezione multipla)
# xtab Statistics
Argomenti: <@var="lista-y"> [ ; <@var="lista-x"> ]
Opzioni: <@lit="--row"> (mostra le percentuali per riga)
<@lit="--column"> (mostra le percentuali per colonna)
<@lit="--zeros"> (mostra i valori pari a zero)
Mostra la tabella di contingenza, o la tabulazione incrociata, tra ogni combinazione delle variabili della <@var="lista-y">; se si indica anche una seconda lista, <@var="lista-x">, ogni variabile della <@var="lista-y"> viene tabulata (per riga) rispetto ad ogni variabile della <@var="lista-x"> (per colonna). Le variabili in queste liste possono essere referenziate per nome o per numero, e devono essere state marcate come discrete.
Per impostazione predefinita le celle indicano la frequenza assoluta. Le opzioni <@lit="--row"> e <@lit="--column"> (che sono mutualmente esclusive) sostituiscono la frequenza assoluta con le frequenze in percentuale relativamente a ciascuna riga o colonna. Le celle con valore di frequenza nullo sono lasciate vuote, a meno che non venga usata l'opzione <@lit="--zeros">, che mostra esplicitamente i valori pari a zero; questa opzione può essere comoda se occorre importare la tabella in un altro programma, come un foglio di calcolo.
Il test chi quadro di Pearson per l'indipendenza viene mostrato se la frequenza attesa nell'ipotesi di indipendenza è pari almeno a 1.0e-7 per tutte le celle. Una regola approssimativa usata spesso nel giudicare la validità di questa statistica richiede che la frequenza attesa sia superiore a 5 per almeno l'80 per cento delle celle; se questa condizione non viene soddisfatta viene mostrato un messaggio di avvertimento.
Se la tabella di contingenza è 2 x 2, viene calcolato il test esatto di Fisher per l'indipendenza. Si noti che questo test si basa sull'ipotesi che i totali per riga e colonna siano fissi; questo può essere appropriato o meno a seconda di come sono stati generati i dati. Il p-value sinistro va usato nel caso in cui l'ipotesi alternativa a quella di indipendenza sia quella dell'associazione negativa (ossia i valori tendono ad accumularsi nelle celle che non appartengono alla diagonale della tabella), mentre il p-value destro va usato nell'ipotesi alternativa di associazione positiva. Il p-value a due code di questo test è calcolato seguendo il metodo (b) descritto in Agresti (1992, capitolo 2.1): esso è la somma delle probabilità di tutte le possibili tabelle che hanno i totali per riga e per colonna pari a quelli della tabella data e che hanno una probabilità minore o uguale a quella della tabella data.
|