Modelli statistici I
Statistical models I
Crediti: 12
Modulo Modelli lineari per dati categoriali SECS-S/01 – Crediti: 6
Modulo Modello lineare generalizzato SECS-S/01 – Crediti: 6
Docente responsabile: Giorgio Vittadini
giorgio.vittadini@unimib.it | +39 0264483189
1. Obiettivi dell’attività formativa
Il corso ha quale obiettivo l’estensione del modello lineare classico a modellistiche più avanzate con riferimento a due ambiti principali: (1) i modelli lineari per dati categoriali, secondo i due approcci, rispettivamente, del modello lineare generale, che riguarda i modelli a rango non pieno, e del modello lineare generalizzato, che riguarda variabili risposta con legge di distribuzione appartenente alla famiglia esponenziale; (2) i modelli lineari generalizzati sviluppati per i casi, rispettivamente, di: errori eteroschedastici e/o correlati, più di una variabile dipendente, dati con struttura gerarchica, e variabili esplicative latenti. Ciascun ambito sarà l’oggetto specifico di un modulo del corso.
2. Programma riassuntivo
L’insegnamento è articolato nei seguenti due moduli:
a. Modelli lineari per dati categoriali
Parte A
- Modello lineare generale (GLM)
- Casi particolari: Modello ANOVA a una e più vie e Modello ANCOVA
- Applicazione a dati reali e sperimentali con il software SAS
Parte B
- Modello lineare generalizzato (GENMOD-GLM)
- Casi particolari: Modelli logit e probit, modelli log-lineari
- Cenni ai modelli GEE per dati correlati
- Applicazione a dati reali con SAS
b. Modello lineare generalizzato
Parte A
- Modelli lineari generalizzati (GLS)
- Modello multivariato e Modello SURE
- Modello Multilevel
Parte B
- Correlazione spuria e Path analysis
- Modello fattoriale esplorativo e confermativo
- Applicazioni su software SAS
3. Propedeuticità
Per questa attività formativa è indispensabile la conoscenza degli argomenti trattati nei corsi di base di Analisi Statistica Multivariata.
4. Tipologia didattica
Lezioni in classe e in laboratorio statistico-informatico
5. Modalità dell’esame
Esami scritti e analisi di casi empirici da preparare sulla base di metodologie assegnate nominalmente a ciascuno studente alla fine del corso.
- Ulteriori informazioni sono riportate sul sito: http://www.statistica.unimib.it/utenti/solaro
- Lezioni frontali, esercitazioni e laboratorio.
6. Programma dettagliato
a. Modelli lineari per dati categoriali
Docente: Nadia Solaro | nadia.solaro@unimib.it
Parte A
- Richiami sul modello lineare classico: specificazione matriciale del modello, ipotesi, metodo di stima dei minimi quadrati ordinari e metodo di massima verosimiglianza, proprietà degli stimatori, valutazione della bontà di adattamento, intervalli di confidenza e verifica di ipotesi.
- La teoria del modello lineare generale (GLM): specificazione del modello, ipotesi, soluzione del sistema di equazioni normali mediante inversa generalizzata, funzioni stimabili e loro proprietà, nozione di ipotesi testabile. Relazione con il metodo di stima dei minimi quadrati vincolati: approcci sum-to-zero e set-to-zero linear constraints. Costruzione di contrasti. Procedure di confronto multiplo.
- Casi particolari di GLM: modelli ANOVA ad effetti fissi a una e a più vie, modello ANCOVA. Cenni ai modelli ANOVA ad effetti casuali.
- Applicazioni in SAS: PROC GLM.
Parte B
- Richiami sulle famiglie esponenziali: definizione e principali proprietà. Casi particolari: variabili casuali binomiale, di Poisson, normale, gamma.
- Modello lineare generalizzato (GENMOD-GLM): distribuzione di probabilità della variabile risposta, link function e specificazione del modello, ipotesi, metodo di stima di massima verosimiglianza, proprietà degli stimatori, criteri per la valutazione della bontà di adattamento del modello, intervalli di confidenza e verifica di ipotesi.
- Casi particolari di GENMOD-GLM: modelli logit e probit, modelli log-lineari per tabelle di contingenza multidimensionali, modelli per risposte ordinali.
- Cenni ai modelli GEE (Generalized Estimating Equations) per dati correlati: GEE come estensione dell’approccio GENMOD-GLM. Modelli subject-specific e population-averaged.
- Applicazioni in SAS: PROC GENMOD.
b. Modello lineare generalizzato
Docente: Giorgio Vittadini | giorgio.vittadini@unimib.it
Parte A
- Modelli lineari generalizzati: modelli lineari generalizzati con errori eteroschedastici. Modelli lineari generalizzati con errori correlati. Modelli lineari generalizzati con errori correlati e eteroschedastici.
- Modello lineare classico multivariato e modello multivariato con diverse ipotesi sugli errori. Modello SURE.
- Modello Multilevel: struttura gerarchica dei dati e diversi tipi di regressione. Modello lineare con popolazione suddivisa in gruppi. Analisi varianza a effetti misti. Analisi covarianza. Modello Multilevel: ipotesi; metodi di stima; interpretazione risultati; diagnostica; applicazioni.
Parte B
- Path analysis
– Correlazione spuria e modelli causali. Path analysis: ipotesi; metodi di stima; interpretazione risultati. Modello strutturale di path analysis - Analisi fattoriale
– Tipologia delle variabili latenti. Analisi fattoriale: ipotesi; metodi di stima delle comunalità; metodi per ricavare i parametri; metodi per ricavare i punteggi fattoriali; rotazione dei fattori; non identificabilità dei parametri e indeterminatezza dei fattori. Analisi fattoriale confermativa.
7. Materiale didattico
a. Modelli lineari per dati categoriali
Testi di riferimento
– Materiale didattico messo a disposizione dalla docente e scaricabile alla pagina web (accesso protetto da password e riservato agli studenti del corso): http://www.statistica.unimib.it/utenti/solaro
– All’inizio del corso la docente attiverà un servizio di mailing list al quale si possono iscrivere tutti gli studenti a cui l’insegnamento è rivolto. Il servizio verrà poi disattivato alla fine del corso.
- Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
- Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
- Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
- Zeger, S. L., Liang, K. Y., and Albert, P. S. (1988), “Models for Longitudinal Data: A Generalized Estimating Equation Approach”, Biometrics, 44, 1049–1060
Testi integrativi
- Diggle, P. J., Liang, K. Y., and Zeger, S. L. (1994), Analysis of Longitudinal Data, Oxford: Clarendon Press
- Hardin, J. W. and Hilbe, J. M. (2003), Generalized Estimating Equations, Boca Raton, FL: Chapman & Hall/CRC
- Liang, K. Y. and Zeger, S. L. (1986), “Longitudinal Data Analysis Using Generalized Linear Models,” Biometrika, 73, 13–22
- McCullagh, P. and Nelder, J. A. (1989), Generalized Linear Models, Second Edition, London: Chapman & Hall
- Nelder, J. A. and Wedderburn, R. W. M. (1972), “Generalized Linear Models”, Journal of the Royal Statistical Society, Series A, 135, 370–384
- Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons
b. Modello lineare generalizzato
Testi di riferimento
– Lucidi presentati nel corso disponibili dopo le lezioni sul sito del docente:
– http://www.statistica.unimib.it/utenti/vittadini/DIDATTICA/DIDATTICA.html
– Materiale prodotto in laboratorio statistico-informatico durante le esercitazioni (codici SAS e output delle analisi):
– http://www.statistica.unimib.it/utenti/solaro/
Testi integrativi
Per l’argomento: Modello lineare in presenza di eteroschedasticità e/o di errori correlati: metodo dei minimi quadrati generalizzati. Modello lineare multivariato. Modello SURE
- Baltagi B. H. (2008), Econometrics, fourth Edition, Springer Berlin (Part I capitoli 1-5; Part II capitoli 9-10-11).
- Faliva M. (1987), Econometria. Principi e metodi, UTET, Bologna (capitoli 5, 6, 7).
- Johnston J. (1993). Econometrica, 3a edizione, Franco Angeli, Milano (capitoli 2, 3, 5, 7, 8).
- Srivastava V.K., Giles D.E.A. (1987). Seemingly Unrelated Regression Equations Models, Marcel Dekker, New York (In particolare, capitoli 1, 2).
- Zellner A. (1962), An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias. Journal of the American Statistical Association, vol. 57, n. 298, pp. 348 – 368.
- Manuale SAS/STAT 9.3 (capitoli 4, 41, 76).
- Manuale SAS/ETS 9.3 (capitoli 8, 29).
Per l’argomento: Modelli multilevel
- Goldstein H. (1999), Multilevel Statistical Models, Multilevel Models Project, Institute of Education, London (capitoli 1, 2, 3), download: http://www.ats.ucla.edu/stat/examples/msm_goldstein/goldstein.pdf
- Snijders T.A.B., Bosker R.J. (1999), Multilevel Analysis – An introduction to basic and advanced multilevel modelling, SAGE Publications, London (capp. 1-7).
- Manuale SAS/STAT 9.3 (capitoli 5, 6, 58).
Per l’argomento: Path Analysis, modelli ad equazioni strutturali
- Dillon W R, Goldstein M (1984). Path Analysis. In: Dillon W R, Goldstein M, Multivariate Analysis: Methods And Applications, Wiley (capitolo 12).
- Dillon W R, Goldstein M (1984). Latent Structure Analysis. In: Dillon W R, Goldstein M, Multivariate Analysis: Methods And Applications, Wiley (cap.13).
- Duncan O.D (1966). Path Analysis: Sociological Examples. The American Journal of Sociology, Vol. 72 (1): 1:16.
- Mueller R.O. (1996) Linear Regression And Classical Path Analysis. In: Basic Principles Of Structural Equation Modeling. Springer Verlag, 1-62 (cap. 1).
- Manuale SAS/STAT 9.3 (capitoli 17, 26).
Per l’argomento: Analisi fattoriale
- Dillon W R, Goldstein M, Multivariate Analysis: Methods And Applications, Wiley (capitolo 3).
- Fabbris L., Statistica Multivariata, McGraw- Hill, Milano, 1997, (capitolo 5).
- Lawley, D. N., & Maxwell, A. E (1963), Factor analysis as a statistical method. London: Butterworths.
- Manuale SAS/STAT 9.3 (capitoli 9, 26, 34).
- Il Manuale SAS/STAT VS 9.3 User’s Guide è disponibile al link: http://support.sas.com/documentation/onlinedoc/stat/index.html#stat93
- Il Manuale SAS/ETS VS.9.3 User’s Guide è disponibile al link: http://support.sas.com/documentation/cdl/en/etsug/63939/PDF/default/etsug.pdf