Modelli statistici I

Modelli statistici I

Statistical models I

Crediti: 12
Modulo Modelli lineari per dati categoriali        SECS-S/01 – Crediti: 6
Modulo Modello lineare generalizzato               SECS-S/01 – Crediti: 6

Docente responsabile: Giorgio Vittadini
giorgio.vittadini@unimib.it  | +39 0264483189

1. Obiettivi dell’attività formativa

Il corso ha quale obiettivo l’estensione del modello lineare classico a modellistiche più avanzate con riferimento a due ambiti principali: (1) i modelli lineari per dati categoriali, secondo i due approcci, rispettivamente, del modello lineare generale, che riguarda i modelli a rango non pieno, e del modello lineare generalizzato, che riguarda variabili risposta con legge di distribuzione appartenente alla famiglia esponenziale; (2) i modelli lineari generalizzati sviluppati per i casi, rispettivamente, di: errori eteroschedastici e/o correlati, più di una variabile dipendente, dati con struttura gerarchica, e variabili esplicative latenti. Ciascun ambito sarà l’oggetto specifico di un modulo del corso.

2. Programma riassuntivo

L’insegnamento è articolato nei seguenti due moduli:

a.    Modelli lineari per dati categoriali

Parte A

  • Modello lineare generale (GLM)
  • Casi particolari: Modello ANOVA a una e più vie e Modello ANCOVA
  • Applicazione a dati reali e sperimentali con il software SAS

Parte B

  • Modello lineare generalizzato (GENMOD-GLM)
  • Casi particolari: Modelli logit e probit, modelli log-lineari
  • Cenni ai modelli GEE per dati correlati
  •  Applicazione a dati reali con SAS

b. Modello lineare generalizzato

Parte A

  • Modelli lineari generalizzati (GLS)
  • Modello multivariato e Modello SURE
  • Modello Multilevel

Parte B

  • Correlazione spuria e Path analysis
  • Modello fattoriale esplorativo e confermativo
  • Applicazioni su software SAS

3. Propedeuticità

Per questa attività formativa è indispensabile la conoscenza degli argomenti trattati nei corsi di base di Analisi Statistica Multivariata.

4. Tipologia didattica

Lezioni in classe e in laboratorio statistico-informatico

5. Modalità dell’esame

Esami scritti e analisi di casi empirici da preparare sulla base di metodologie assegnate nominalmente a ciascuno studente alla fine del corso.

6. Programma dettagliato

a. Modelli lineari per dati categoriali

Docente: Nadia Solaro | nadia.solaro@unimib.it

Parte A

  • Richiami sul modello lineare classico: specificazione matriciale del modello, ipotesi, metodo di stima dei minimi quadrati ordinari e metodo di massima verosimiglianza, proprietà degli stimatori, valutazione della bontà di adattamento, intervalli di confidenza e verifica di ipotesi.
  • La teoria del modello lineare generale (GLM): specificazione del modello, ipotesi, soluzione del sistema di equazioni normali mediante inversa generalizzata, funzioni stimabili e loro proprietà, nozione di ipotesi testabile. Relazione con il metodo di stima dei minimi quadrati vincolati: approcci sum-to-zero e set-to-zero linear constraints. Costruzione di contrasti. Procedure di confronto multiplo.
  • Casi particolari di GLM: modelli ANOVA ad effetti fissi a una e a più vie, modello ANCOVA. Cenni ai modelli ANOVA ad effetti casuali.
  • Applicazioni in SAS: PROC GLM.

Parte B

  • Richiami sulle famiglie esponenziali: definizione e principali proprietà. Casi particolari: variabili casuali binomiale, di Poisson, normale, gamma.
  • Modello lineare generalizzato (GENMOD-GLM): distribuzione di probabilità della variabile risposta, link function e specificazione del modello, ipotesi, metodo di stima di massima verosimiglianza, proprietà degli stimatori, criteri per la valutazione della bontà di adattamento del modello, intervalli di confidenza e verifica di ipotesi.
  •  Casi particolari di GENMOD-GLM: modelli logit e probit, modelli log-lineari per tabelle di contingenza multidimensionali, modelli per risposte ordinali.
  • Cenni ai modelli GEE (Generalized Estimating Equations) per dati correlati: GEE come estensione dell’approccio GENMOD-GLM. Modelli subject-specific e population-averaged.
  • Applicazioni in SAS: PROC GENMOD.

b. Modello lineare generalizzato

Docente: Giorgio Vittadini | giorgio.vittadini@unimib.it

Parte A

  • Modelli lineari generalizzati: modelli lineari generalizzati con errori eteroschedastici. Modelli lineari generalizzati con errori correlati. Modelli lineari generalizzati con errori correlati e eteroschedastici.
  • Modello lineare classico multivariato e modello multivariato con diverse ipotesi sugli errori. Modello SURE.
  • Modello Multilevel: struttura gerarchica dei dati e diversi tipi di regressione. Modello lineare con popolazione suddivisa in gruppi. Analisi varianza a effetti misti. Analisi covarianza. Modello Multilevel: ipotesi; metodi di stima; interpretazione risultati; diagnostica; applicazioni.

Parte B

  • Path analysis
    – Correlazione spuria e modelli causali. Path analysis: ipotesi; metodi di stima; interpretazione risultati. Modello strutturale di path analysis
  • Analisi fattoriale
    – Tipologia delle variabili latenti. Analisi fattoriale: ipotesi; metodi di stima delle comunalità; metodi per ricavare i parametri; metodi per ricavare i punteggi fattoriali; rotazione dei fattori; non identificabilità dei parametri e  indeterminatezza dei fattori. Analisi fattoriale confermativa.

7. Materiale didattico

a. Modelli lineari per dati categoriali

Testi di riferimento

– Materiale didattico messo a disposizione dalla docente e scaricabile alla pagina web (accesso protetto da password e riservato agli studenti del corso): http://www.statistica.unimib.it/utenti/solaro

– All’inizio del corso la docente attiverà un servizio di mailing list al quale si possono iscrivere tutti gli studenti a cui l’insegnamento è rivolto. Il servizio verrà poi disattivato alla fine del corso.

  • Agresti, A. (2002), Categorical Data Analysis, Second Edition, New York: John Wiley & Sons
  • Dobson, A. (1990), An Introduction to Generalized Linear Models, London: Chapman & Hall
  • Littell, R. C., Freund, R. J., and Spector, P. C. (2002), SAS for Linear Models, 4th Edition, Cary, NC: SAS Institute Inc.
  • Zeger, S. L., Liang, K. Y., and Albert, P. S. (1988), “Models for Longitudinal Data: A Generalized Estimating Equation Approach”, Biometrics, 44, 1049–1060

Testi integrativi

  • Diggle, P. J., Liang, K. Y., and Zeger, S. L. (1994), Analysis of Longitudinal Data, Oxford: Clarendon Press
  • Hardin, J. W. and Hilbe, J. M. (2003), Generalized Estimating Equations, Boca Raton, FL: Chapman & Hall/CRC
  • Liang, K. Y. and Zeger, S. L. (1986), “Longitudinal Data Analysis Using Generalized Linear Models,” Biometrika, 73, 13–22
  • McCullagh, P. and Nelder, J. A. (1989), Generalized Linear Models, Second Edition, London: Chapman & Hall
  • Nelder, J. A. and Wedderburn, R. W. M. (1972), “Generalized Linear Models”, Journal of the Royal Statistical Society, Series A, 135, 370–384
  • Searle, S. R. (1971), Linear Models, New York: John Wiley & Sons

b. Modello lineare generalizzato

Testi di riferimento

– Lucidi presentati nel corso disponibili dopo le lezioni sul sito del docente:

–  http://www.statistica.unimib.it/utenti/vittadini/DIDATTICA/DIDATTICA.html

–  Materiale prodotto in laboratorio statistico-informatico durante le esercitazioni (codici SAS e output delle analisi):

–  http://www.statistica.unimib.it/utenti/solaro/

Testi integrativi

Per l’argomento: Modello lineare in presenza di eteroschedasticità e/o di errori correlati: metodo dei minimi quadrati generalizzati. Modello lineare multivariato. Modello SURE

  • Baltagi B. H. (2008), Econometrics, fourth Edition, Springer Berlin (Part I capitoli 1-5; Part II capitoli 9-10-11).
  • Faliva M. (1987), Econometria. Principi e metodi, UTET, Bologna (capitoli 5, 6, 7).
  • Johnston J. (1993). Econometrica, 3a edizione, Franco Angeli, Milano (capitoli 2, 3, 5, 7, 8).
  • Srivastava V.K., Giles D.E.A. (1987). Seemingly Unrelated Regression Equations Models, Marcel Dekker, New York (In particolare, capitoli 1, 2).
  • Zellner A. (1962), An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias. Journal of the American Statistical Association, vol. 57, n. 298, pp. 348 – 368.
  • Manuale SAS/STAT 9.3 (capitoli 4, 41, 76).
  • Manuale SAS/ETS 9.3 (capitoli 8, 29).

Per l’argomento: Modelli multilevel

  • Goldstein H. (1999), Multilevel Statistical Models, Multilevel Models Project, Institute of Education, London (capitoli 1, 2, 3), download: http://www.ats.ucla.edu/stat/examples/msm_goldstein/goldstein.pdf
  • Snijders T.A.B., Bosker R.J. (1999), Multilevel Analysis – An introduction to basic and advanced multilevel modelling, SAGE Publications, London (capp. 1-7).
  • Manuale SAS/STAT 9.3 (capitoli 5, 6, 58).

Per l’argomento: Path Analysis, modelli ad equazioni strutturali

  • Dillon W R, Goldstein M (1984). Path Analysis. In: Dillon W R, Goldstein M, Multivariate Analysis: Methods And Applications, Wiley (capitolo 12).
  • Dillon W R, Goldstein M (1984). Latent Structure Analysis. In: Dillon W R, Goldstein M, Multivariate Analysis: Methods And Applications, Wiley (cap.13).
  • Duncan O.D (1966). Path Analysis: Sociological Examples. The American Journal of Sociology, Vol. 72 (1): 1:16.
  • Mueller R.O. (1996) Linear Regression And Classical Path Analysis. In: Basic Principles Of Structural Equation Modeling. Springer Verlag, 1-62 (cap. 1).
  • Manuale SAS/STAT 9.3 (capitoli 17, 26).

Per l’argomento: Analisi fattoriale

 

Comments are closed.