Analisi Statistica Multivariata

Docente: Prof. V. Simoncini

6 Crediti:

4 Frontali = 32 ore
2 Laboratorio = 30 ore

Tipo di Corso: Laurea Magistrale in Scienze per l'Ambiente. I anno. II semestre.


Finalita' del corso:

Il corso si propone di sviluppare alcuni concetti di base dell'Analisi Statistica Multivariata.

Prerequisiti:

Concetti fondamentali di Analisi Matematica (funzioni in una o piu' variabili), Calcolo vettoriale. Tali requisiti sono acquisibili, per es., nei corsi di Istituzioni di Matematica I e II del Corso di Laurea triennale in Scienze Ambienti, Universita' di Bologna. Elementi di base di statistica (scarto quadratico, varianza, Distribuzione normale, Test di ipotesi, ecc.). Tali requisiti sono acquisibili, per es., nel corso di "Fondamenti di Statistica", della Laurea Triennale sopra citata.

Programma dettagliato (pdf)

Survey informativa sul corso QUI


Progetti di Laboratorio e Prova finale. (aggiornato al xx/xx/xx). Risultati



a.a. 2012/2013. Progetto 1. Consegna 6/06/13 ore 09.00
Gruppo I . Amaini-Lorenzetti
Gruppo II . Baioli-Caruso
Gruppo III . Cirillo-Coppola
Gruppo IV . Falcioni-Fantini
Gruppo V . Righetti-Rondini
Gruppo VI . De Cesari
Gruppo VII . Marchi-Pogrebnyakova
Gruppo VIII . Sartini-Sodano

Ricevimento :

Previo appuntamento.

Appelli :



Lucidi delle lezioni:


MPS.pdf . (prima parte)

Funzioni Matlab utili per il laboratorio:

per dissimilarita' ( dissim.m ) ,
per clustering ( clustering.m ),
per clustering da Distanza ( clusterDist.m ),
per Multidim.Scaling ( MDscaling1.m ),
per test qqplot ( qqplot1.m ) ,
per test chi2 univariata ( testchi2.m ) ,
per test chi2 bivariata ( testnorm2v.m ) ,
per test di D'Agostino-Pearson di normalita' univariata ( DagosPtest.m ) (adatto nel caso di molti valori ripetuti) ,
per test su distanza di Mahalanobis con numerazione delle osservazione( chi2plotnew.m ) ,
per ellisse ( ellisse.m ) , per ellisse1 ( ellisse1.m ) ,
per test di Royston normalita' multivariata ( roystest.m ) ,
per calcolo di intervalli simultanei (richiede la funzione intervs1.m) ( simult.m ) ,
per plot di intervalli simultanei (2D) ( intervs1.m ) ,
Lambda di Wilks ( Wilks.m ) ,
Discriminanza ( discr.m ) ,
Discriminanza NEW ( discrnew.m ) ,
Discriminanza di Fisher per p>2 ( Fisher_discriminants.m ) ,
Regressione Lineare ( regre2.m ) , (NEW: regre2new.m )
Comp. Principali ( pca.m ) .
Comp. Principali per riduzione di immagini ( pca_image.m ) .
Test di Indipendenza ( test_equality.m ) ,
Analisi Fattoriale ( factorPCA.m , factorMV.m ) .

Dati per Laboratorio:

04/04/2013. Comandi Elementari di matlab.
17/4/2013. Testo . Dati muschi .
24/4/2013. Testo . Dati citta' distanzecitta.txt
02/5/2013. Testo . Tabella: Soglie per la regione critica del QQ plot, test normalita' 1D .
07/5/2013. Testo .
22/5/2013. Testo .


Testi:

"Applied Multivariate Statistical Analysis", R. Johnson e D. Wichern, Prentice-Hall, (V ed.) 2002.
e
"Multivariate Analysis", K.V. Mardia, J.T. Kent e J.M.Bibby, Academic Press, Stampa del 1997.
(Entrambi i testi sono disponibili in biblioteca di Scienze Ambientali, Ravenna)

Durante il corso verranno distribuiti lucidi ed altre dispense.

Testi di consultazione:

  1. "Appunti di base per Matlab"
  2. "An Introduction to Matlab 6.1" , August 2001 (PDF format: 1500K, 35pp) by David F Griffiths with additional material by Ulf Carlsson, Department of Vehicle Engineeering, KTH, Stockholm. Material updated for Matlab version 6.1. (cf. also Webpage)
  3. "Cluster Analysis Algorithms", H.Sp\"ath, Elis Horwood Publishers (1980)
  4. "The Foundations of Multivariate Analysis", K. Takeychi, H.Yanai, B.N. Mukherjee, Publ. Wiley Eastern Limited (1982)
  5. "Metodi di Analisi Statistica Multivariata", D.F. Morrison, Casa Editrice Ambrosiana (1976)
  6. Tabelle per il test di Durbin-Watson
  7. articolo per l'uso del test di normalita' di D'Agostino

Valutazione

La valutazione finale consiste di due parti:
  1. Durante il corso, gli studenti sono tenuti a consegnare (per iscritto) i risultati di 2 progetti (gruppi max 2 persone) di analisi dei dati con le tecniche studiate.
  2. Prova pratica/scritta finale (in Laboratorio Informatico, con "libri aperti").



Prove scritte passate:

Prototipo di prova scritta.
Prova scritta del 24 Marzo 2003. Dati Compito: Esercizio 1: FERRARI.DAT Esercizio 2: OSSIDO.DAT
Prova scritta del 15 Marzo 2004. Dati Compito: Esercizio 1: METEO.DAT Esercizio 2: GENI.DAT
Prova scritta del 2 Aprile 2004. Dati Compito: Esercizio 1: CRIME.DAT Esercizio 2: FLEABEETLES.DAT
Prova scritta del 6 Luglio 2004. Dati Compito: Esercizio 1: PRECAPITA.DAT Esercizio 2: POTTERY.DAT
Prova scritta del 16 Marzo 2005. Mattino Dati Compito: Esercizio 1: FISH_F
Prova scritta del 16 Marzo 2005. Pomeriggio Dati Compito: Esercizio 1: FISH_M
Prova scritta del 9 Marzo 2006. Dati Compito: Esercizio 1: OSSIDO.DAT
Prova scritta del 23 Marzo 2006 ore 9.00 Dati Compito: Esercizio 1: t8-6-x.dat Esercizio 2: IRIS1 , IRIS2 ,
Prova scritta del 23 Marzo 2006 ore 14.00 Dati Compito: Esercizio 2: IRIS3 , IRIS4 ,
Prova scritta del 22 Settembre 2006. Dati Compito: Esercizio 1: NO2 ,
Prova scritta del 12 Marzo 2007. Dati Compito: Esercizio 1: IRIS_SHAPE , Esercizio 2: GAS.DAT ,
Prova scritta del 12 Giugno 2008 ore 13.00 Dati Compito: Esercizio 1: t1-9-x.dat Esercizio 2: T6-15.DAT ,
Prova scritta del 27 Giugno 2008. Dati Compito: Esercizio 1: FISH_F Esercizio 2: T1-5.DAT ,
Prova scritta del 11 Luglio 2008. Dati Compito: Esercizio 1: FISH_M Esercizio 2: monossido
Prova scritta del 08 Luglio 2009. mattino
Prova scritta del 08 Luglio 2009. pomeriggio
Prova scritta del 27 Luglio 2009. Dati : FISH_F
Prova scritta del 2 Luglio 2010 ore 8.30. Dati Compito: Esercizio 1: T9-12.DAT Esercizio 2: IRIS1 , IRIS2 ,
Prova scritta del 2 Luglio 2010 ore 13.30. Dati Compito: Esercizio 2: IRIS3 , IRIS4
Prova scritta del 23 Giugno 2011. Dati Compito: Esercizio 1: IRIS_SHAPE
Prova scritta del 29 Giugno 2012.
Prova scritta del 19 Luglio 2012. Dati Compito: Esercizio 1: cicale.txt
Prova scritta del 6 Novembre 2012. Dati Compito: Esercizio 1: OSSIDO.DAT , Esercizio 2: IRIS_SHAPE

Dati:

Tabelle JW
DASL and More Data

Links Utili:

USA Geographic Census
Data for space analysis