Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Dipartimento: [040017] Dipartimento Scienze della Vita e dell'AmbienteDepartment: [040017] Dipartimento Scienze della Vita e dell'Ambiente
Anno di corsoDegree programme year : 2 - Secondo Semestre
Anno offertaAcademic year: 2019-2020
Anno regolamentoAnno regolamento: 2018-2019
Crediti: 5
Ore di lezioneTeaching hours: 40
TipologiaType: A - Base





Conoscenza degli argomenti degli insegnamenti di Matematica e Informatica.

Knowledge of the topics of the courses on Mathematics and Informatics.


Sono previste sia lezioni teoriche (5 crediti, 40 ore) che esercitazioni pratiche di laboratorio al computer in piccoli gruppi di 2-3 studenti (1 credito, 8 ore). Al corso frontale è affiancata un’attività didattica in modalità e-learning contenente, fra l’altro: materiale didattico, test di autovalutazione, i dati per le esercitazioni sperimentali, prenotazione per le esercitazioni in aula informatica, presenze a lezione ed alle esercitazioni, risultati degli esami.

The course consists of theoretical lectures (6 credits, 48 hours) and computer laboratory pratical work carried out at small groups of 2-3 students. An e-learning didactic activity is available in parallel to the normal frontal course. It includes: the didactic material, the self-assessment tests, data and instructions for the experimental exercises, booking for the experimental exercises in the computer laboratory, attendances to lectures and laboratory exercises, results of examinations.

Conoscenze e comprensione.

L'insegnamento permette agli studenti di acquisire le basi teoriche e metodologiche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. In particolare lo studente dovrà conoscere le basi della statistica generale, i test di ipotesi, l'analisi della varianza, nonché le procedure dell'analisi dei gruppi (cluster analysis), delle componenti principali, del metodo dei prossimi più vicini, delle variabili canoniche (analisi discriminante).

Capacità di applicare conoscenze e comprensione.

Alla fine del percorso lo studente dovrà avere acquisito la capacità di effettuare le procedure informatiche richieste per l'analisi statistica dei dati utilizzando alcuni pacchetti statistici commerciali, nonché interpretare correttamente i risultati ottenuti.

Competenze trasversali.

L’esecuzione di esercitazioni sperimentali singole e di gruppo, nonché la discussione dei risultati ottenuti, contribuiscono a migliorare, sia il grado di autonomia di giudizio in generale, sia la capacità comunicativa che deriva anche dal lavoro in gruppo, sia la capacità di apprendimento in autonomia e di trarre conclusioni, dello studente.

Knowledge and Understanding.

The course enables students to acquire the theoretical and methodological fundamentals of univariate and multivariate statistical analysis as applied to the study of experimental sciences. In particular, the student should know the fundamentals of statistics, the hypothesis testing, the analysis of variance and the procedures of cluster analysis, principal component analysis, nearest neighbour rule, canonical variate analysis (discriminant analysis).

Capacity to apply Knowledge and Understanding.

At the end of the course, the student should have acquired the ability of performing the computer procedures required for data statistical analysis using commercial statistical packages, as well as to interpret correctly the results obtained.

Transversal Skills.

The execution of experimental exercises (alone or in-group), as well as the discussion of the results obtained, contribute to improve for the student the degree of judgement autonomy in general, the communicative capacity (which derives also from the teamwork), and the ability to draw conclusions from experimental data.


Contenuti (lezioni frontali, 5 CFU, 40 ore). Basi teoriche e metodologiche delle principali tecniche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. Dati e distribuzione dati. Statistiche descrittive. Distribuzione normale. Inferenza. Intervallo di fiducia. Test di ipotesi. Analisi della varianza. Regressione lineare. Dati multivariati e informazione. Analisi di dati non raggruppati: analisi dei gruppi (cluster analysis), analisi delle componenti principali. Analisi di dati raggruppati: metodo dei k prossimi più vicini (KNN), analisi delle variabili canoniche, discriminazione e classificazione. Studio di casi reali con riferimenti a problematiche ambientali, biologiche, archeologiche (paleobiologiche), chimiche. Sono previste esercitazioni sperimentali al computer per lo studio di alcuni casi reali trattati nel corso.

Esercitazioni al computer (1 CFU, 8 ore/studente). Le esercitazioni sono svolte in piccoli gruppi (2-3 studenti/computer). Pacchetti statistici utilizzati: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Es. n. 1: Istogrammi, Tabelle di frequenza, Statistiche riassuntive, Intervallo di fiducia, Test d’ipotesi. Es. n. 2: Cluster analysis I. Es. n. 3: Cluster analysis II, Metodo dei k prossimi più vicini (KNN). Es. n. 4: Analisi delle componenti principali (PCA). Es. n. 5: Analisi delle variabili canoniche (CVA) o Analisi discriminate.

Content (lectures, 5 CFU, 40 hours). Theoretical and methodological fundamentals of the main techniques of univariate and multivariate statistical analysis as applied to the study of experimental sciences. Data and data distribution. Descriptive statistics. Normal distribution. Inference. Confidence interval. Hypothesis testing. Analysis of variance. Linear regression. Multivariate data and information. Ungrouped data analysis: cluster analysis, principal component analysis (PCA). Grouped data analysis: k nearest neighbour rule (KNN), canonical variate analysis (CVA), discrimination and classification. Examples of case studies referred to environmental, biological, archaeological (paleobiological) and chemical problems. Computer laboratory activity for the study of a few real cases considered during the course.

Laboratory exercises (1 CFU, 8 hours/student). Computer exercises are carried out in small groups (2-3 students/computer). Used statistical packages are the following: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Exercise n. 1: Histograms, Frequency tables, Summary statistics, Confidence interval, Hypothesis testing. Ex. n. 2: Cluster analysis I. Ex. n. 3: Cluster analysis II, Method of k nearest neighbour rule (KNN). Ex. n. 4: Principal component analysis (PCA). Ex. n. 5: Canonical variate analysis (CVA) (or Discriminant analysis).

Modalità di valutazione dell'apprendimento.

L’esame consiste in un compito scritto (30 domande aperte) e successiva revisione degli elaborati. Il compito scritto è suddiviso in due parti: statistica univariata e statistica multivariata. Le due parti sono valutate separatamente in trentesimi e il risultato di una parte può essere mediato con l’altro solo se maggiore o uguale a 15. Ad ogni risposta viene attribuito un punteggio compreso tra zero (risposta errata o non risposta) ed uno. Al risultato di ciascun parziale vengono aggiunti due punti. Un ulteriore punto è assegnato a chi ha partecipato a tutte le esercitazioni. Per il voto finale viene valutata anche la relazione sui casi-studio (se prodotta) cui vengono assegnati fino ad un massimo di due punti. L’esame si intende superato quando il voto finale è maggiore o uguale a 18. Durante il corso sono previste prove in itinere (1° e 2° parziale). Il recupero/miglioramento di singoli parziali è possibile entro le prime due sessioni successive a fine corso

Criteri di valutazione dell'apprendimento.

Nella prova scritta lo studente dovrà dimostrare di conoscere principi e metodi dell’analisi statistica univariata (distribuzioni, inferenza, test d’ipotesi) e multivariata (cluster analysis, analisi delle componenti principali, metodo dei k prossimi più vicini, analisi delle variabili canoniche). Nelle domande sono inclusi esercizi su test d’ipotesi (nella prima parte) e sull’interpretazione dei risultati dell’analisi multivariata su un esempio pratico (seconda parte). La capacità di applicare le conoscenze acquisite viene valutata anche attraverso le risposte scritte relative agli esercizi sui test d’ipotesi e alle domande sul caso di studio presentato nella parte “pratica” dell’esame scritto.

Criteri di misurazione dell'apprendimento.

Il voto finale è attribuito in trentesimi. L’esame si intende superato quando il voto è maggiore o uguale a 18. È prevista l’assegnazione del massimo dei voti con lode (30 e lode).

Criteri di attribuzione del voto finale.

Il voto finale viene attribuito sulla base del compito scritto (e sulla sua revisione/discussione pubblica), cioè somma dei punteggi ottenuti sulle trenta domande a cui vengono aggiunti due punti. La lode viene attribuita quando il punteggio ottenuto dalla precedente somma superi il valore 30 e contemporaneamente lo studente abbia dimostrato piena padronanza della materia.

Learning Evaluation Methods.

The assessment method is a written classwork (30 open questions) and subsequent revision of the script. The written classwork is subdivided into two parts: univariate and multivariate statistics. The two parts are evaluated separately in thirties and the result of a part can be mediated with the other only if it is higher or equal to 15. To each question a score is assigned, included between zero (wrong answer or no answer) and one. To the sum obtained other two points are added. An additional point is assigned to students who participated in all the laboratory exercises. The case-study report is also evaluated, assigning to it up to two points. The exam is passed when the final score is higher or equal to 18. During the course, it is also foregone “in itinere” written classwork (1st and 2nd partial tests). The recovery/improvement of single partial tests is possible within the first two sessions following the end of the course.

Learning Evaluation Criteria.

In the written classwork, the student will have to demonstrate to have acquired a sound knowledge of basics and methods of the univariate statistics (data distributions, inference, hypothesis testing) and multivariate statistics (cluster analysis, principal component analysis, k nearest neighbour rule, canonical variate analysis). The questions include exercises on hypothesis tests (into the first part) and on the interpretation of results of the multivariate statistical analysis of a practical example (into the second part).The capacity to apply the acquired knowledge is assessed also through the written answers to the questions related to the exercises on the hypothesis tests and on the case study presented in the “practical” part of the written classwork.

Learning Measurement Criteria.

The final mark is attributed in thirtieths. Successful completion of the examination will lead to grades ranging from 18 to 30, and 30 with laud.

Final Mark Allocation Criteria.

The final mark is attributed by summing the scores obtained on the 30 questions of the written classwork (after its public revision/discussion) and adding two points to the sum. The laud is attributed when the score obtained by the previous sum exceeds the value 30 and contemporaneously the student demonstrates complete mastery of the matter.


- Appunti di lezione
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari, 1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli, Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective, Seconda ediz., Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Seconda ediz., Springer-Verlag, New York, 2002.

- Lecture notes
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari, 1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli, Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective, Second edition, Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Second edition, Springer-Verlag, New York, 2002.


Technology enhanced

Technology enhanced

