Guida degli insegnamenti

Syllabus

Partially translatedTradotto parzialmente
[3S244] - STATISTICA PER LE SCIENZE SPERIMENTALISTATISTICS FOR EXPERIMENTAL SCIENCES
Giuseppe SCARPONI
Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Laurea - [ST03] SCIENZE AMBIENTALI E PROTEZIONE CIVILE First Cycle Degree (3 years) - [ST03] ENVIRONMENTAL SCIENCES AND CIVIL PROTECTION
Dipartimento: [040017] Dipartimento Scienze della Vita e dell'AmbienteDepartment: [040017] Dipartimento Scienze della Vita e dell'Ambiente
Anno di corsoDegree programme year : 2 - Secondo Semestre
Anno offertaAcademic year: 2020-2021
Anno regolamentoAnno regolamento: 2019-2020
Obbligatorio
Crediti: 6
Ore di lezioneTeaching hours: 48
TipologiaType: A - Base
Settore disciplinareAcademic discipline: SECS-S/01 - STATISTICA

LINGUA INSEGNAMENTO LANGUAGE

ITALIANO

Italian


PREREQUISITI PREREQUISITES

Conoscenza degli argomenti degli insegnamenti di Matematica e Informatica.

Knowledge of the topics of the courses on Mathematics and Informatics.


MODALITÀ DI SVOLGIMENTO DEL CORSO DEVELOPMENT OF THE COURSE

Sono previste sia lezioni teoriche (5 crediti, 40 ore) che esercitazioni pratiche di laboratorio al computer in piccoli gruppi di 2-3 studenti (1 credito, 8 ore). Le lezioni sono tenute con l’ausilio di slide (disponibili agli studenti) e con spiegazioni di dettaglio svolte alla lavagna. Al corso frontale è affiancata un’attività didattica in modalità e-learning contenente, fra l’altro: materiale didattico, test di autovalutazione, i dati per le esercitazioni sperimentali, prenotazione per le esercitazioni in aula informatica, area riservata all’inserimento delle relazioni su casi di studio presentati durante le esercitazioni, presenze a lezione ed alle esercitazioni, risultati degli esami. Il materiale didattico offerto, integrato da appunti di lezione, è sufficiente per la preparazione e il superamento dell’esame. I testi citati, di consultazione, sono rivolti ad eventuale ampliamento e approfondimento delle conoscenze personali.

L’insegnamento, non essendo rivolto a statistici, è di tipo propedeutico e di livello introduttivo/base. La teoria della probabilità non è fra gli scopi del corso e la probabilità è presentata sulla base della definizione classica elementare di Laplace. Approfondimenti su derivazioni e dimostrazioni matematiche sono offerti nel materiale didattico e, in alcuni casi (a giudizio del docente), presentati a lezione, ma non sono richiesti per il superamento dell’esame.

The course consists of theoretical lectures (5 credits, 40 hours) and computer laboratory practical work carried out at small groups of 2-3 students (1 credit, 8 hours). Lectures are given with the aid of slides (available to students) and with explanations of details on the blackboard. An e-learning didactic activity is available in parallel to the normal frontal course. It includes: the didactic material, the self-assessment tests, data and instructions for the experimental exercises, booking for the experimental exercises in the computer laboratory, a section for the upload of laboratory reports from the students on case-studies presented during the experimental exercises, attendances to lectures and laboratory exercises, results of examinations. The offered didactic material, integrated with lecture notes, is sufficient for the preparation and to pass the exam. The quoted textbooks, reported for consultation, are aimed to possible extension and deepening of personal knowledge.

The course, not being aimed at statisticians, is of a propaedeutic and introductory/basic level. The theory of probability is out of the scopes of this course and probability is presented on the basis of classical elementary definition of Laplace. Insights on derivations and mathematical proofs are offered in the teaching material and, in a few cases (in the teacher’s opinion), they are presented in class, but they are not required to pass the exam.


RISULTATI DI APPRENDIMENTO ATTESI LEARNING OUTCOMES
Conoscenze e comprensione.

L'insegnamento permette agli studenti di acquisire le basi teoriche e metodologiche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. In particolare lo studente dovrà conoscere le basi della statistica generale, i test di ipotesi, l'analisi della varianza, nonché le procedure dell'analisi dei gruppi (cluster analysis), delle componenti principali, del metodo dei prossimi più vicini, delle variabili canoniche (analisi discriminante).


Capacità di applicare conoscenze e comprensione.

Attraverso le esercitazioni di laboratorio lo studente dovrà avere acquisito la capacità di applicare le procedure informatiche richieste per l'analisi statistica dei dati utilizzando alcuni pacchetti statistici commerciali, nonché interpretare correttamente i risultati ottenuti.


Competenze trasversali.

L’esecuzione di esercitazioni sperimentali singole e di gruppo, nonché la discussione dei risultati ottenuti, contribuiscono a migliorare, sia il grado di autonomia di giudizio in generale, sia la capacità comunicativa che deriva anche dal lavoro in gruppo, sia la capacità di apprendimento in autonomia e di trarre conclusioni, dello studente.


Knowledge and Understanding.

The course enables students to acquire the theoretical and methodological fundamentals of univariate and multivariate statistical analysis as applied to the study of experimental sciences. In particular, the student should know the fundamentals of statistics, the hypothesis testing, the analysis of variance and the procedures of cluster analysis, principal component analysis, nearest neighbour rule, canonical variate analysis (discriminant analysis).


Capacity to apply Knowledge and Understanding.

Throughout the laboratory exercises, the student should have acquired the ability of applying the computer procedures required for data statistical analysis using commercial statistical packages, as well as to interpret correctly the results obtained.


Transversal Skills.

The execution of experimental exercises (alone or in-group), as well as the discussion of the results obtained, contribute to improve for the student the degree of judgement autonomy in general, the communicative capacity (which derives also from the teamwork), and the ability to draw conclusions from experimental data.



PROGRAMMA PROGRAM

Contenuti (lezioni frontali, 5 CFU, 40 ore). Basi teoriche e metodologiche delle principali tecniche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. Dati e distribuzione dati. Statistiche descrittive. Distribuzione normale. Inferenza. Intervallo di fiducia. Test di ipotesi. Analisi della varianza. Regressione lineare. Dati multivariati e informazione. Analisi di dati non raggruppati: analisi dei gruppi (cluster analysis), analisi delle componenti principali. Analisi di dati raggruppati: metodo dei k prossimi più vicini (KNN), analisi delle variabili canoniche, discriminazione e classificazione. Studio di casi reali con riferimenti a problematiche ambientali, biologiche, archeologiche (paleobiologiche), chimiche. Sono previste esercitazioni sperimentali al computer per lo studio di alcuni casi reali trattati nel corso, nonché per l’elaborazione dei dati di casi-studio sui quali gli studenti possono (a scelta) produrre una relazione scritta.

Esercitazioni al computer (1CFU 8 ore/studente). Le esercitazioni sono svolte in piccoli gruppi (2-3 studenti/computer). Pacchetti statistici utilizzati: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Es. n. 1: Istogrammi, Tabelle di frequenza, Statistiche riassuntive, Intervallo di fiducia, Test d’ipotesi. Es. n. 2: Cluster analysis I. Es. n. 3: Cluster analysis II, Metodo dei k prossimi più vicini (KNN). Es. n. 4: Analisi delle componenti principali (PCA). Es. n. 5: Analisi delle variabili canoniche (CVA) o Analisi discriminate; presentazione di uno o più casi-studio.

Content (lectures, 5 CFU, 40 hours). Theoretical and methodological fundamentals of the main techniques of univariate and multivariate statistical analysis as applied to the study of experimental sciences. Data and data distribution. Descriptive statistics. Normal distribution. Inference. Confidence interval. Hypothesis testing. Analysis of variance. Linear regression. Multivariate data and information. Ungrouped data analysis: cluster analysis, principal component analysis (PCA). Grouped data analysis: k nearest neighbour rule (KNN), canonical variate analysis (CVA), discrimination and classification. Examples of case studies referred to environmental, biological, archaeological (paleobiological) and chemical problems. Computer laboratory activity for the study of a few real cases considered during the course.

Laboratory exercises (1 CFU, 8 hours/student). Computer exercises are carried out in small groups (2-3 students/computer). Used statistical packages are the following: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Exercise n. 1: Histograms, Frequency tables, Summary statistics, Confidence interval, Hypothesis testing. Ex. n. 2: Cluster analysis I. Ex. n. 3: Cluster analysis II, Method of k nearest neighbour rule (KNN). Ex. n. 4: Principal component analysis (PCA). Ex. n. 5: Canonical variate analysis (CVA) (or Discriminant analysis), presentation of one or more case-studies.


MODALITÀ DI SVOLGIMENTO DELL'ESAME DEVELOPMENT OF THE EXAMINATION
Modalità di valutazione dell'apprendimento.

L’esame consiste in un compito scritto (30 domande aperte) e successiva revisione degli elaborati. Il compito scritto è suddiviso in due parti: statistica univariata e statistica multivariata. Le due parti sono valutate separatamente in trentesimi e il risultato di una parte può essere mediato con l’altro solo se maggiore o uguale a 15. Ad ogni risposta viene attribuito un punteggio compreso tra zero (risposta errata o non risposta) ed uno. Al risultato di ciascun parziale vengono aggiunti due punti. Un ulteriore punto è assegnato a chi ha partecipato a tutte le esercitazioni. Per il voto finale viene valutata anche la relazione sui casi-studio (se prodotta) cui vengono assegnati fino ad un massimo di due punti. L’esame si intende superato quando il voto finale è maggiore o uguale a 18. Durante il corso sono previste prove in itinere (1° e 2° parziale). Il recupero/miglioramento di singoli parziali è possibile entro le prime due sessioni successive a fine corso.


Criteri di valutazione dell'apprendimento.

Nella prova scritta lo studente dovrà dimostrare di conoscere principi e metodi dell’analisi statistica univariata (distribuzioni, inferenza, test d’ipotesi) e multivariata (cluster analysis, analisi delle componenti principali, metodo dei k prossimi più vicini, analisi delle variabili canoniche). Nelle domande sono inclusi esercizi su test d’ipotesi (nella prima parte) e sull’interpretazione dei risultati dell’analisi multivariata su un esempio pratico (seconda parte). La capacità di applicare le conoscenze acquisite viene valutata anche attraverso le risposte scritte relative agli esercizi sui test d’ipotesi e alle domande sul caso di studio presentato nell'esempio pratico dell’esame scritto.


Criteri di misurazione dell'apprendimento.

Il voto finale è attribuito in trentesimi. L’esame si intende superato quando il voto è maggiore o uguale a 18. È prevista l’assegnazione del massimo dei voti con lode (30 e lode).


Criteri di attribuzione del voto finale.

Il voto finale viene attribuito sulla base del compito scritto (e sulla sua revisione/discussione pubblica), cioè come media dei punteggi ottenuti nelle due parti, a cui vengono aggiunti, un punto per la presenza a tutte le esercitazioni, e fino a due punti in base alla valutazione della relazione sui casi-studio. La lode viene attribuita quando il punteggio ottenuto dalla precedente procedura di valutazione superi il valore 30 e contemporaneamente lo studente abbia dimostrato piena padronanza della materia.


Learning Evaluation Methods.

The assessment method is a written classwork (30 open questions) and subsequent revision of the script. The written classwork is subdivided into two parts: univariate and multivariate statistics. The two parts are evaluated separately in thirties and the result of a part can be mediated with the other only if it is higher or equal to 15. To each question a score is assigned, included between zero (wrong answer or no answer) and one. To the sum obtained other two points are added. An additional point is assigned to students who participated in all the laboratory exercises. The case-study report is also evaluated, assigning to it up to two points. The exam is passed when the final score is higher or equal to 18. During the course, it is also foregone “in itinere” written classwork (1st and 2nd partial tests). The recovery/improvement of single partial tests is possible within the first two sessions following the end of the course.


Learning Evaluation Criteria.

In the written classwork, the student will have to demonstrate to have acquired a sound knowledge of basics and methods of the univariate statistics (data distributions, inference, hypothesis testing) and multivariate statistics (cluster analysis, principal component analysis, k nearest neighbour rule, canonical variate analysis). The questions include exercises on hypothesis tests (into the first part) and on the interpretation of results of the multivariate statistical analysis of a practical example (into the second part).The capacity to apply the acquired knowledge is assessed also through the written answers to the questions related to the exercises on the hypothesis tests and on the case study presented in the practical example of the written classwork.


Learning Measurement Criteria.

The final mark is attributed in thirtieths. Successful completion of the examination will lead to grades ranging from 18 to 30, and 30 with laud.


Final Mark Allocation Criteria.

The final mark is attributed by summing the scores obtained on the 30 questions of the written classwork (after its public revision/discussion), plus two points, and adding to the sum one point for the participation in all the laboratory exercises and up to two points for the case-study report. The laud is attributed when the score obtained by the previous sum exceeds the value 30 and contemporaneously the student demonstrates complete mastery of the matter.



TESTI CONSIGLIATI RECOMMENDED READING

- Appunti di lezione
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari, 1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli, Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective, Seconda ediz., Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Seconda ediz., Springer-Verlag, New York, 2002.

- Lecture notes
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari, 1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli, Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective, Second edition, Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Second edition, Springer-Verlag, New York, 2002.


E-LEARNING E-LEARNING

Si
Technology enhanced: https://learn.univpm.it/course/view.php?id=12337.

Yes
Technology enhanced:
https://learn.univpm.it/course/view.php?id=12337.


Scheda insegnamento erogato nell’A.A. 2020-2021
Le informazioni contenute nella presente scheda assumono carattere definitivo solo a partire dall'A.A. di effettiva erogazione dell'insegnamento.
Academic year 2020-2021

 


Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427