Guida degli insegnamenti

Syllabus

Partially translatedTradotto parzialmente
[3S244] - STATISTICA PER LE SCIENZE SPERIMENTALISTATISTICS FOR EXPERIMENTAL SCIENCES [Cognomi A-L]
Giuseppe SCARPONI
Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Laurea - [ST01] SCIENZE BIOLOGICHE First Cycle Degree (3 years) - [ST01] BIOLOGICAL SCIENCES
Dipartimento: [040017] Dipartimento Scienze della Vita e dell'AmbienteDepartment: [040017] Dipartimento Scienze della Vita e dell'Ambiente
Anno di corsoDegree programme year : 2 - Primo Semestre
Anno offertaAcademic year: 2018-2019
Anno regolamentoAnno regolamento: 2017-2018
Obbligatorio
Crediti: 7
Ore di lezioneTeaching hours: 56
TipologiaType: C - Affine/Integrativa
Settore disciplinareAcademic discipline: SECS-S/02 - STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

LINGUA INSEGNAMENTO LANGUAGE

ITALIANO

Italian


PREREQUISITI PREREQUISITES

Conoscenza degli argomenti degli insegnamenti di Matematica e Informatica

Knowledge of the topics of the courses on Mathematics and Informatics.


MODALITÀ DI SVOLGIMENTO DEL CORSO DEVELOPMENT OF THE COURSE

Sono previste sia lezioni teoriche (6 crediti, 48 ore) che esercitazioni pratiche di laboratorio al computer in piccoli gruppi di 2-3 studenti (1 credito, 8 ore). Le lezioni sono tenute con l’ausilio di slide (disponibili agli studenti) e con spiegazioni di dettaglio svolte alla lavagna. Al corso frontale è affiancata un’attività didattica in modalità e-learning contenente, fra l’altro: materiale didattico, test di autovalutazione, i dati per le esercitazioni sperimentali, prenotazione per le esercitazioni in aula informatica, area riservata all'inserimento delle relazioni su casi di studio presentati durante le esercitazioni, presenze a lezione ed alle esercitazioni, risultati degli esami. Il materiale didattico offerto, integrato da appunti di lezione, è sufficiente per la preparazione e il superamento dell’esame. I testi citati, di consultazione, sono rivolti ad eventuale ampliamento e approfondimento delle conoscenze personali.

L’insegnamento, non essendo rivolto a statistici, è di tipo propedeutico e di livello introduttivo/base. La teoria della probabilità non è fra gli scopi del corso e la probabilità è presentata sulla base della definizione classica elementare di Laplace. Approfondimenti su derivazioni e dimostrazioni matematiche sono offerti nel materiale didattico e, in alcuni casi (a giudizio del docente), presentati a lezione, ma non sono richiesti per il superamento dell’esame.

Collegamento al corso e-learning:
https://learn.univpm.it/course/view.php?id=6340.

The course consists of theoretical lectures (6 credits, 48 hours) and computer laboratory practical work carried out at small groups of 2-3 students (1 credit, 8 hours). Lectures are given with the aid of slides (available to students) and with explanations of details on the blackboard. An e-learning didactic activity is available in parallel to the normal frontal course. It includes: the didactic material, the self-assessment tests, data and instructions for the experimental exercises, booking for the experimental exercises in the computer laboratory, a section for the upload of laboratory reports from the students on case-studies presented during the experimental exercises, attendances to lectures and laboratory exercises, results of examinations. The offered didactic material, integrated with lecture notes, is sufficient for the preparation and to pass the exam. The quoted textbooks, reported for consultation, are aimed to possible extension and deepening of personal knowledge.

The course, not being aimed at statisticians, is of a propaedeutic and introductory/basic level. The theory of probability is out of the scopes of this course and probability is presented on the basis of classical elementary definition of Laplace. Insights on derivations and mathematical proofs are offered in the teaching material and, in a few cases (in the teacher’s opinion), they are presented in class, but they are not required to pass the exam.

E-learning: https://learn.univpm.it/course/view.php?id=6340.


RISULTATI DI APPRENDIMENTO ATTESI LEARNING OUTCOMES
Conoscenze e comprensione.

L'insegnamento permette agli studenti di acquisire le basi teoriche e metodologiche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. In particolare lo studente dovrà conoscere le basi della statistica generale, i test di ipotesi, l'analisi della varianza, nonché le procedure dell'analisi dei gruppi (cluster analysis), delle componenti principali, del metodo dei prossimi più vicini, delle variabili canoniche (analisi discriminante).


Capacità di applicare conoscenze e comprensione.

Attraverso le esercitazioni di laboratorio lo studente dovrà avere acquisito la capacità di applicare le procedure informatiche richieste per l'analisi statistica dei dati utilizzando alcuni pacchetti statistici commerciali, nonché interpretare correttamente i risultati ottenuti.


Competenze trasversali.

L’esecuzione di esercitazioni sperimentali singole e di gruppo, nonché la discussione dei risultati ottenuti, contribuiscono a migliorare, sia il grado di autonomia di giudizio in generale, sia la capacità comunicativa che deriva anche dal lavoro in gruppo, sia la capacità di apprendimento in autonomia e di trarre conclusioni, dello studente.


Knowledge and Understanding.

The course enables students to acquire the theoretical and methodological fundamentals of univariate and multivariate statistical analysis as applied to the study of experimental sciences. In particular, the student should know the fundamentals of statistics, the hypothesis testing, the analysis of variance and the procedures of cluster analysis, principal component analysis, nearest neighbour rule, canonical variate analysis (discriminant analysis).


Capacity to apply Knowledge and Understanding.

Throughout the laboratory exercises, the student should have acquired the ability of applying the computer procedures required for data statistical analysis using commercial statistical packages, as well as to interpret correctly the results obtained.


Transversal Skills.

The execution of experimental exercises (alone or in-group), as well as the discussion of the results obtained, contribute to improve for the student the degree of judgement autonomy in general, the communicative capacity (which derives also from the teamwork), and the ability to draw conclusions from experimental data.



PROGRAMMA PROGRAM

Contenuti (lezioni frontali, 6 CFU, 48 ore). Basi teoriche e metodologiche delle principali tecniche dell'analisi statistica univariata e multivariata applicata allo studio delle scienze sperimentali. Dati e distribuzione dati. Statistiche descrittive. Distribuzione normale. Inferenza. Intervallo di fiducia. Test di ipotesi. Analisi della varianza. Regressione lineare. Dati multivariati e informazione. Analisi di dati non raggruppati: analisi dei gruppi (cluster analysis), analisi delle componenti principali. Analisi di dati raggruppati: metodo dei k prossimi più vicini (KNN), analisi delle variabili canoniche, discriminazione e classificazione. Studio di casi reali con riferimenti a problematiche biologiche, archeologiche (paleobiologiche), chimiche. Sono previste esercitazioni sperimentali al computer per lo studio di alcuni casi reali trattati nel corso, nonché per l’elaborazione dei dati di casi-studio sui quali gli studenti possono (a scelta) produrre una relazione scritta.

Esercitazioni al computer (1 CFU, 8 ore/studente). Le esercitazioni sono svolte in piccoli gruppi (2-3 studenti/computer). Pacchetti statistici utilizzati: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Es. n. 1: Istogrammi, Tabelle di frequenza, Statistiche riassuntive, Intervallo di fiducia, Test d’ipotesi. Es. n. 2: Cluster analysis I. Es. n. 3: Cluster analysis II, Metodo dei k prossimi più vicini (KNN). Es. n. 4: Analisi delle componenti principali (PCA). Es. n. 5: Analisi delle variabili canoniche (CVA) o Analisi discriminate; presentazione di uno o più casi-studio.

Content (lectures, 6 CFU, 48 hours). Theoretical and methodological fundamentals of the main techniques of univariate and multivariate statistical analysis as applied to the study of experimental sciences. Data and data distribution. Descriptive statistics. Normal distribution. Inference. Confidence interval. Hypothesis testing. Analysis of variance. Linear regression. Multivariate data and information. Ungrouped data analysis: cluster analysis, principal component analysis (PCA). Grouped data analysis: k nearest neighbour rule (KNN), canonical variate analysis (CVA), discrimination and classification. Examples of case studies referred to biological, archaeological (paleobiological) and chemical problems. Computer laboratory activity for the study of a few real cases considered during the course.

Laboratory exercises (1 CFU, 8 hours/student). Computer exercises are carried out in small groups (2-3 students/computer). Used statistical packages are the following: Unistat, SIMCA, S-Plus, Parvus, Statgraphics. Exercise n. 1: Histograms, Frequency tables, Summary statistics, Confidence interval, Hypothesis testing. Ex. n. 2: Cluster analysis I. Ex. n. 3: Cluster analysis II, Method of k nearest neighbour rule (KNN). Ex. n. 4: Principal component analysis (PCA). Ex. n. 5: Canonical variate analysis (CVA) (or Discriminant analysis), presentation of one or more case-studies.


MODALITÀ DI SVOLGIMENTO DELL'ESAME DEVELOPMENT OF THE EXAMINATION
Modalità di valutazione dell'apprendimento.

L’esame consiste in un compito scritto e successiva revisione degli elaborati. Sono previste 30 domande aperte, inclusi esercizi su test d’ipotesi e l’interpretazione dei risultati dell’analisi multivariata di un caso di studio. Ad ogni risposta viene attribuito un punteggio compreso tra zero (risposta errata o non risposta) ed uno. Alla somma dei punteggi ottenuti sulle singole domande, vengono aggiunti ulteriori due punti. Per il voto finale viene valutata anche la relazione sui casi-studio (se prodotta) cui vengono assegnati fino ad un massimo di due punti. Un ulteriore punto è assegnato a chi ha partecipato a tutte le esercitazioni. L’esame si intende superato quando il voto finale è maggiore o uguale a 18. Durante il corso sono previste prove in itinere (1° e 2° parziale). Il risultato di un parziale può essere mediato con l’altro solo se maggiore o uguale a 15. Il recupero/miglioramento di singoli parziali è possibile entro le prime due sessioni successive a fine corso.


Criteri di valutazione dell'apprendimento.

Nella prova scritta lo studente dovrà dimostrare di conoscere principi e metodi dell’analisi statistica univariata (distribuzioni, inferenza, test d’ipotesi) e multivariata (cluster analysis, analisi delle componenti principali, metodo dei k prossimi più vicini, analisi delle variabili canoniche). La capacità di applicare le conoscenze acquisite viene valutata anche attraverso le risposte scritte relative agli esercizi sui test d’ipotesi e alle domande sul caso di studio presentato nella parte “pratica” dell’esame scritto.


Criteri di misurazione dell'apprendimento.

Il voto finale è attribuito in trentesimi. L’esame si intende superato quando il voto è maggiore o uguale a 18. È prevista l’assegnazione del massimo dei voti con lode (30 e lode).


Criteri di attribuzione del voto finale.

Il voto finale viene attribuito sulla base del compito scritto (e sulla sua revisione/discussione pubblica), cioè somma dei punteggi ottenuti sulle trenta domande più due punti, a cui vengono aggiunti, un punto per la presenza a tutte le esercitazioni, e fino a due punti in base alla valutazione della relazione sui casi-studio. La lode viene attribuita quando il punteggio ottenuto dalla precedente somma superi il valore 30 e contemporaneamente lo studente abbia dimostrato piena padronanza della materia.


Learning Evaluation Methods.

The assessment method is a written classwork (open questions) and subsequent revision of the script. Thirty open questions are provided, which include exercises on hypothesis tests and the interpretation of results obtained from the analysis of a case study. To each question a score is assigned, included between zero (wrong answer or no answer) and one. To the sum obtained other two points are added. The case-study report is also evaluated, assigning up to two points. Finally, an additional point is assigned to students who participated in all the laboratory exercises. The exam is passed when the final score is higher or equal to 18. During the course, it is also foregone “in itinere” written classwork (1st and 2nd partial test). The result of a partial test may be mediated with the other provided the obtained score be at least 15. In case of negative or unsatisfactory result in one of the two partial tests, it can be retrieved in the immediately following two sessions.


Learning Evaluation Criteria.

In the written classwork, the student will have to demonstrate to have acquired a sound knowledge of basics and methods of the univariate statistics (data distributions, inference, hypothesis testing) and multivariate statistics (cluster analysis, principal component analysis, k nearest neighbour rule, canonical variate analysis). The capacity to apply the acquired knowledge is assessed also through the written answers to the questions related to the exercises on the hypothesis tests and on the case study presented in the “practical” part of the written classwork.


Learning Measurement Criteria.

The final mark is attributed in thirtieths. Successful completion of the examination will lead to grades ranging from 18 to 30, and 30 with laud.


Final Mark Allocation Criteria.

The final mark is attributed by summing the scores obtained on the 30 questions of the written classwork (after its public revision/discussion), plus two points, and adding to the sum one point for the participation in all the laboratory exercises and up to two points for the case-study report. The laud is attributed when the score obtained by the previous sum exceeds the value 30 and contemporaneously the student demonstrates complete mastery of the matter.



TESTI CONSIGLIATI RECOMMENDED READING

- Appunti di lezione
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari,
1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli,
Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics
in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice
Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective,
Seconda ediz., Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Seconda ediz., Springer-
Verlag, New York, 2002.

- Lecture notes
- O. Vitali. Statistica per le Scienze Applicate. Vol. 2. Cacucci Editore, Bari,
1993.
- O. Vitali. Principi di Statistica. Cacucci Editore, Bari, 2003.
- M.C. Whitlock, D. Schluter. Analisi statistica dei dati biologici. Zanichelli,
Bologna, 2010.
- W.W. Daniel. Biostatistica. Edises, Napoli, 1996.
- R.R. Sokal, F.J. Rohlf. Biometry. The Principles and Practice of Statistics
in Biological Research, W.H. Freeman, San Francisco, 1995.
- G. Norman, D. Steiner. Biostatistica. Seconda ediz., Casa Editrice
Ambrosiana, Milano, 2015.
- W.J. Krzanowski. Principles of Multivariate Analysis. A User’s Perspective,
Seconda ediz., Oxford University Press, 2000.
- I.T. Jolliffe. Principal Component Analysis, Seconda ediz., Springer-
Verlag, New York, 2002.


E-LEARNING E-LEARNING

Si
Technology enhanced:
https://learn.univpm.it/course/view.php?id=6340.

Yes
Technology enhanced:
https://learn.univpm.it/course/view.php?id=6340.


Scheda insegnamento erogato nell’A.A. 2018-2019
Le informazioni contenute nella presente scheda assumono carattere definitivo solo a partire dall'A.A. di effettiva erogazione dell'insegnamento.
Academic year 2018-2019

 


Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427