ITALIANO
Italian
Si presuppone la conoscenza della Statistica descrittiva e di concetti di base di statistica inferenziale.
Descriptive statistics, basic concepts of probability, testing hypotheses, basic concepts of statistical inference.
Il corso sarà svolto sia mediante lezioni frontali sia mediante applicazioni al computer. Verranno assegnati e discussi in aula diversi "case study".
The course is organized into lectures of two-four hours each, including in-person lectures and applications on the computer. Assignements and discussions of several case studies will be scheduled.
Il corso si propone di fare apprendere l'uso teorico ed empirico di strumenti di statistica per la valutazione di grandi moli di dati relativi a fenomeni socio-economico, finanziari e aziendali.
Al termine del corso i dicenti saranno in grado di scegliere in modo adeguato le tecniche di statistica e valutarne la loro applicabilità ai vari problemi. Saranno, inoltre, in grado di redigere programmi nel linguaggio R per effettuare le opportune applicazioni e comprendere codici in Python.
Lo sviluppo di progetti individualmente ed in gruppo con presentazione del case study e della sua soluzione consentiranno agli studenti e studentesse di migliorare la loro autonomia e la loro capacità critica e comunicativa.
The course aims to provide students with theoretical and empirical approaches to analyze big-data describing social, financial macro- and microeconomic phenomena.
At the end of the course, students will be able to adequately select and apply statistical techniques to analyze socio-economic and financial datasets in order to solve problems in economics, marketing and finance, also with the use of R code or Python.
The development of projects to solve case studies and their discussion in classroom will allow
students to improve their autonomy and critical abilities and communication skill.
1. Richiami di algebra delle matrici.
2. Introduzione all’uso del linguaggio R e Pyton.
3. Intervalli di confidenza
4. Verifica di ipotesi
5. Analisi multivariata dei dati
5.1. Analisi delle componenti principali.
5.2. Regressione multipla.
5.3 Cluster Analysis
5.4. Regressione logistica e regressione di Cox
5.5. Analisi discriminante
5.6. Introduzione alla machine learning
1. Basic concepts of linear algebra.
2. Introduction to the R programming language.
3. Confidence intervals
4. Hypothesis testing
5. Multivariate data analysis
5.1 Principal component analysis
5.2 Multiple regression.
5.3 Cluster analysis.
5.4 Logistic regression and Cox regression.
5.5 Discriminant analysis.
5.6 Introduction to machine learning
L’esame consiste in una prova scritta e una tesina in cui gli studenti devono elaborare una dataset utilizzando codici implementati in R o Python. La tesina deve includere un esempio di applicazione di Machine learning. Nel compito sono previsti
esercizi e domande brevi con l’obiettivo di verificare l'apprendimento
degli argomenti trattati e l’effettiva capacità di applicare le conoscenze
acquisite. Durante la prova scritta non è ammessa la consultazione di
alcun materiale di supporto.
Per gli di studenti con disabilità/invalidità o disturbo specifico di apprendimento (DSA), che abbiano fatto debita richiesta di supporto per affrontare lo specifico esame di profitto all’Info Point Disabilità/DSA dell’Ateneo, le modalità di esame saranno adattate alla luce di quanto previsto dalle linee guida di Ateneo (https://www.univpm.it/Entra/Accoglienza_diversamente_abili).
Nella prova scritta gli studenti dovranno dimostrare di aver acquisito una solida conoscenza dei temi svolti nelle lezioni e di saper utilizzare la corrispondente strumentazione statistica.
Il voto finale è attribuito in trentesimi. L’esame si intende superato se il
voto è pari o superiore a 18.
Il voto finale viene attribuito sulla base del compito scritto, come somma
dei punteggi ottenuti sui singoli esercizi e il voto della tesina sull’analisi dei dati (da presentare in aula). Il punteggio di ogni esercizio
viene assegnato sulla base della difficoltà dello stesso.
Il voto finale è la media tra il voto della tesina e il voto dello scritto.
The final examination consists of a written test and a short report which analyzes a dataset using R or Python codes. The empirical analysis includes an application of machine learning. The written test consists of short exercises and questions designed to assess the learning of the topics covered and the student’s actual ability to apply the knowledge acquired. Supporting materials may not be consulted during the written exam.
For students with disabilities or Specific Learning Disability (SLD) who have contacted the University Disability/SLD Info Point to request support for the specific curricular exam, please note that the way the exam is taken can be adapted in accordance with the University Guidelines (https://www.univpm.it/Entra/Accoglienza_diversamente_abili).
During the written exam, students must demonstrate solid knowledge of the topics and methods for functions of one variable. The ability to apply the acquired knowledge is evaluated by solving the assigned problems.
The exam is worth thirty points. A passing grade is 18 or above.
The final score is determined based on the written exam: the sum of the scores obtained on the individual exercises and the short report on the data analysis to be presented in the classroom. The score of each exercise is awarded based on its difficulty.
The final grade is the average value of the written test and the report on data analysis.
P.J. HEWSON, Multivariate Statistics with R, scaricabile dal web.
B. BRACALENTE M.COSSIGNANI A. MULAS, Statistica aziendale , McGraw-Hill, 2009.
ISBN: 883866496X
A. DE LILLO G. ARGENTIN M. LUCCHINI S. SARTI M.TERRANEO, Analisi multivariata per le Scienze sociali.Ed. Pearson 2007
ISBN: 8871923766
G. ESPA R.MICCIOLO, Analisi esplorativa dei dati con R, Ed. APOGEO, Milano, 2012
ISBN: 8838786852
NEWBOLD P., CARLSON W. L., THORNE B., Statistica 9/Ed, Pearson Education Italia, 2021. [Capitolo 8, Capitolo 9, Capitolo 10, Capitolo 11]
ISBN: 8891910651
Altro materiale didattico (slide, esercizi, homework) è messo a disposizione sul sito del corso (https://learn.univpm.it/)
P.J. HEWSON, Multivariate Statistics with R, available online.
B. BRACALENTE M.COSSIGNANI A. MULAS, Statistica aziendale , McGraw-Hill, 2009.
ISBN: 883866496X
A. DE LILLO G. ARGENTIN M. LUCCHINI S. SARTI M.TERRANEO, Analisi multivariata per le Scienze sociali.Ed. Pearson 2007 2007.
ISBN: 8871923766
G. ESPA R.MICCIOLO, Analisi esplorativa dei dati con R, Ed. APOGEO, Milano, 2012
ISBN: 8838786852
NEWBOLD P., CARLSON W. L., THORNE B., Statistica 9/Ed, Pearson Education Italia, 2021. [Ch 8, Ch 9, Ch 10, Ch 11]
ISBN: 8891910651
Additional teaching material (slides, exercises, homework) is made available on the course website (https://learn.univpm.it/)
L'insegnamento non è erogato in modalità e-learning.
The teaching is not delivered in e-learning mode.
Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427