INGLESE
English
Si presuppone la conoscenza della Statistica descrittiva e di quella inferenziale
Descriptive statistics, basic concepts of probability, testing hypotheses, basic concepts of statistical inference.
Il corso sarà svolto sia mediante lezioni frontali sia mediante applicazioni al computer.
The course is organized into 22 lectures of two hours each, including in-person lectures and applications on the computer.
Il corso si propone di fornire agli/alle studenti/studentesse approcci teorici ed empirici per analizzare i fenomeni economici e sociali.
Al termine del corso gli/le studenti/studentesse saranno in grado di scegliere in modo adeguato le tecniche di statistica e valutarne la loro applicabilità ai vari problemi. Saranno, inoltre, in grado di redigere programmi nel linguaggio R per effettuare le opportune applicazioni.
Le applicazioni pratiche attraverso l’uso del software R consentiranno agli/alle studenti/studentesse di migliorare la loro autonomia e la loro capacità critica.
The course aims to provide students with theoretical and empirical approaches to analyze economic and social phenomena.
At the end of the course, students will be able to adequately choose statistical techniques and evaluate their applicability to various problems. They will also be able to write R scripts to carry out the appropriate applications.
Practical exercises on R software will allow
students to improve their autonomy and critical abilities.
1. Introduzione a R e R Studio
2. Importazione dei dati
2.1 Importazione dei dati da Web
2.2 Importazione dei dati da GitHub
2.3 Importazione di dataset di grandi dimensioni
2.4 Importazione di Serie Storiche
3. Trattamento preliminare dei dati
3.1 I dati mancanti e strategie per il loro trattamento
3.2 I valori anomali e le strategie per il loro trattamento
3.3 Analisi automatica dei missing e dei valori anomali univariati
3.4 Operazioni avanzate con i missing values
4. Popolazione e campionamento
4.1 Schemi di campionamento
4.2 Campione probabilistico
4.3 Campione non probabilistico
5 Statistical learning
5.1 Metodi di Resampling
5.1.1 Cross-validation
5.1.2 Bootstrap
5.1.3 Bagging
5.2 Introduzione a tecniche di machine learning supervisionato
5.2.1 Nearest Neighbours
1. Introduction to R and R Studio programming language
2. Importing Data
2.1 Importing Data from a Web Page
2.2 Importing Data from a GitHub Page
2.3 Importing Large Datasets
2.4 Importing Time Series
3. Preliminary Data Treatment
3.1 Missing Data
3.2 Outliers
3.3 Automatic Analysis of Missing and Univariate Outliers
3.4 Advanced Operations with Missing Values
4. Population and sampling
4.1Sample frame
4.2 Probability sample
4.3 Nonprobability Sample
5 Statistical learning
5.1 Resampling methods
5.1.1 Cross-validation
5.1.2 The Bootstrap
5.1.3 Bagging
5.2 Introduction to supervised machine learning
5.2.1 Nearest Neighbours
L’esame consiste in una prova scritta e una tesina in cui gli/le studenti/studentesse devono elaborare un dataset utilizzando codici implementati in R. La tesina deve includere un esempio di applicazione di machine learning. Nel compito sono previsti
esercizi e domande brevi con l’obiettivo di verificare l'apprendimento
degli argomenti trattati e l’effettiva capacità di applicare le conoscenze
acquisite.
A discrezione del docente può essere richiesta una ulteriore prova orale. Per gli\le studenti\studentesse con disabilità/invalidità o disturbo specifico di apprendimento (DSA), che abbiano fatto debita richiesta di supporto per affrontare lo specifico esame di profitto all’Info Point Disabilità/DSA dell’Ateneo, le modalità di esame saranno adattate alla luce di quanto previsto dalle linee guida di Ateneo (https://www.univpm.it/Entra/Accoglienza_diversamente_abili).
Nella prova scritta gli/le studenti/studentesse dovranno dimostrare di aver acquisito una solida conoscenza dei temi svolti nelle lezioni e di saper utilizzare la corrispondente strumentazione statistica.
Il voto finale è attribuito in trentesimi. L’esame si intende superato se il
voto è pari o superiore a 18.
Il voto finale viene attribuito sulla base del compito scritto, come somma
dei punteggi ottenuti sui singoli esercizi e il voto della tesina sull’analisi dei dati. Il punteggio di ogni esercizio
viene assegnato sulla base della difficoltà dello stesso.
The final examination consists of a written test and a short report which analyzes a dataset using R codes. The empirical analysis includes an application of machine learning. The written test consists of short exercises and questions designed to assess the learning of the topics covered and the student’s actual ability to apply the knowledge acquired.
An additional oral exam may be required. For students with disabilities or Specific Learning Disability (SLD) who have contacted the University Disability/SLD Info Point to request support for the specific curricular exam, please note that the way the exam is taken can be adapted in accordance with the University Guidelines (https://www.univpm.it/Entra/Accoglienza_diversamente_abili).
During the written exam, students must demonstrate solid knowledge of the topics and methods for functions of one variable. The ability to apply the acquired knowledge is evaluated by solving the assigned problems.
The exam is worth thirty points. A passing grade is 18 or above.
The final score is determined based on the written exam: the sum of the scores obtained on the individual exercises and the short report on the data analysis. The score of each exercise is awarded based on its difficulty.
A. Agresti and M. Kateri: Foundations of Statistics for Data Scientists with R and Python (2022). ISBN 978-0-367-74845-6
T. Hastie, R. Tibshirani and J. Friedman: The elements of statistical learning: data mining, inference, and prediction (2009). New York: Springer. Series ISSN
0172-7397
Altro materiale sarà reso disponibile sulla piattaforma e-learning (https://learn.univpm.it/).
Alan Agresti and Maria Kateri: Foundations of Statistics for Data Scientists with R and Python (2022). ISBN 978-0-367-74845-6
T. Hastie, R. Tibshirani and J. Friedman: The elements of statistical learning: data mining, inference, and prediction (2009). New York: Springer. Series ISSN
0172-7397
Further material will be available on the course website (https://learn.univpm.it/).
L'insegnamento non è erogato in modalità e-learning.
Teaching is not provided in e-learning mode.
Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427