Guida degli insegnamenti

Syllabus

Partially translatedTradotto parzialmente
[W001440] - METODOLOGIE STATISTICHE PER BIG DATASTATISTICS FOR BIG DATA ANALYSIS
GLORIA POLINESI
Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Laurea Magistrale - [EM11] DATA SCIENCE PER L'ECONOMIA E LE IMPRESE Master Degree (2 years) - [EM11] DATA SCIENCE FOR ECONOMICS AND BUSINESS
Dipartimento: [040002] Dipartimento Scienze Economiche e SocialiDepartment: [040002] Dipartimento Scienze Economiche e Sociali
Anno di corsoDegree programme year : 1 - Secondo Semestre
Anno offertaAcademic year: 2020-2021
Anno regolamentoAnno regolamento: 2020-2021
Obbligatorio
Crediti: 6
Ore di lezioneTeaching hours: 44
TipologiaType: B - Caratterizzante
Settore disciplinareAcademic discipline: SECS-S/01 - STATISTICA

LINGUA INSEGNAMENTO LANGUAGE

ITALIANO

Italian


PREREQUISITI PREREQUISITES

Si considerano acquisiti i contenuti del programma di Introduzione alla statistica computazionale mod. 1 e 2.

Contents of the Course “Introduzione alla statistica computazionale” modules: 1 and 2.


MODALITÀ DI SVOLGIMENTO DEL CORSO DEVELOPMENT OF THE COURSE

Il corso è svolto mediante lezioni frontali e prevede anche esercitazioni pratiche.

Lectures and practical exercises.


RISULTATI DI APPRENDIMENTO ATTESI LEARNING OUTCOMES
Conoscenze e comprensione.

Al termine del corso gli studenti saranno in grado di comprendere le principali tecniche statistiche e di data mining, riguardanti i seguenti temi: tecniche di regressione e classificazione supervisionata e non supervisionata.


Capacità di applicare conoscenze e comprensione.

Al termine del corso gli studenti sapranno anche utilizzare i principali strumenti di statistica applicata e data mining.


Competenze trasversali.

Applicazioni pratiche, confronti e discussioni, che avranno luogo durante il corso, consentiranno agli studenti di capire il valore dei dati nel processo decisionale per trasformare le informazioni in conoscenza di supporto alle decisioni.


Knowledge and Understanding.

the student must be able to understand the main statistical and data mining techniques of supervised and unsupervised learning.


Capacity to apply Knowledge and Understanding.

the student must be able to use the main tools of applied statistics and data mining


Transversal Skills.

practical applications and discussions allow students to understand the value of data in the decision-making process



PROGRAMMA PROGRAM

1. Contenuti.
Introduzione al Data Mining (esplorazione dei dati e preprocessing)
Classificazione supervisionata e non supervisionata (richiami di classificazione e regressione, richiami di clustering
Dimensionality reduction (richiami di PCA e Factor Analysis)
Alberi di Decisione
Modelli di rete.

2. Esercitazioni.
Applicazioni con R/Python.

Introduction to Data Mining (data exploration and preprocessing)
Supervised and unsupervised classification (elements of classification, regression and clustering)
Dimensionality reduction (elements of PCA and Factor Analysis)
Decision trees
Network models.


MODALITÀ DI SVOLGIMENTO DELL'ESAME DEVELOPMENT OF THE EXAMINATION
Modalità di valutazione dell'apprendimento.

L'esame consiste in una prova scritta


Criteri di valutazione dell'apprendimento.

Nel corso dell’esame gli studenti dovranno dimostrare di aver acquisito una solida conoscenza dei temi svolti nelle lezioni e di saper applicare tali conoscenze nella soluzione degli esercizi.


Criteri di misurazione dell'apprendimento.

Il voto verrà espresso in trentesimi. Lo studente supererà l'esame se otterrà almeno 18. È prevista l’assegnazione del massimo dei voti con lode (30 e lode).


Criteri di attribuzione del voto finale.

Gli studenti dovranno rispondere a 4 domande scritte. Ad ogni domanda sarà attribuito un voto non superiore a 7,5.
Gli studenti che dimostreranno una analitica, approfondita ed esaustiva comprensione dei contenuti teorici e pratici del corso, otterranno la lode.


Learning Evaluation Methods.

Examination:
Written


Learning Evaluation Criteria.

The students must demonstrate of having acquired a solid knowledge of the topics covered during lectures.


Learning Measurement Criteria.

Positive grades: from 18 to 30. Cum laude can be bestowed to outstanding performance.


Final Mark Allocation Criteria.

4 questions (each of 7.5 points). Cum laude bestowed to students who demonstrate an in-depth understanding of the theoretical and practical contents of the course.



TESTI CONSIGLIATI RECOMMENDED READING

Dietrich D.. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015.
Erl T., Khattak W., Buhler P.. Big Data Fundamentals: Concepts, Drivers & Techniques. Prentice Hall, 2015.
Giudici, P.. Applied Data Mining: Statistical Methods for Business and Industry. John Wiley & Sons, 2005.
Han J., Pei J., & Kamber M.. Data Mining: Concept and Techniques. Elsevier, 2011.
Witten I. H., Eibe F., Mark A.. Data Mining: Practical Machine Learning Tools and Techniques. Elsevier, 2011.

Mandatory textbook:

Dietrich D.. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015.
Erl T., Khattak W., Buhler P.. Big Data Fundamentals: Concepts, Drivers & Techniques. Prentice Hall, 2015.
Giudici, P.. Applied Data Mining: Statistical Methods for Business and Industry. John Wiley & Sons, 2005.
Han J., Pei J., & Kamber M.. Data Mining: Concept and Techniques. Elsevier, 2011.


Scheda insegnamento erogato nell’A.A. 2020-2021
Le informazioni contenute nella presente scheda assumono carattere definitivo solo a partire dall'A.A. di effettiva erogazione dell'insegnamento.
Academic year 2020-2021

 


Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427