Guida degli insegnamenti

Syllabus

Partially translatedTradotto parzialmente
[W001256] - DATA SCIENCEDATA SCIENCE
Domenico URSINO
Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Laurea Magistrale - [IM12] INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE Master Degree (2 years) - [IM12] COMPUTER AND AUTOMATION ENGINEERING
Dipartimento: [040040] Dipartimento Ingegneria dell'InformazioneDepartment: [040040] Dipartimento Ingegneria dell'Informazione
Anno di corsoDegree programme year : 2 - Primo Semestre
Anno offertaAcademic year: 2023-2024
Anno regolamentoAnno regolamento: 2022-2023
Crediti: 9
Ore di lezioneTeaching hours: 72
TipologiaType: B - Caratterizzante
Settore disciplinareAcademic discipline: ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI

LINGUA INSEGNAMENTO LANGUAGE

ITALIANO

Italian


PREREQUISITI PREREQUISITES

Conoscenza di base relativa ai database e alla Big Data Analytics

Basic knowledge about databases and Big Data Analytics


MODALITÀ DI SVOLGIMENTO DEL CORSO DEVELOPMENT OF THE COURSE

La durata del corso è di 72 ore così suddivise:

Lezioni di Teoria: 24 ore

Esercitazioni: 24 ore

Brainstorming e seminari: 24 ore

The duration of the course is 72 hours divided as follows:

Theory lessons: 24 hours

Exercises: 24 hours

Brainstorming and seminars: 24 hours


RISULTATI DI APPRENDIMENTO ATTESI LEARNING OUTCOMES
Conoscenze e comprensione.

L’insegnamento ha la finalità di consentire allo studente di conoscere le principali metodologie e tecnologie, nonché i principali
strumenti per l’analitica dei dati descrittiva, diagnostica, predittiva e prescrittiva. Una particolare enfasi verrà posta nella realizzazione
di progetti utilizzando i tool che, al momento dell’erogazione del corso, risultano essere i leader del mercato sulla base di valutazioni
oggettive, quali i Magic Quadrant di Gartner. Il corso, oltre all’analitica dei dati in generale, porrà un’enfasi particolare all’applicazione
di tale attività a contesti particolarmente innovativi, quali il Natural Language Processing, il cognitive reasoning, i social network,
l’Internet of Things e i chatbot.


Capacità di applicare conoscenze e comprensione.

Lo studente sarà in grado di lavorare in team con altri colleghi al fine di effettuare alcuni progetti che gli consentiranno di mettere in
pratica le conoscenze via via acquisite. In particolare, ciascun team dovrà realizzare un progetto di analitica dei dati descrittiva,
diagnostica, predittiva e prescrittiva utilizzando tool alternativi che risultano essere leader nei Magic Quadrant di Gartner.
Successivamente dovrà realizzare un progetto utilizzando l’ecosistema Python per la data science, un progetto per l’estrazione di
conoscenza relativa a social network e Internet of Things, un progetto basato sull’ecosistema BERT, e un chatbot.


Competenze trasversali.

Il corso è fortemente basato sulla realizzazione di progetti in gruppo e sul brainstorming. Questo favorisce lo sviluppo di varie
competenze trasversali, quali la capacità di lavorare in gruppo, la gestione dei conflitti, la comunicazione efficace, la capacità di
ascolto e di sintesi di idee differenti. La necessità di elaborare dati provenienti da contesti eterogenei (quali quelli economici, finanziari,
medici, etc.) favorirà, inoltre, la capacità, da parte degli studenti, di confrontarsi con scenari molto stimolanti, consentendo loro di
sperimentare in anticipo un modus operandi tipico del mondo del lavoro.


Knowledge and Understanding.

This course aims at allowing students to know the main methodologies and technologies, as well as the main tools, for descriptive,
diagnostic, predictive and prescriptive data analytics. A special emphasis will be placed on the implementation of projects by means of
tools that are market leaders when the course is delivered based on objective evaluations, like the ones of Gartner’s Magic Quadrants.
In addition to general data analytics, this course will place a particular emphasis on the application of this activity to particularly
innovative contexts, such as Natural Language Processing, cognitive reasoning, social networks, the Internet of Things and chatbots.


Capacity to apply Knowledge and Understanding.

Students will be able to work in team with other colleagues in order to carry out some projects that will allow them to put into practice
the knowledge acquired over time. In particular, each team will carry out a descriptive, diagnostic, predictive and prescriptive data
analytics project using alternative tools that are leaders in Gartner's Magic Quadrants. After this, they will carry out a project using the
Python Ecosystem for Data Science, a project for the extraction of knowledge related to social networks and the Internet of Things, a
project based on the BERT ecosystem, and a chatbot.


Transversal Skills.

This course is strongly based on the realization of projects to be carried out in groups and on brainstorming. This method favors the
development of several transversal skills such as the capability of working in a team, conflict management, effective communication,
listening capability and of synthesize different ideas. The necessity to process data coming from heterogeneous contexts (such as the
economic, financial and medical ones) will also favor the capability of dealing with scenarios very challenging scenarios. This will allow
them to experience in advance a modus operandi typical of the job’s world.



PROGRAMMA PROGRAM

Teoria

- Richiami di Big Data Analytics (0.5 CFU)
- Richiami di Statistica (1.5 CFU)
- Richiami di Data Mining e Machine Learning (0.5 CFU)
- Le Serie Temporali (0.5 CFU)
- La Social Network Analysis (1 CFU)
- Il Natural Language Processing (0.5 CFU)
- Elaborazione dell'NLP attraverso il Deep Learning: BERT (0.25 CFU)
- La Sentiment Analysis (0.25 CFU)
- Il Cognitive Computing e i chatbot (0.5 CFU)


Esercitazioni

- Un tool di Data Analytics Descrittiva e Diagnostica: Qlik Sense (0.25 CFU)
- Un tool di Data Analytics Descrittiva, Diagnostica e Predittiva: Tableau (0.25 CFU)
- Un tool di Data Analytics Descrittiva, Diagnostica, Predittiva e Prescrittiva: Microsoft Power BI e suoi plug-in (1 CFU)
- Ecosistema Python per la Data Science: Pandas, Scikit Learn e Statsmodel (0.5 CFU CFU)
- Un tool di Social Network Analysis: Python NetworkX (0.5 CFU)
- La tecnologia dei transformer e BERT (0.25 CFU
- La tecnologia RASA per la costruzione di un chatbot (0.75 CFU)

La versione dettagliata del programma del corso si trova nella pagina del corso presente sul sito di e-learning dell'Università all’indirizzo https://learn.univpm.it

Theory

- Big Data Analytics Recalls (0.5 ECTs)
- Statistics Recalls (1.5 ECTs)
- Data Mining and Machine Learning Recalls (0.5 ECTs)
- Time Series (0.5 ECTs)
- Social Network Analysis (1 ECT)
- Natural Language Processing (0.5 ECTs)
- NLP Processing through Deep Learning: BERT (0.25 ECTs)
- Sentiment Analysis (0.25 ECTs)
- Cognitive Computing and Chatbots (0.5 ECTs)


Exercises

- A tool for Descriptive and Diagnostic Data Analytics: Qlik Sense (0.25 ECTs)
- A tool of Descriptive, Diagnostic and Predictive Data Analytics: Tableau (0.25 ECTs)
- A tool for Descriptive, Diagnostic, Predictive and Prescriptive Data Analytics: Microsoft Power BI and its plug-ins (1 ECT)
- Python Ecosystem for Data Science: Pandas, Scikit Learn and Statsmodel (0.5 ECTs)
- A tool for Social Network Analysis: Python NetworkX (0.5 ECTs)
- Transformer technology and BERT (0.25 ECTs)
- RASA technology for building a chatbot (1 ECT)

The detailed program is available at the e-learning site of the University at the address https://learn.univpm.it


MODALITÀ DI SVOLGIMENTO DELL'ESAME DEVELOPMENT OF THE EXAMINATION
Modalità di valutazione dell'apprendimento.

L’esame prevede la realizzazione di alcune tesine e una prova orale in cui si discuteranno le tesine realizzate e verranno approfonditi gli aspetti teorici che ad esse si riferiscono. Le tesine, da svolgersi in gruppo, richiederanno l’utilizzo di di Qlik Sense, Tableau, PowerBI, Ecosistema Python per la Data Science, NetworkX, BERT e RASA per estrarre conoscenza da uno o più insiemi di dati reali provenienti da contesti scelti dagli studenti. Durante il corso verranno condotte delle sessioni di brainstorming dove ciascun gruppo presenterà il proprio lavoro e gli altri gruppi potranno intervenire per osservazioni, suggerimenti, etc.


Criteri di valutazione dell'apprendimento.

Per superare l’esame gli studenti e le studentesse devono dimostrare, attraverso i progetti, di aver compreso i concetti fondamentali del corso e di aver acquisito competenze sui tool di Data Analytics descrittiva, diagnostica, predittiva e prescrittiva, di log mining, di cognitive reasoning e di social network analysis.
La valutazione massima è attribuita agli studenti e alle studentesse che dimostrano un’ottima conoscenza dei tool, un’ottima capacità di costruire dei progetti che utilizzino tali tool, un’approfondita conoscenza dei contenuti dell’insegnamento, rigore metodologico ed appropriatezza del vocabolario tecnico.


Criteri di misurazione dell'apprendimento.

Viene attribuito un voto in trentesimi con eventuale lode


Criteri di attribuzione del voto finale.

Il voto complessivo dipende principalmente dalla qualità dei progetti e dal contributo che lo studente o la studentessa dimostrerà di aver dato ad essi nonché dalla padronanza sugli argomenti del corso che egli o ella dimostrerà durante la prova orale.


Learning Evaluation Methods.

The exam includes the realization of some projects and an oral test in which the realized projects will be discussed in such a way as to deepen the theoretical aspects that refer to them. Projects, to be realized in groups, will require the use of di Qlik Sense, Tableau, PowerBI, Python ecosystem for Data Science, NetworkX, BERT and RASA, to extract knowledge from one or more sets of real data from contexts chosen by students. During the course several brainstorming sessions will be conducted, where each group will present its project and the other groups can intervene for comments, suggestions, etc.


Learning Evaluation Criteria.

To pass the exam, students must prove, through their projects, that they have understood the fundamental concepts of the course and have acquired skills in the tools of descriptive, diagnostics, predictive and prescriptive Data Analytics, log mining, cognitive reasoning and social network analysis.
The highest evaluation is given to students who demonstrate an excellent knowledge of tools, an excellent ability to build projects that use these tools, a thorough knowledge of the contents of the course, methodological rigor and appropriateness of the technical vocabulary.


Learning Measurement Criteria.

A score in thirtieths is given, possibly cum laude


Final Mark Allocation Criteria.

The overall score depends mainly on the quality of the projects, on the contribution that the student will provide to their realization, as well as on the knowledge of the topics of the course that he or she will show during the oral exam.



TESTI CONSIGLIATI RECOMMENDED READING

• T. Erl, W. Khattak, P. Buhler, “Big Data Fundamentals – Concepts, Drivers & Techniques”, Prentice Hall, 2015.
• P. Bruce, A. Bruce, P. Gedeck, “Practical statistics for Data Scientists”, O’Reilly, 2020.
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011.

Dispense fornite dal docente

Materiale didattico disponibile sul sito https://learn.univpm.it/

• T. Erl, W. Khattak, P. Buhler, “Big Data Fundamentals – Concepts, Drivers & Techniques”, Prentice Hall, 2015.
• P. Bruce, A. Bruce, P. Gedeck, “Practical statistics for Data Scientists”, O’Reilly, 2020.
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011.


Notes provided by Professor

Educational material available at the site https://learn.univpm.it/


E-LEARNING E-LEARNING

No

No


Scheda insegnamento erogato nell’A.A. 2023-2024
Le informazioni contenute nella presente scheda assumono carattere definitivo solo a partire dall'A.A. di effettiva erogazione dell'insegnamento.
Academic year 2023-2024

 


Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427