Guida degli insegnamenti

Syllabus

Partially translatedTradotto parzialmente
[W001256] - DATA SCIENCEDATA SCIENCE
Domenico URSINO
Lingua di erogazione: ITALIANOLessons taught in: ITALIAN
Laurea Magistrale - [IM12] INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE Master Degree (2 years) - [IM12] COMPUTER AND AUTOMATION ENGINEERING
Dipartimento: [040040] Dipartimento Ingegneria dell'InformazioneDepartment: [040040] Dipartimento Ingegneria dell'Informazione
Anno di corsoDegree programme year : 2 - Primo Semestre
Anno offertaAcademic year: 2024-2025
Anno regolamentoAnno regolamento: 2023-2024
Crediti: 9
Ore di lezioneTeaching hours: 72
TipologiaType: B - Caratterizzante
Settore disciplinareAcademic discipline: ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI

LINGUA INSEGNAMENTO LANGUAGE

ITALIANO

Italian


PREREQUISITI PREREQUISITES

Conoscenza di base relativa alla Data Analytics acquisita nel corso di Project Management per l'ICT

Basic knowledge related to Data Analytics acquired in the "ICT Project Management" course.


MODALITÀ DI SVOLGIMENTO DEL CORSO DEVELOPMENT OF THE COURSE

La durata del corso è di 72 ore così suddivise:

Lezioni di Teoria: 24 ore

Esercitazioni: 24 ore

Brainstorming e seminari: 24 ore

Le slide e i contenuti del corso sono accessibili sul sito di e-learning dell'università all'indirizzo https://learn.univpm.it

The duration of the course is 72 hours divided as follows:

Theory lessons: 24 hours

Exercises: 24 hours

Brainstorming and seminars: 24 hours

Course slides and content can be accessed on the university's e-learning site at https://learn.univpm.it


RISULTATI DI APPRENDIMENTO ATTESI LEARNING OUTCOMES
Conoscenze e comprensione.

L’insegnamento ha la finalità di consentire allo studente di conoscere le principali metodologie e tecnologie, nonché i principali
strumenti per l’analitica dei dati descrittiva, diagnostica, predittiva e prescrittiva. Una particolare enfasi verrà posta nella realizzazione
di progetti utilizzando i tool che, al momento dell’erogazione del corso, risultano essere i leader del mercato sulla base di valutazioni
oggettive, quali i Magic Quadrant di Gartner. Il corso, oltre all’analitica dei dati in generale, porrà un’enfasi particolare all’applicazione
di tale attività a contesti particolarmente innovativi, quali il Natural Language Processing, il cognitive reasoning, i social network,
l’Internet of Things e i chatbot.


Capacità di applicare conoscenze e comprensione.

Lo studente sarà in grado di lavorare in team con altri colleghi al fine di effettuare alcuni progetti che gli consentiranno di mettere in
pratica le conoscenze via via acquisite. In particolare, ciascun team dovrà realizzare un progetto di analitica dei dati descrittiva,
diagnostica, predittiva e prescrittiva utilizzando tool alternativi che risultano essere leader nei Magic Quadrant di Gartner.
Successivamente dovrà realizzare un progetto utilizzando l’ecosistema Python per la data science, un progetto per l’estrazione di
conoscenza relativa a social network e Internet of Things, un progetto basato sull’ecosistema BERT, e un chatbot.


Competenze trasversali.

Il corso è fortemente basato sulla realizzazione di progetti in gruppo e sul brainstorming. Questo favorisce lo sviluppo di varie
competenze trasversali, quali la capacità di lavorare in gruppo, la gestione dei conflitti, la comunicazione efficace, la capacità di
ascolto e di sintesi di idee differenti. La necessità di elaborare dati provenienti da contesti eterogenei (quali quelli economici, finanziari,
medici, etc.) favorirà, inoltre, la capacità, da parte degli studenti, di confrontarsi con scenari molto stimolanti, consentendo loro di
sperimentare in anticipo un modus operandi tipico del mondo del lavoro.


Knowledge and Understanding.

This course aims at allowing students to know the main methodologies and technologies, as well as the main tools, for descriptive,
diagnostic, predictive and prescriptive data analytics. A special emphasis will be placed on the implementation of projects by means of
tools that are market leaders when the course is delivered based on objective evaluations, like the ones of Gartner’s Magic Quadrants.
In addition to general data analytics, this course will place a particular emphasis on the application of this activity to particularly
innovative contexts, such as Natural Language Processing, cognitive reasoning, social networks, the Internet of Things and chatbots.


Capacity to apply Knowledge and Understanding.

Students will be able to work in team with other colleagues in order to carry out some projects that will allow them to put into practice
the knowledge acquired over time. In particular, each team will carry out a descriptive, diagnostic, predictive and prescriptive data
analytics project using alternative tools that are leaders in Gartner's Magic Quadrants. After this, they will carry out a project using the
Python Ecosystem for Data Science, a project for the extraction of knowledge related to social networks and the Internet of Things, a
project based on the BERT ecosystem, and a chatbot.


Transversal Skills.

This course is strongly based on the realization of projects to be carried out in groups and on brainstorming. This method favors the
development of several transversal skills such as the capability of working in a team, conflict management, effective communication,
listening capability and of synthesize different ideas. The necessity to process data coming from heterogeneous contexts (such as the
economic, financial and medical ones) will also favor the capability of dealing with scenarios very challenging scenarios. This will allow
them to experience in advance a modus operandi typical of the job’s world.



PROGRAMMA PROGRAM

Teoria

SERIE TEMPORALI
- Overview e Storia
- Trovare e gestire i dati
- Exploratory Data Analysis
- Memorizzazione dei dati temporali
- Modelli statistici
- Modelli nello spazio degli stati
- Generazione e selezione delle feature
- Approcci basati sul machine learning
- Deep learning per le serie temporali

SOCIAL NETWORK ANALYSIS

NATURAL LANGUAGE PROCESSING
- Introduzione al Natural Language Processing
- La pipeline NLP
- Rappresentazione dei testi
- Classificazione dei testi
- Estrazione delle informazioni
- I chatbot
- Altri task NLP

ESERCITAZIONI

- L'ecosistema Python per la Data Science: Pandas, Scikit-Learn, Statsmodel
- Un tool di Social Network Analysis: Python NetworkX
- La tecnologia dei transformer e BERT
- La tecnologia RASA per la costruzione di un chatbot
- Utilizzo di Python in altre applicazioni NLP


La versione dettagliata del programma del corso si trova nella pagina del corso presente sul sito di e-learning dell'Università all’indirizzo https://learn.univpm.it

Theory

TIME SERIES
- Overview and History
- Finding and managing data
- Exploratory Data Analysis
- Storage of temporal data
- Statistical Models
- Models in the space of states
- Feature generation and selection
- Machine learning-based approaches
- Deep learning for time series

SOCIAL NETWORK ANALYSIS

NATURAL LANGUAGE PROCESSING
- Introduction to Natural Language Processing
- The NLP Pipeline
- Text representation
- Text classification
- Information extraction
- Chatbots
- Other NLP tasks

EXERCISES

- The Python ecosystem for Data Science: Pandas, Scikit-Learn, Statsmodel
- A Social Network Analysis tool: Python NetworkX
- Transformer technology and BERT
- RASA technology for building a chatbot
- Using Python in other NLP applications

The detailed program is available at the e-learning site of the University at the address https://learn.univpm.it


MODALITÀ DI SVOLGIMENTO DELL'ESAME DEVELOPMENT OF THE EXAMINATION
Modalità di valutazione dell'apprendimento.

L’esame prevede la realizzazione di alcune tesine e una prova orale in cui si discuteranno le tesine realizzate e verranno approfonditi gli aspetti teorici che ad esse si riferiscono. Le tesine, da svolgersi in gruppo, richiederanno l’utilizzo dell’ecosistema di Python e delle sue librerie di base per la data science, ovvero Pandas, Scikit-Learn e Statsmodel, l’utilizzo di NetworkX, di BERT, di RASA e di eventuali altre librerie Python a supporto dell’NLP. Durante il corso verranno condotte delle sessioni di brainstorming dove ciascun gruppo presenterà il proprio lavoro e gli altri gruppi potranno intervenire per osservazioni, suggerimenti, etc.
Per quanto riguarda gli studenti con disabilità/invalidità o disturbo specifico di apprendimento (DSA), che abbiano fatto debita richiesta di supporto per affrontare lo specifico esame di profitto all’Info Point Disabilità/DSA dell’Ateneo, le modalità di esame saranno adattate alla luce di quanto previsto dalle linee guida di Ateneo


Criteri di valutazione dell'apprendimento.

Per superare l’esame gli studenti e le studentesse devono dimostrare, attraverso i progetti, di aver compreso i concetti fondamentali del corso e di aver acquisito competenze sui tool di Data Analytics descrittiva, diagnostica, predittiva e prescrittiva, di log mining, di cognitive reasoning e di social network analysis.
La valutazione massima è attribuita agli studenti e alle studentesse che dimostrano un’ottima conoscenza dei tool, un’ottima capacità di costruire dei progetti che utilizzino tali tool, un’approfondita conoscenza dei contenuti dell’insegnamento, rigore metodologico ed appropriatezza del vocabolario tecnico.


Criteri di misurazione dell'apprendimento.

Viene attribuito un voto in trentesimi con eventuale lode


Criteri di attribuzione del voto finale.

Il voto complessivo dipende principalmente dalla qualità dei progetti e dal contributo che lo studente o la studentessa dimostrerà di aver dato ad essi nonché dalla padronanza sugli argomenti del corso che egli o ella dimostrerà durante la prova orale.


Learning Evaluation Methods.

The examination will involve the realization of a number of projects and an oral exam in which the projects completed will be discussed and the theoretical aspects related to them will be explored. The projects, to be done in groups, will require the use of the Python ecosystem and its core libraries for data science, namely Pandas, Scikit-Learn and Statsmodel, the use of NetworkX, BERT, RASA and any other Python libraries supporting NLP. Brainstorming sessions will be conducted during the course where each group will present their work and the other groups can intervene for comments, suggestions, etc.
For students with disabilities/invalidities or Specific Learning Disabilities (SLD), who have duly made a request for assistance in dealing with the specific profit examination at the University's Disability/DSA Info Point, the examination arrangements will be adapted in the light of the provisions of the University's policies.


Learning Evaluation Criteria.

To pass the exam, students must prove, through their projects, that they have understood the fundamental concepts of the course and have acquired skills in the tools of descriptive, diagnostics, predictive and prescriptive Data Analytics, log mining, cognitive reasoning and social network analysis.
The highest evaluation is given to students who demonstrate an excellent knowledge of tools, an excellent ability to build projects that use these tools, a thorough knowledge of the contents of the course, methodological rigor and appropriateness of the technical vocabulary.


Learning Measurement Criteria.

A score in thirtieths is given, possibly cum laude


Final Mark Allocation Criteria.

The overall score depends mainly on the quality of the projects, on the contribution that the student will provide to their realization, as well as on the knowledge of the topics of the course that he or she will show during the oral exam.



TESTI CONSIGLIATI RECOMMENDED READING

• A. Nielsen, “Practical Time Series Analysis”, O’Reilly, 2020.
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011.
• S. Vajjala, B. Majumder, A. Gupta, H. Surana, “Practical Natural Language Processing”, O’Reilly, 2020.


Dispense fornite dal docente

Materiale didattico disponibile sul sito https://learn.univpm.it/

• A. Nielsen, “Practical Time Series Analysis”, O’Reilly, 2020.
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011.
• S. Vajjala, B. Majumder, A. Gupta, H. Surana, “Practical Natural Language Processing”, O’Reilly, 2020.


Notes provided by Professor

Educational material available at the site https://learn.univpm.it/


E-LEARNING E-LEARNING

No

No


Scheda insegnamento erogato nell’A.A. 2024-2025
Le informazioni contenute nella presente scheda assumono carattere definitivo solo a partire dall'A.A. di effettiva erogazione dell'insegnamento.
Academic year 2024-2025

 


Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427