ITALIANO
Italian
Conoscenza di base relativa ai database e alla Big Data Analytics
Basic knowledge about databases and Big Data Analytics
La durata del corso è di 72 ore così suddivise:
Lezioni di Teoria: 24 ore
Esercitazioni: 24 ore
Brainstorming e seminari: 24 ore
The duration of the course is 72 hours divided as follows:
Theory lessons: 24 hours
Exercises: 24 hours
Brainstorming and seminars: 24 hours
L’insegnamento ha la finalità di consentire allo studente di conoscere le principali metodologie e tecnologie, nonché i principali strumenti per l’analitica dei dati descrittiva, diagnostica, predittiva e prescrittiva. Una particolare enfasi verrà posta nella realizzazione di progetti utilizzando i tool che, al momento dell’erogazione del corso, risultano essere i leader del mercato sulla base di valutazioni oggettive, quali i Magic Quadrant di Gartner. Il corso, oltre all’analitica dei dati in generale, porrà un’enfasi particolare all’applicazione di tale attività a contesti particolarmente innovativi, quali l’analisi dei log, il cognitive reasoning, i social network e l’Internet of Things.
Lo studente sarà in grado di lavorare in team con altri colleghi al fine di effettuare alcuni progetti che gli consentiranno di mettere in pratica le conoscenze via via acquisite. In particolare, ciascun team dovrà realizzare un progetto di analitica dei dati descrittiva, diagnostica, predittiva e prescrittiva utilizzando tool alternativi che risultano essere leader nei Magic Quadrant di Gartner. Successivamente dovrà realizzare un progetto di log mining, un progetto che utilizza un tool di cognitive reasoning e un progetto per l’estrazione di conoscenza relativa a social network e Internet of Things.
Il corso è fortemente basato sulla realizzazione di progetti in gruppo e sul brainstorming. Questo favorisce lo sviluppo di varie competenze trasversali, quali la capacità di lavorare in gruppo, la gestione dei conflitti, la comunicazione efficace, la capacità di ascolto e di sintesi di idee differenti. La necessità di elaborare dati provenienti da contesti eterogenei (quali quelli economici, finanziari, medici, etc.) favorirà, inoltre, la capacità, da parte degli studenti, di confrontarsi con scenari molto stimolanti, consentendo loro di sperimentare in anticipo un modus operandi tipico del mondo del lavoro.
This course aims at allowing students to know the main methodologies and technologies, as well as the main tools, for descriptive, diagnostic, predictive and prescriptive data analytics. A special emphasis will be placed on the implementation of projects by means of tools that are market leaders when the course is delivered based on objective evaluations, like the ones of Gartner’s Magic Quadrants. In addition to general data analytics, this course will place a particular emphasis on the application of this activity to particularly innovative contexts, such as log mining, cognitive reasoning, social networks and the Internet of Things.
Students will be able to work in team with other colleagues in order to carry out some projects that will allow them to put into practice the knowledge acquired over time. In particular, each team will carry out a descriptive, diagnostic, predictive and prescriptive data analytics project using alternative tools that are leaders in Gartner's Magic Quadrants. After this, they will carry out a log mining project, another project that uses a cognitive reasoning tool and a project for the extraction of knowledge related to social networks and the Internet of Things.
This course is strongly based on the realization of projects to be carried out in groups and on brainstorming. This method favors the development of several transversal skills such as the capability of working in a team, conflict management, effective communication, listening capability and of synthesize different ideas. The necessity to process data coming from heterogeneous contexts (such as the economic, financial and medical ones) will also favor the capability of dealing with scenarios very challenging scenarios. This will allow them to experience in advance a modus operandi typical of the job’s world.
Teoria
- Richiami di Big Data Analytics (0.5 CFU)
- Richiami di Statistica (1 CFU)
- Richiami di Data Mining e Machine Learning (0.5 CFU)
- Anomaly e Outlier Detection (0.5 CFU)
- Le Serie Temporali (0.5 CFU)
- La Social Network Analysis (1 CFU)
- Il Natural Language Processing (0.5 CFU)
- La Sentiment Analysis (0.5 CFU)
- Il Cognitive Computing e i chatbot (0.5 CFU)
Esercitazioni
- Un tool di Data Analytics Descrittiva e Diagnostica: Qlik Sense (0.25 CFU)
- Un tool di Data Analytics Descrittiva, Diagnostica e Predittiva: Tableau (0.25 CFU)
- Un tool di Data Analytics Descrittiva, Diagnostica, Predittiva e Prescrittiva: Microsoft Power BI e suoi plug-in (1 CFU)
- Ecosistema Python per la Data Science: Pandas, Scikit Learn e Statsmodel (0.5 CFU CFU)
- Un tool di Social Network Analysis: Python NetworkX (0.5 CFU)
- La tecnologia RASA per la costruzione di un chatbot (1 CFU)
La versione dettagliata del programma del corso si trova nella pagina del corso presente sul sito di e-learning dell'Università.
Theory
- Big Data Analytics Recalls (0.5 ECTs)
- Statistics Recalls (1 ECT)
- Data Mining and Machine Learning Recalls (0.5 ECTs)
- Anomaly and Outlier Detection (0.5 ECTs)
- Time Series (0.5 ECTs)
- Social Network Analysis (1 ECT)
- Natural Language Processing (0.5 ECT)
- Sentiment Analysis (0.5 ECTs)
- Cognitive Computing and Chatbots (0.5 ECTs)
Exercises
- A tool for Descriptive and Diagnostic Data Analytics: Qlik Sense (0.25 ECTs)
- A tool of Descriptive, Diagnostic and Predictive Data Analytics: Tableau (0.25 ECTs)
- A tool for Descriptive, Diagnostic, Predictive and Prescriptive Data Analytics: Microsoft Power BI and its plug-ins (1 ECT)
- Python Ecosystem for Data Science: Pandas, Scikit Learn and Statsmodel (0.5 ECT)
- A tool for Social Network Analysis: Python NetworkX (0.5 ECTs)
- RASA technology for building a chatbot (1 ECT)
The detailed program is available at the e-learning site of the University at the address https://learn.univpm.it
L’esame prevede la realizzazione di alcune tesine e una prova orale in cui si discuteranno le tesine realizzate e verranno approfonditi gli aspetti
teorici che ad esse si riferiscono. Le tesine, da svolgersi in gruppo, richiederanno l’utilizzo di Qlik Sense, Tableau, PowerBI, Splunk, Watson, Python e le sue librerie per la Data Analytics e la Network Analysis e per estrarre conoscenza da uno o più insiemi di dati reali provenienti da contesti scelti dagli studenti. Durante il corso verranno condotte delle sessioni di brainstorming dove ciascun gruppo presenterà il proprio lavoro e gli altri gruppi potranno intervenire per osservazioni, suggerimenti, etc.
Per superare l’esame lo studente deve dimostrare, attraverso i progetti, di aver compreso i concetti fondamentali del corso e di aver acquisito competenze sui tool di Data Analytics descrittiva, diagnostica, predittiva e prescrittiva, di log mining, di cognitive reasoning e di social network analysis.
La valutazione massima è attribuita agli studenti che dimostrano un’ottima conoscenza dei tool, un’ottima capacità di costruire dei progetti che utilizzino tali tool, un’approfondita conoscenza dei contenuti dell’insegnamento, rigore metodologico ed appropriatezza del vocabolario tecnico.
Viene attribuito un voto in trentesimi con eventuale lode
Il voto complessivo dipende principalmente dalla qualità dei progetti e dal contributo che lo studente dimostrerà di aver dato ad essi nonché dalla padronanza sugli argomenti del corso che lo studente dimostrerà durante la prova orale.
The exam includes the realization of some projects and an oral test in which the realized projects will be discussed in such a way as to deepen the theoretical aspects that refer to them. Projects, to be realized in groups, will require the use of Qlik Sense, Tableau, PowerBI, Splunk, Watson, Python and its libreries for Data Analysics and Network Analysis, to extract knowledge from one or more sets of real data from contexts chosen by students. During the course several brainstorming sessions will be conducted, where each group will present its project and the other groups can intervene for comments, suggestions, etc.
To pass the exam, students must prove, through their projects, that they have understood the fundamental concepts of the course and have acquired skills in the tools of descriptive, diagnostics, predictive and prescriptive Data Analytics, log mining, cognitive reasoning and social network analysis.
The highest evaluation is given to students who demonstrate an excellent knowledge of tools, an excellent ability to build projects that use these tools, a thorough knowledge of the contents of the course, methodological rigor and appropriateness of the technical vocabulary.
A score in thirtieths is given, possibly cum laude
The overall score depends mainly on the quality of the projects, on the contribution that the student will provide to their realization, as well as on the knowledge of the topics of the course that the student will show during the oral exam.
• T. Erl, W. Khattak, P. Buhler, “Big Data Fundamentals – Concepts, Drivers & Techniques”, Prentice Hall, 2015.
• J. Hurwitz, M Kaufman, A. Bowles, “Cognitive Computing and Big Data Analytics”, Prentice Hall, 2015
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011
Dispense fornite dal docente
Materiale didattico disponibile sul sito https://learn.univpm.it/
• T. Erl, W. Khattak, P. Buhler, “Big Data Fundamentals – Concepts, Drivers & Techniques”, Prentice Hall, 2015.
• J. Hurwitz, M Kaufman, A. Bowles, “Cognitive Computing and Big Data Analytics”, Prentice Hall, 2015
• M. Tsvetovat, A. Kouznetsov, “Social Network Analysis for Startups”, O’Reilly, 2011
Notes provided by Professor
Educational material available at the site https://learn.univpm.it/
No
No
Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427