ITALIANO
Italian
Conoscenza dei modelli di rappresentazione e dei linguaggi di interrogazione delle basi di dati
Knowledge of database models and query languages
48 ore di teoria
10 ore di esercitazioni
14 ore di laboratorio
Theory: 48 hours
Exercises: 10 hours
Laboratory: 14 hours
L’insegnamento ha la finalità di fornire allo studente le conoscenze su metodologie, modelli e tecniche di gestione, elaborazione e analisi di grandi moli di dati per il supporto alle decisioni, comprendendo i vantaggi e i limiti delle diverse soluzioni. Lo studente acquisirà inoltre conoscenze sugli aspetti prestazionali e architetturali, con particolare riferimento alle architetture distribuite e di Cloud Computing per la memorizzazione e l’analisi dei dati.
Sulla base del contesto applicativo, dei dati e degli obiettivi decisionali, lo studente sarà in grado di progettare un Data Warehouse e progettare processi di Data Mining. Inoltre, sarà in grado di applicare le principali tecniche di Machine Learning, utilizzare i principali strumenti per la gestione e l’elaborazione di Big Data, e analizzare criticamente la qualità dei risultati ottenuti.
Lo studio basato su materiali diversi, ed in particolare su articoli scientifici, contribuirà allo sviluppo di capacità di apprendimento in autonomia e di sintesi. Lo sviluppo e la presentazione di progetti di gruppo concorreranno al miglioramento delle capacità comunicative e relazionali dello studente.
The course aims to provide students with knowledge on methodologies, tools and techniques for the management, processing and analysis of Big Data to
support decisions, understanding advantages and limits of different solutions. The student will also acquire knowledge about performance and architectural aspects, with special emphasis on distributed and Cloud Computing architectures for data storage and analysis.
Based on data, application domain and goals, the student will be able to design both a Data Warehouse and Data Mining processes. Furthermore, the student will be able to apply the main Machine Learning techniques, to use main tools for the management and analysis of Big Data, to critically evaluate the quality of results.
The study based on different materials, and in particular on research articles, will contribute to the development of autonomous learning and synthesis skills. The development and presentation of team projects will contribute to the improvement of communication and interpersonal skills.
Introduzione ai Big Data.
Introduzione al Cloud Computing.
Data Warehouse: sistemi direzionali e di supporto alle decisioni, modello multidimensionale, architettura di un Data Warehouse, operatori OLAP, modelli logici, progettazione concettuale.
Data Mining: Il processo di Knowledge Discovery in Databases, cenni alle tecniche di data pre-processing, tecniche di Data Mining, Machine Learning. Process Mining.
I principali strumenti per il Data Analytics.
Sono previste esercitazioni ed attività di laboratorio sugli strumenti di gestione ed analisi dei Big Data, sulla progettazione di datawarehouse, e sulle principali tecniche di Data Mining e Machine Learning.
Introduction to Big Data.
Introduction to Cloud Computing.
Data Warehouse: Decision support information systems, multidimensional model, Data Warehouse architecture, OLAP operators, logical models, conceptual design.
Data Mining: Knowledge Discovery in Databases process, elements of pre-processing techniques, Data Mining techniques, Machine Learning. Process Mining.
Tools for Data Analytics.
Lab activities and exercises are planned on the management and analysis of Big Data, on the design of the data warehouse, and on the main Data Mining and Machine Learning techniques.
La valutazione del livello di apprendimento degli studenti consiste in due prove: lo sviluppo di un progetto ed una prova orale. Nello sviluppo di un progetto lo studente approfondisce ed applica le conoscenze acquisite durante il corso. Il progetto può essere svolto in gruppo, composto al massimo da tre studenti. Per lo sviluppo dei progetti sono previste revisioni periodiche nelle quali è richiesto agli studenti di svolgere una presentazione orale dei risultati del progetto, e la stesura di una relazione che documenta le attività svolte ed i risultati ottenuti. La prova orale consistente nell'esposizione di concetti e basi teoriche sui temi trattati nel corso. Le due prove possono essere effettuate in qualsiasi ordine.
Per superare con esito positivo la valutazione dell'apprendimento, lo studente deve dimostrare, attraverso le prove prima descritte, di aver ben compreso i concetti esposti nel corso sul data analytics e deve dimostrare capacità di approfondimento, capacità critica e di problem solving nella esecuzione delle attività di progetto. Durante le prove viene valutato il grado di completezza ed approfondimento raggiunto nella conoscenza e comprensione dei contenuti del corso. Viene valutata inoltre la capacità di applicare in maniera corretta ed autonoma modelli e metodologie per la risoluzione di problemi.
Viene attribuito un voto finale in trentesimi, con eventuale lode. Il voto minimo per il superamento dell’esame è 18/30.
Il voto finale in trentesimi è ottenuto sommando il punteggio del progetto (da 0 a 6 punti) a quello della prova orale (da 0 a 24 punti). Affinchè la valutazione finale sia positiva, lo studente deve conseguire almeno 15 punti nella prova orale, dimostrando un livello di conoscenza e comprensione sufficiente sugli argomenti esposti, e una votazione maggiore di zero nel progetto, legata al raggiungimento degli obiettivi fissati. La valutazione massima è raggiunta dimostrando una conoscenza approfondita dei contenuti del corso e ottime capacità e autonomia di svolgimento del progetto, che deve essere sviluppato in maniera ampia e approfondita. La lode è riservata agli studenti che abbiano dimostrato una particolare brillantezza nella esposizione orale e nello sviluppo del progetto.
Evaluation is based on two tests: The development of a project and an oral exam. The development of the project allows student to deepen and apply topics of of the course. The project can be done in groups, composed of a maximum of three students. For the development of the projects periodic reviews are planned, in which students are required to organize an oral presentation of the project results, and the production of a report documenting the activities undertaken and the results obtained. The oral exam consists of the exposition of concepts and theoretical aspects on topics covered in the course. The two tests can be performed in any order.
In order to successfully pass the assessment of learning, the student must demonstrate, through the procedure described above, both a good understanding of concepts presented in the course on data analytics and deepening, critical thinking and problem solving abilities in the execution of project activities. During the tests it is assessed the degree of completeness and depth achieved in knowledge and understanding of the contents. It is also assessed the ability to use in a correct and autonomous way models and methodologies for solving problems.
The final mark is between 0 and 30, with possible praise. The minimum mark for passing the exam is 18/30.
The final mark (between 0 and 30) is the sum of the score of the project (between 0 and 6) and the score of the oral exam (between 0 and 24). In order for the final evaluation to be positive, the student must achieve a pass in the oral exam (equal to or greater than 15 points), demonstrating a basic level of knowledge and understanding on the topics covered in the test, and a score greater than zero in the project, depending on the achievement of objectives. The highest rating is achieved by demonstrating a thorough understanding of the course content and excellent ability to carry out the project. The praise is reserved for students who have demonstrated a particular brilliance in oral exposure and development of the project.
Matteo Golfarelli, Stefano Rizzi, Data Warehouse - Teoria e pratica della progettazione 2/ed, mcgraw-hill, 2006;
P. Atzeni, S. Ceri, S. Fraternali, S. Paraboschi, R. Torlone, Basi di Dati: architetture e linee di evoluzione, McGraw-Hill, 2007;
Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar, Introduction to Data Mining, Addison-Wesley.
Eventuale altro materiale didattico che sarà messo a disposizione sul sito del corso (https://learn.univpm.it/).
Matteo Golfarelli, Stefano Rizzi, Data Warehouse - Teoria e pratica della progettazione 2/ed, mcgraw-hill, 2006;
P. Atzeni, S. Ceri, S. Fraternali, S. Paraboschi, R. Torlone, Basi di Dati: architetture e linee di evoluzione, McGraw-Hill, 2007;
Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar, Introduction to Data Mining, Addison-Wesley.
Further material provided by the teacher through the course site (https://learn.univpm.it/).
NO
NO
Università Politecnica delle Marche
P.zza Roma 22, 60121 Ancona
Tel (+39) 071.220.1, Fax (+39) 071.220.2324
P.I. 00382520427