Stampa
Chiudi

Codice
DBS122
Struttura  Moduli 1 / 3 gg
Coordinamento Didattico  Osvaldo Prosperi


Il corso inquadra gli aspetti metodologici e tecnologici del Data Mining (DM), varietà di tecniche di analisi dei dati finalizzata alla ricerca di informazioni di carattere generale (interpretazione di fenomeni, individuazione di tendenze, previsione di andamenti) e/o particolare (individuazione di anomalie, deviazioni dalla norma ), utilizzate sia per attività di tipo tradizionale - dall’analisi di mercato (Target Marketing, Customer Relationship Management, Basket Market Analysis), all’individuazione di frodi, - sia per interventi alle decisioni e alle applicazioni legate al Web (Clickstream Analysis, Web Mining).

Metodologia didattica
Il corso prevede, oltre alla descrizione teorica degli argomenti trattati, una rilevante attività di laboratorio “hands on” nella quale verranno presentati diversi casi di studio. Ogni partecipante avrà a disposizione almeno un PC, opportunamente configurato con l’ambiente software di supporto.

Destinatari
Progettisti e responsabili di sistemi informativi; analisti programmatori; amministratori di database.

Prerequisiti
Conoscenza dei DBMS ed elementi di analisi dati

Risultati attesi
- Comprendere le finalità ed i benefici del data mining.
- Conoscere i principali campi d’applicazione del data mining.
- Conoscere le principali tecniche di analisi dei dati.
- Conoscere alcuni strumenti software (commerciali e open-source) necessari per l’analisi dei dati.

 

Information Technology

Data mining: tecniche di analisi

 

Programma

Introduzione al Data Mining  
- Introduzione al Data Mining: fondamenti, problemi ed applicazioni
- Il ruolo dei modelli nel Data Mining
- Il ruolo degli algoritmi nel Data Mining
- Addestramento, verifica e validazione
- Tipo di dati e spazi di rappresentazione
- Apprendimento supervisionato
- Apprendimento non supervisionato


Strumenti per il Data Mining
- Categorie di software
- Introduzione al software Weka
- Uso di Weka per filtraggio, visualizzazione dei dati, clustering


Modelli ad algoritmi per il Data Mining
- Gli alberi di decisione
- Regole Associative
- Clustering
- Apprendimento genetico
- Metodi statistici
- Le reti neurali


Casi di studio
- Selezione della clientela per un servizio di telefonia
- Selezione del personale per una ditta di distribuzione

Il corso prevede lo svolgimento di alcuni semplici esercizi tramite il foglio elettronico Excel Microsoft. Sarà inoltre impiegato estensivamente il software open source per il Data Mining Weka, sviluppato e distribuito dalla University of Waikito, Nuova Zelanda (www.cs.waikato.ac.nz/ml/weka) ed il software commerciale Microsoft SQL Server 2005 (modulo Analysis Services). Il materiale didattico del corso è costituito dalle slides impiegate in aula e dagli esercizi proposti. I testi consigliati per la preparazione sono Roiger R.J., Geatz M. W., Introduzione al Data Mining, McGrow Hill 2004, Milano, e Berry M. J., Linoff G. S., Data Mining, Apogeo 2001, Milano.