Introduzione al Data Science

La disponibilità di grandi quantitativi di dati prodotti da fonti eterogenee(internet, log, chat, testi, social, documenti, etc…) ha spostato l’attenzione dalle infrastrutture informatiche alle tecniche di analisi al fine di identificare schemi latenti, ovvero, pattern nascosti di forte impatto di business.
Anche il termine impresa 4.0, sta a sottolineare l’importanza di una gestione sistematica dell’informazione attraverso metodi di stampo statistico in grado di creare analisi prescrittive alla base dei sistemi ‘intelligenti’, questi ultimi capaci di innescare un apprendimento di tipo automatico.
In questo scenario, chi lavora nell’IT, spesso non possiede competenze di tipo statistico e, questo, rischia di far perdere competitività all’azienda nell’era dell’impresa 4.0 .
Il corso, intende introdurre i discenti al metodo statistico e, più nel dettaglio, alle tecniche di Data Mining utilizzate nella produzione di algoritmi di machine learning.
Dopo una breve introduzione sulla configurazione dell’ecosistema informatico, il corso affronta i problemi dell’ingestion dei dati su ambienti Big Data, per proseguire con le tecniche di parsing dell’informazione e di data analysis attraverso procedure supervisionate, non supervisionate ed ensemble.

  • L’ingestion dei dati in ambienti Big Data
  • Il parsing delle variabili attraverso procedure di data cleaning e di anamaly detection
  • Procedure di mapping e di text mining per il trattamento dell’informazione destrutturata
  • Modelli di data mining per la costruzione di algoritmi di apprendimento automatico attraverso procedure di classificazione di tipo supervisionato e non
  • Gli alberi decisionali
  • Metodi ensemble quali il random fores

Il corso si rivolge a coloro che lavorano nell’ambito dell’IT e necessitano di completare le proprie competenze con quelle derivanti dalla statistica e dal data modelling.

Questo corso richiede una conoscenza basilare dei data base.

Alla fine del corso, i partecipanti avranno acquisito una corretta comprensione del metodo statistico e delle procedure di apprendimento automatico e sapranno organizzare le informazioni adeguandole alle indicazioni provenienti dall’Impresa 4.0 .

Richiedi informazioni: