IoT Prism Lab
Research Lab at University of Bologna
Research Lab at University of Bologna
Theses
2019 |
Maniezzo, Mattia Realizzazione e validazione sperimentale di un dataset open per l'Internet of Things Masters Thesis 2019. Abstract | Links | BibTeX | Tags: classificazione, dataset, Internet of Things, Machine Learning, Open Data @mastersthesis{amslaurea18505, title = {Realizzazione e validazione sperimentale di un dataset open per l'Internet of Things}, author = {Mattia Maniezzo}, url = {https://amslaurea.unibo.it/id/eprint/18505}, year = {2019}, date = {2019-01-01}, abstract = {L'incremento e il continuo sviluppo dei dispositivi inerenti all'Internet of Things (IoT) ha causato un aumento esponenziale dei dati prodotti da ognuno di noi. Oltre all'incremento dei dati generati, è stata resa più semplice la condivisione libera di essi attraverso la rete internet. Una parte dei dati IoT generati dai dispositivi eterogenei possono essere liberamente accessibili e vengono chiamati Open Data, i quali possono essere reperibili in repository pubbliche fornite da enti, organizzazioni e studi/esperimenti, o realizzate da utenti grazie al crowdsourcing. Gli Open Data sono in costante aumento, ma presentano dei problemi come la scarsità di informazioni fornite, come metadati assenti o incompleti, che, a volte, li rendono poco comprensibili. Questo comporta un problema dal punto di vista dell'utilizzo dei dati vista la possibile scarsa riconoscibilità e comprensibilità. Per risolvere questo problema bisogna effettuare operazioni di annotazione e classificazione automatica. Le operazioni necessitano di essere automatiche visto che gli Open Data sono caratterizzati da grandi quantità di dati, quindi farle manualmente è impossibile. par Nello studio sperimentale si è realizzato un dataset contente dati provenienti dalla piattaforma online Thingspeak, che è un repository pubblico che sfrutta il crowdsourcing. Il dataset realizzato è sottoposto ad un'attività di validazione e di sperimentazione. La validazione sperimentale serve per verificare se il dataset realizzato in questo studio si comporta in maniera simile a dataset ottenuti da repository pubbliche fornite da enti e studi/esperimenti esterni. La sperimentazione serve a verificare quale algoritmo di classificazione è più efficiente per i dataset realizzato e quelli considerati, e a confermare che la classificazione basata sulla successione dei dati non funzioni per il tipo di dataset considerato.}, keywords = {classificazione, dataset, Internet of Things, Machine Learning, Open Data}, pubstate = {published}, tppubtype = {mastersthesis} } L'incremento e il continuo sviluppo dei dispositivi inerenti all'Internet of Things (IoT) ha causato un aumento esponenziale dei dati prodotti da ognuno di noi. Oltre all'incremento dei dati generati, è stata resa più semplice la condivisione libera di essi attraverso la rete internet. Una parte dei dati IoT generati dai dispositivi eterogenei possono essere liberamente accessibili e vengono chiamati Open Data, i quali possono essere reperibili in repository pubbliche fornite da enti, organizzazioni e studi/esperimenti, o realizzate da utenti grazie al crowdsourcing. Gli Open Data sono in costante aumento, ma presentano dei problemi come la scarsità di informazioni fornite, come metadati assenti o incompleti, che, a volte, li rendono poco comprensibili. Questo comporta un problema dal punto di vista dell'utilizzo dei dati vista la possibile scarsa riconoscibilità e comprensibilità. Per risolvere questo problema bisogna effettuare operazioni di annotazione e classificazione automatica. Le operazioni necessitano di essere automatiche visto che gli Open Data sono caratterizzati da grandi quantità di dati, quindi farle manualmente è impossibile. par Nello studio sperimentale si è realizzato un dataset contente dati provenienti dalla piattaforma online Thingspeak, che è un repository pubblico che sfrutta il crowdsourcing. Il dataset realizzato è sottoposto ad un'attività di validazione e di sperimentazione. La validazione sperimentale serve per verificare se il dataset realizzato in questo studio si comporta in maniera simile a dataset ottenuti da repository pubbliche fornite da enti e studi/esperimenti esterni. La sperimentazione serve a verificare quale algoritmo di classificazione è più efficiente per i dataset realizzato e quelli considerati, e a confermare che la classificazione basata sulla successione dei dati non funzioni per il tipo di dataset considerato. |