IoT Prism Lab
Research Lab at University of Bologna
Research Lab at University of Bologna
Theses
2019 |
Giosa, Matteo De Progettazione e validazione di un framework di algoritmi ensemble per la classificazione di Open Data IoT Masters Thesis 2019. Abstract | Links | BibTeX | Tags: classification, ensemble, ensemble learning, Internet of Things, IoT, Machine Learning, Open Data, open data iot, supervised learning, thingspeak, timeseries classification @mastersthesis{amslaurea19600, title = {Progettazione e validazione di un framework di algoritmi ensemble per la classificazione di Open Data IoT}, author = {Matteo De Giosa}, url = {https://amslaurea.unibo.it/id/eprint/19600}, year = {2019}, date = {2019-01-01}, abstract = {La quantità di dati IoT liberamente accessibili in rete - comunemente chiamati Open Data - è potenzialmente di grande utilità per innumerevoli applicazioni pratiche. Tuttavia, tali dati sono spesso inutilizzabili o incomprensibili, al punto in cui talvolta non si riesce nemmeno a discernere la tipologia di osservazione effettuata. Per etichettare tali misurazioni è dunque necessaria l’applicazione di modelli di classificazione. Questo tuttavia non è un lavoro semplice, in quanto i dati open sono in generale molto eterogenei, per cui molti degli algoritmi comunemente usati in letteratura hanno difficoltà a classificarli correttamente. Il contributo maggiore di questa tesi è perciò la presentazione di MACE, un framework ensemble per la classificazione di Open Data IoT: dopo averne trattato progettazione ed implementazione, ne valuteremo le performance, dimostrando la sua efficacia nel risolvere quello che è, ad oggi, un problema decisamente trascurato dalla letteratura.}, keywords = {classification, ensemble, ensemble learning, Internet of Things, IoT, Machine Learning, Open Data, open data iot, supervised learning, thingspeak, timeseries classification}, pubstate = {published}, tppubtype = {mastersthesis} } La quantità di dati IoT liberamente accessibili in rete - comunemente chiamati Open Data - è potenzialmente di grande utilità per innumerevoli applicazioni pratiche. Tuttavia, tali dati sono spesso inutilizzabili o incomprensibili, al punto in cui talvolta non si riesce nemmeno a discernere la tipologia di osservazione effettuata. Per etichettare tali misurazioni è dunque necessaria l’applicazione di modelli di classificazione. Questo tuttavia non è un lavoro semplice, in quanto i dati open sono in generale molto eterogenei, per cui molti degli algoritmi comunemente usati in letteratura hanno difficoltà a classificarli correttamente. Il contributo maggiore di questa tesi è perciò la presentazione di MACE, un framework ensemble per la classificazione di Open Data IoT: dopo averne trattato progettazione ed implementazione, ne valuteremo le performance, dimostrando la sua efficacia nel risolvere quello che è, ad oggi, un problema decisamente trascurato dalla letteratura. |
2017 |
Carpineti, Claudia Sensors relevance analysis for transportation mode recognition Masters Thesis 2017. Abstract | Links | BibTeX | Tags: classification, Machine Learning, sensors, transportation mode recognition @mastersthesis{amslaurea13298, title = {Sensors relevance analysis for transportation mode recognition}, author = {Claudia Carpineti}, url = {https://amslaurea.unibo.it/id/eprint/13298}, year = {2017}, date = {2017-01-01}, abstract = {Identificare la mobilità di un utente attraverso la sua osservazione, o l’osservazione dell’ambiente, è un tema di ricerca di crescente interesse, con numerose applicazioni. La maggior parte dei lavori accademici trae vantaggio dalla diffusione dei cellulari, utilizzando i dati derivati dai sensori e le tecniche di apprendimento automatico, per inferire la mobilità dell’utente. Una limitazione di questi lavori è l’utilizzo di dataset creati ad hoc. Essi, infatti, raccolgono i dati dei soli sensori di loro interesse, hanno una base utente ridotta e prevedono processi di collezione in condizioni non reali. Come conseguenza, i risultati dei lavori non sono fra loro confrontabili. Il primo obiettivo di questa tesi è stato la costruzione di un dataset che superasse le suddette limitazioni. Il dataset ottenuto distingue cinque attività: stare in macchina, in autobus, in treno, fermi e camminare. Il dataset è stato utilizzato per la costruzione di modelli di classificazione della mobilità, raggiungendo un livello massimo di accuratezza del 96%. Si è indagato sull’importanza dei sensori nel riconoscimento delle singole attività. A tal fine, sono stati definiti tre insiemi di dati: il primo composto dai dati derivati da tre soli sensori (accelerometro, giroscopio e microfono), il secondo da tutti i dati dei sensori ad esclusione di quelli derivati dal GPS e l’ultimo dai dati di tutti i sensori disponibili. I risultati ottenuti mostrano come all’aumentare dei sensori, aumenti l’accuratezza. Non tutte le classi di attività, però, traggono lo stesso beneficio dall’aumento di informazione. L’analisi di queste differenze permette di individuare quali sensori sono più utili all’individuazione di ogni singola attività. Questi ultimi risultati suggeriscono la possibilità di scegliere il set di sensori da utilizzare sulla base delle attività da riconoscere.}, keywords = {classification, Machine Learning, sensors, transportation mode recognition}, pubstate = {published}, tppubtype = {mastersthesis} } Identificare la mobilità di un utente attraverso la sua osservazione, o l’osservazione dell’ambiente, è un tema di ricerca di crescente interesse, con numerose applicazioni. La maggior parte dei lavori accademici trae vantaggio dalla diffusione dei cellulari, utilizzando i dati derivati dai sensori e le tecniche di apprendimento automatico, per inferire la mobilità dell’utente. Una limitazione di questi lavori è l’utilizzo di dataset creati ad hoc. Essi, infatti, raccolgono i dati dei soli sensori di loro interesse, hanno una base utente ridotta e prevedono processi di collezione in condizioni non reali. Come conseguenza, i risultati dei lavori non sono fra loro confrontabili. Il primo obiettivo di questa tesi è stato la costruzione di un dataset che superasse le suddette limitazioni. Il dataset ottenuto distingue cinque attività: stare in macchina, in autobus, in treno, fermi e camminare. Il dataset è stato utilizzato per la costruzione di modelli di classificazione della mobilità, raggiungendo un livello massimo di accuratezza del 96%. Si è indagato sull’importanza dei sensori nel riconoscimento delle singole attività. A tal fine, sono stati definiti tre insiemi di dati: il primo composto dai dati derivati da tre soli sensori (accelerometro, giroscopio e microfono), il secondo da tutti i dati dei sensori ad esclusione di quelli derivati dal GPS e l’ultimo dai dati di tutti i sensori disponibili. I risultati ottenuti mostrano come all’aumentare dei sensori, aumenti l’accuratezza. Non tutte le classi di attività, però, traggono lo stesso beneficio dall’aumento di informazione. L’analisi di queste differenze permette di individuare quali sensori sono più utili all’individuazione di ogni singola attività. Questi ultimi risultati suggeriscono la possibilità di scegliere il set di sensori da utilizzare sulla base delle attività da riconoscere. |