IoT Prism Lab
Research Lab at University of Bologna
Research Lab at University of Bologna
Theses
2018 |
Valentini, Alice Evaluation of deep learning techniques for object detection on embedded systems Masters Thesis 2018. Abstract | Links | BibTeX | Tags: area surveying, deep learning, drones, DRONI, Machine Learning, object detection, UAV, yolo @mastersthesis{amslaurea15478, title = {Evaluation of deep learning techniques for object detection on embedded systems}, author = {Alice Valentini}, url = {https://amslaurea.unibo.it/id/eprint/15478}, year = {2018}, date = {2018-01-01}, abstract = {Area surveying is an important tool used to inspect and study in detail a given area, it is especially useful to monitor the movements and the settlement of populations located in a developing country. Unmanned Aerial Vehicles (UAV), given the recent developments, could represent a suitable technology in order to carry out this task in an easier and cheaper way. The use of UAV based surveys techniques poses many challenges in terms of accuracy, speed and efficiency. The target is to build an autonomous flight system which is able to define optimal flight paths using the gathered information from the environment. In this thesis we will focus on the development of the perception system which has to capture the desired information with accurate and fast detections. More in detail, we will explore and evaluate the use of object detection models based on Deep Learning techniques who will sense and collect data which will later use for on-board elaboration. The object detection model has to be accurate in order to detect all the objects encountered on the ground and fast in order to not introduce too much latency into the on-board decision system. Fast and accurate decisions could permit an efficient coverage of the area. Different embedded platforms will be considered and examined in order to meet the model's computational requirements and to provide an efficient use in terms of battery consumption. Different training configurations will be tested in order to maximize our detection accuracy metric, minimum average precision (mAP). The detection speed will be then evaluated on our board using Frame Per Second (FPS) metric. In addition to YOLO we also tested TinyYOLO, a smaller and faster network. Results will be then compared in order to find the best configuration in terms of accuracy/speed. We will show that our system is able to meet all the requirements even if we do not achieve our ideal detection speed.}, keywords = {area surveying, deep learning, drones, DRONI, Machine Learning, object detection, UAV, yolo}, pubstate = {published}, tppubtype = {mastersthesis} } Area surveying is an important tool used to inspect and study in detail a given area, it is especially useful to monitor the movements and the settlement of populations located in a developing country. Unmanned Aerial Vehicles (UAV), given the recent developments, could represent a suitable technology in order to carry out this task in an easier and cheaper way. The use of UAV based surveys techniques poses many challenges in terms of accuracy, speed and efficiency. The target is to build an autonomous flight system which is able to define optimal flight paths using the gathered information from the environment. In this thesis we will focus on the development of the perception system which has to capture the desired information with accurate and fast detections. More in detail, we will explore and evaluate the use of object detection models based on Deep Learning techniques who will sense and collect data which will later use for on-board elaboration. The object detection model has to be accurate in order to detect all the objects encountered on the ground and fast in order to not introduce too much latency into the on-board decision system. Fast and accurate decisions could permit an efficient coverage of the area. Different embedded platforms will be considered and examined in order to meet the model's computational requirements and to provide an efficient use in terms of battery consumption. Different training configurations will be tested in order to maximize our detection accuracy metric, minimum average precision (mAP). The detection speed will be then evaluated on our board using Frame Per Second (FPS) metric. In addition to YOLO we also tested TinyYOLO, a smaller and faster network. Results will be then compared in order to find the best configuration in terms of accuracy/speed. We will show that our system is able to meet all the requirements even if we do not achieve our ideal detection speed. |
2017 |
Vecchio, Matteo Del Un'applicazione iOS per il riconoscimento di medicinali mediante reti neurali Masters Thesis 2017. Abstract | Links | BibTeX | Tags: applicazione iOS, classificazione, deep learning, fine tuning, gpu, iOS, Machine Learning, medicinali, metal performance shaders, mobile, python, reti neurali convoluzionali, riconoscimento, Smartphone, Swift, training, transfer learning @mastersthesis{amslaurea14890, title = {Un'applicazione iOS per il riconoscimento di medicinali mediante reti neurali}, author = {Matteo Del Vecchio}, url = {https://amslaurea.unibo.it/id/eprint/14890}, year = {2017}, date = {2017-01-01}, abstract = {Negli ultimi anni il Machine Learning e svariate sue applicazioni si sono prepotentemente affermati in molte aree, sia dell'informatica che della vita quotidiana, a partire dalle semplici operazioni svolte con uno smartphone. Un campo in cui si sono avuti notevoli risultati è quello della Visione Artificiale, ovvero dare la possibilità ad una macchina di "vedere" ed apprendere informazioni da immagini e fotografie. In questa tesi si affronta il problema di riconoscere un medicinale partendo dalla foto di una pillola, attraverso la creazione di una rete neurale convoluzionale (o ConvNet) e soprattutto, della sua implementazione all'interno di un'applicazione iOS che possa permettere la classificazione in mobilità. Si partirà dal considerare gli aspetti teorici alla base delle reti neurali, per poi illustrare lo stato dell'arte e le caratteristiche specifiche del modello convoluzionale. In seguito, si illustrerà PillRecogNet, la ConvNet realizzata e specializzata nel riconoscimento di 12 medicinali, insieme ad alcune delle tecniche utilizzare per l'allenamento, quali il transfer learning ed il fine tuning, e le relative statistiche sull'accuratezza. Sebbene una rete neurale convoluzionale sia un modello computazionalmente oneroso, si mostrerà com'è stato possibile implementare PillRecogNet in un'applicazione per smartphone, descrivendo prima alcune delle possibile tecnologie utilizzabili e, in seguito, le scelte implementative effettuate al fine di poter sfruttare la capacità di calcolo delle GPU dei dispositivi mobili. Infine, si mostreranno i risultati promettenti ottenuti, sia riguardo l'esecuzione di un modello da circa 28 milioni di parametri in uno smartphone, sia riguardo possibili sviluppi futuri quali l'utilizzo dell'applicazione in campo medico per la supervisione di una terapia farmacologica da parte del personale sanitario.}, keywords = {applicazione iOS, classificazione, deep learning, fine tuning, gpu, iOS, Machine Learning, medicinali, metal performance shaders, mobile, python, reti neurali convoluzionali, riconoscimento, Smartphone, Swift, training, transfer learning}, pubstate = {published}, tppubtype = {mastersthesis} } Negli ultimi anni il Machine Learning e svariate sue applicazioni si sono prepotentemente affermati in molte aree, sia dell'informatica che della vita quotidiana, a partire dalle semplici operazioni svolte con uno smartphone. Un campo in cui si sono avuti notevoli risultati è quello della Visione Artificiale, ovvero dare la possibilità ad una macchina di "vedere" ed apprendere informazioni da immagini e fotografie. In questa tesi si affronta il problema di riconoscere un medicinale partendo dalla foto di una pillola, attraverso la creazione di una rete neurale convoluzionale (o ConvNet) e soprattutto, della sua implementazione all'interno di un'applicazione iOS che possa permettere la classificazione in mobilità. Si partirà dal considerare gli aspetti teorici alla base delle reti neurali, per poi illustrare lo stato dell'arte e le caratteristiche specifiche del modello convoluzionale. In seguito, si illustrerà PillRecogNet, la ConvNet realizzata e specializzata nel riconoscimento di 12 medicinali, insieme ad alcune delle tecniche utilizzare per l'allenamento, quali il transfer learning ed il fine tuning, e le relative statistiche sull'accuratezza. Sebbene una rete neurale convoluzionale sia un modello computazionalmente oneroso, si mostrerà com'è stato possibile implementare PillRecogNet in un'applicazione per smartphone, descrivendo prima alcune delle possibile tecnologie utilizzabili e, in seguito, le scelte implementative effettuate al fine di poter sfruttare la capacità di calcolo delle GPU dei dispositivi mobili. Infine, si mostreranno i risultati promettenti ottenuti, sia riguardo l'esecuzione di un modello da circa 28 milioni di parametri in uno smartphone, sia riguardo possibili sviluppi futuri quali l'utilizzo dell'applicazione in campo medico per la supervisione di una terapia farmacologica da parte del personale sanitario. |