Rendre l’apprentissage automatique accessible à tous
"Beaucoup appellent cela l'ère de l'information", a déclaré Rajive Ganguli, professeur Malcolm McKinnon de génie minier à l'Université de l'Utah. « Il est peut-être plus juste de parler de l’ère des données, car tout le monde n’a pas la capacité de réellement tirer profit de toutes les données qu’il collecte. Beaucoup sont soit perdus dans les données, soit induits en erreur. Pourtant, la promesse d’être informé par les données demeure.
Ganguli, qui est également doyen associé du Collège des mines et des sciences de la Terre, lance UteAnalytics, un logiciel d'analyse gratuit qui rend l'intelligence artificielle (IA) ou l'apprentissage automatique (ML) accessible à tous.
Fondateur du groupe ai.sys à l'Université, Ganguli a déclaré que tant qu'un client connaît ses données, il peut utiliser UteAnalytics pour mieux comprendre les problèmes qu'il tente de résoudre. La mission du groupe de recherche est d'exploiter les données, de modéliser les systèmes et de développer des outils informatiques pour l'éducation et la recherche.
À différents moments, Ganguli a développé des outils ML que ses élèves pourraient utiliser en classe. Il y a des années, il lui est venu à l'esprit que davantage de personnes pourraient bénéficier du ML si seulement son flux de travail et ses outils étaient plus conviviaux. L'étudiant diplômé Lewis Oduro a apporté sa vision à l'enseignement en exploitant les nombreux outils ML du domaine public disponibles pour les programmeurs et en les convertissant en logiciels basés sur Windows.
"L'outil est indépendant du problème", a déclaré Ganguli. « Il peut donc avoir un large groupe d'utilisateurs. Je l’ai utilisé pour une variété de projets dans lesquels je suis impliqué, notamment l’exploitation minière, les sciences de l’atmosphère/qualité de l’air et la COVID/admissions à l’hôpital.
CRÉDIT PHOTO : Rajiv Ganguly
Lewis Oduro (à droite) et Rajiv Ganguly (à gauche).
Il rapporte que des dizaines d'experts en la matière (PME) non-codeurs se sont déjà abonnés pour recevoir le logiciel avant sa sortie officielle. « Beaucoup sont des professionnels dans un large éventail de domaines allant des sciences sociales aux affaires », ainsi que des scientifiques et des ingénieurs.
Conçu pour responsabiliser l'expert du domaine, UteAnalytics permet à un client de nettoyer ses données et de mener une analyse exploratoire des données de différentes manières. Le logiciel permet également aux utilisateurs d'estimer l'effet de chaque entrée sur la sortie, ainsi que de développer des modèles avant de faire des prédictions sur un nouvel ensemble de données.
Daniel Mendoza, qui occupe des postes de professeur au Département des sciences de l'atmosphère et ailleurs à l'Université, est l'un des premiers à adopter le logiciel. Grâce à son travail avec les moniteurs de qualité de l'air sur les trains et les bus électriques UTA dans la vallée du Lac Salé, lui et son équipe ont réussi à collecter plus de huit ans de données sur les niveaux de particules et d'ozone, et récemment, sur les oxydes d'azote.
"Lorsque nous examinons les données spécifiques à un quartier, nous pouvons y accéder et constater réellement certains impacts sur la justice sociale", a rapporté Mendoza l'année dernière. Aujourd'hui, il « utilise UteAnalytics pour analyser rapidement et efficacement les données de température que nous collecterons en temps réel à partir de nos capteurs mobiles et fixes. L’UA donne aux chercheurs le pouvoir d’examiner les données de manière très simple, sans avoir à passer des heures interminables à coder. Les outils inclus facilitent une interprétation approfondie des données et permettent de gagner du temps sans compromettre la fiabilité.
La différence que les données, assistées par les outils UteAnalytics, font dans le travail de Mendoza sur la qualité de l'air a été récemment mise en évidence dans la campagne Urban Heat Watch, impliquant des scientifiques citoyens qui aident à collecter des données dans les rues de Salt Lake Valley. En tant que l'un des trois principaux îlots de chaleur urbains du pays, la région métropolitaine de Salt Lake City dispose d'un programme de surveillance révolutionnaire. Nulle part ailleurs dans le monde une initiative n'existe à une telle densité et à une telle échelle que dans la capitale et ses environs de l'Utah.
UteAnalytics n'est que le dernier livrable de Ganguli, qui a dirigé des projets d'environ 13 millions de dollars en tant qu'investigateur principal. Il est actuellement impliqué dans plusieurs projets dans cinq pays différents – États-Unis, Danemark/Groenland, Mongolie, Arabie Saoudite et Mexique – sur des sujets allant du ML à la formation.
