L’industrie de la technologie s’intéresse de près à l’apprentissage machine (ML). Si beaucoup s’interrogent encore sur la prise de contrôle des machines, il est vrai qu’une technologie qui apprend et automatise avec l’expérience présente de nombreux avantages.

Selon IDC, les dépenses mondiales pour les systèmes d’intelligence cognitive et artificielle (IA) atteindront 19,1 milliards de dollars en 2018, soit une augmentation de 54,2 % par rapport au montant dépensé en 2017.

Les industries investissant massivement dans des projets qui utilisent des capacités logicielles cognitives et d’IA, le Worldwide Semiannual Cognitive Artificial Intelligence Systems Spending Guide de la société de recherche prévoit que les dépenses en matière de systèmes cognitifs et d’IA atteindront 52,2 milliards de dollars en 2021 et qu’elles atteindront un taux de croissance annuel composé de 46,2 % sur la période de prévision 2016 à 2021.

Alors que l’IA continue à permettre le ML, des solutions existent pour rassembler les technologies afin de soutenir les processus et les tâches liés aux données d’une entreprise.

Le Gartner appelle ces systèmes des plates-formes ML (MLP), qu’il définit comme une application logicielle cohésive qui offre un mélange d’éléments de base essentiels à la fois pour créer de nombreux types de solutions scientifiques de données et pour incorporer ces solutions dans les processus commerciaux, les infrastructures environnantes et les produits.

Le rôle du MLP

Le ML, en tant que sous-ensemble de l’IA, joue un rôle essentiel dans l’analyse de l’entreprise. Les spécialistes des données considèrent les MLP comme un moyen d’intégrer l’IA et la ML dans les transformations numériques de leur organisation.

Sivan Metzger, PDG de ParallelM, explique que le terme MLP est une expression générale qui englobe plusieurs ensembles de solutions, abordant différentes étapes ou stades du chemin de la transformation numérique. « La plupart des organisations ont tendance à aborder leur transformation de manière plutôt sérielle, en identifiant les problèmes commerciaux qu’elles souhaitent résoudre, en engageant des scientifiques, des ingénieurs et des citoyens spécialistes des données, en identifiant, en obtenant et en nettoyant les données qu’elles tentent d’exploiter, en créant différents ensembles de modèles et en les testant de manière itérative avec différents ensembles de données, en déployant et en gérant ces services comme des applications ML en production et en engageant des équipes d’opérationnalisation ML pour gérer et piloter ces services dans les produits », partage Metzger.

Le ML est en train de devenir une force centrale dans de nombreuses industries et la plupart des entreprises finiront par en tirer parti sous une forme ou une autre. « Cela obligera inévitablement les organisations à utiliser plusieurs MLP ou à tirer parti des services d’autres entreprises qui utilisent des MLP en leur nom », déclare Metzger.

Alors que l’industrie se transforme en un monde axé sur la ML, de nombreuses parties en mouvement doivent travailler ensemble pour réussir et apporter un véritable avantage aux organisations. Metzger pense que les MLP continueront à se développer marché par marché, industrie par industrie.

James Heinzman, EVP, solutions pour les services financiers, ThetaRay, explique que la ML est essentiellement un ensemble d’algorithmes mathématiques qui organisent des modèles dynamiques d’associations entre les observations. Les données changent constamment de forme et de texture, et les algorithmes de ML sont conçus pour s’adapter à cela. Ils sont donc idéaux pour détecter des anomalies dans des quantités massives de données.

Grâce à l’accès à ces énormes ensembles de données à grande vitesse, les entreprises augmentent leur avantage concurrentiel en mettant en œuvre des algorithmes sophistiqués, que Susan Kahler, stratège senior en matière de connaissance des clients pour l’IA, SAS, décrit comme étant gourmands en données et gourmands en calculs. « De la détection des fraudes en temps réel à la reconnaissance d’images en passant par une expérience client personnalisée, les algorithmes ML créent un environnement adaptatif où les machines peuvent faire des recommandations pour lesquelles elles n’ont pas été explicitement programmées », explique Mme Kahler.

L’abondance et la complexité des données ainsi que la rapidité avec laquelle elles peuvent être traitées alimentent la croissance et la demande de grandes solutions d’analyse de données. Heinzman suggère que dans le flot de données se trouvent d’énormes opportunités – et c’est là que les algorithmes ML entrent en jeu, permettant aux organisations d’exploiter efficacement la véritable puissance des grandes données.

Utilisateurs cibles

Bien que presque toutes les organisations puissent potentiellement bénéficier du blanchiment d’argent, plusieurs d’entre elles se distinguent par leur adoption précoce.

Selon M. Kahler, le personnage principal d’un MLP se concentre sur le scientifique des données. « En tirant parti d’analyses avancées et de quantités massives de données, ils peuvent tester des hypothèses, faire des déductions et cibler les tendances des entreprises, des consommateurs et du marché. Le spécialiste des données doit être capable de créer une culture de l’analyse qui guide les décisions commerciales. Parmi les autres utilisateurs, on compte le spécialiste des données sur les citoyens et l’analyste commercial », propose-t-elle.

Ces utilisateurs, bien qu’ils ne soient pas aussi compétents en matière d’analyse avancée que le data scientist, jouent néanmoins un rôle essentiel dans la mise en œuvre et l’utilisation d’une plateforme de ML. Ils ont tendance à se concentrer davantage sur les affaires et peuvent exploiter les résultats des algorithmes de ML pour améliorer les processus et les opérations commerciales.

Metzger souligne qu’il existe plusieurs utilisateurs cibles différents, chacun jouant un rôle différent, y compris les scientifiques, les ingénieurs, les développeurs, les citoyens, les équipes MLOps, les analystes commerciaux et les équipes de gouvernance. « Chacun de ces groupes d’utilisateurs cibles aura besoin de ses propres plateformes qui se concentreront sur la résolution de la partie du cycle de vie du ML dont ils sont responsables ».

Heinzman note que le ML a des applications pratiques dans une série d’industries associées à une grande vitesse de transmission des données ainsi qu’à des ensembles de données multi-domaines très importants et diversifiés. Un exemple est la détection de la criminalité financière, du blanchiment d’argent et de la fraude financière, y compris la fraude en ligne, aux distributeurs automatiques et aux cartes. « Il est toutefois important de faire la distinction entre ce que l’on appelle le blanchiment d’argent supervisé et non supervisé », prévient-il.

Le terme ML désigne souvent le ML supervisé où la formation d’une machine est basée sur des exemples fournis par des humains. Par exemple, si vous apprenez à un ordinateur à différencier les couleurs, vous pouvez commencer par lui montrer de nombreux exemples différents des couleurs bleu, jaune et rouge.

Au bout d’un certain temps, l’ordinateur peut reconnaître des nuances de bleu qu’il n’a jamais vues auparavant en se basant sur la similarité de la nuance avec d’autres bleus. Mais si vous lui demandez de reconnaître quelque chose de violet, il peut soit dire « je ne sais pas », soit reconnaître à tort qu’il s’agit de bleu. « Cette méthode de ML est également définie pour les humains. En psychologie, on parle d’apprentissage de concepts ou d’apprentissage catégorique », explique Heinzman.

La ML non supervisée, en revanche, est similaire à la capacité humaine d’apprendre par l’observation, qui est intuitive. « Considérons une forme spécifique d’apprentissage non supervisé, une personne apprenant ce qui est considéré comme normal afin de détecter des anomalies. Dès leur plus jeune âge, les humains sont exposés à un univers défini par leur activité quotidienne. Au bout d’un certain temps, ils développent un sens intuitif de ce qu’est le monde, en d’autres termes, de ce qui est considéré comme normal. Une fois que cela est suffisamment établi, ils sont capables de reconnaître les anomalies et de les analyser », déclare Heinzman.

La ML à haute dimension fonctionne en traitant presque tout type de source de données et en bénéficiant de milliers de dimensions. « Fondamentalement, plus il y a de données disponibles, plus le système est performant pour détecter les anomalies enfouies sous de grosses données qui pourraient être révélatrices de fraude, de cyber-attaques en évolution ou de dysfonctionnements opérationnels. La même technologie de base de détection des anomalies est applicable à toute infrastructure critique, y compris l’énergie, les transports, les télécommunications et les institutions industrielles et financières, pour n’en citer que quelques-unes.

Les menaces primordiales et sans cesse croissantes qui pèsent sur les systèmes critiques de nombreuses organisations dans différents secteurs sont les inconnues. Cela signifie des menaces dont vous n’êtes pas conscient, et dont vous ne savez même pas que vous n’en avez pas conscience. Dans le domaine de la cybersécurité, les anomalies peuvent indiquer une cyber-attaque. Dans le domaine industriel, la détection d’anomalies dans de grandes quantités de données opérationnelles peut indiquer des défaillances de machines critiques. Dans le secteur financier, les anomalies peuvent indiquer une fraude potentielle, des risques de crédit ou des activités de blanchiment d’argent », explique M. Heinzman.

Avantages et limites

Les plates-formes ML, les résultats rapides, l’automatisation et l’amélioration constante permettent d’obtenir toute une série d’avantages.

Metzger pense que les plateformes ML aident à accélérer la progression de l’adoption du ML tout en réduisant les risques qui accompagnent inévitablement l’adoption des applications ML.

La majorité des fournisseurs de ML commercialisent aujourd’hui des plates-formes ou des boîtes à outils qui offrent la possibilité d’intégrer la technologie dans les systèmes et applications existants et de construire des solutions sur une telle plate-forme. « Si cette approche est certainement valable dans certaines circonstances, elle a également un coût, nécessitant un investissement humain monétaire ainsi qu’une expertise, sans parler d’un processus de mise en œuvre à forte intensité de main-d’œuvre et d’un délai de commercialisation plus long.

Nous adoptons ici une position différente en proposant des solutions d’entreprise de bout en bout basées sur la technologie ML, conçues pour répondre à des cas d’utilisation et résoudre des problèmes commerciaux. C’est particulièrement important pour les applications qui exigent précision et rapidité d’exécution, comme la détection des crimes financiers et des fraudes », explique M. Heinzman.

Avec des solutions d’entreprise de bout en bout, les organisations bénéficient de la rapidité, de l’efficacité et de l’efficience dans l’analyse des données et de la précision dans la détection des activités anormales. Ce sont les moteurs de la mise en œuvre de l’intelligence artificielle et du blanchiment d’argent.

Il y a bien sûr des limites à prendre en compte. Il s’agit notamment du biais de commission, de l’accès aux données, du biais d’omission, de l’interprétabilité, du temps de formation et de la taille du modèle, selon Kahler.

Metzger voit deux limitations majeures au ML. La première est que peu d’organisations ont une compréhension complète de ce à quoi elles seront confrontées au fur et à mesure de leur progression et la seconde est que les solutions, le talent, l’expérience et les processus dont elles auront besoin pour atteindre leurs objectifs commerciaux en utilisant le ML.

« Nous ne savons pas encore ce que nous ne savons pas, mais l’industrie dans son ensemble apprendra ensemble, avec différents acteurs émergeant comme les leaders de leur catégorie. Cela permettra en fin de compte de mettre en place les meilleures pratiques, étayées et soutenues par la technologie et les personnes, pour chacune des étapes discutées ».

Pour décrire les limites du ML, Heinzman utilise l’exemple du secteur des services financiers. « Nous ne savons tout simplement pas d’où pourrait venir la prochaine attaque contre les institutions financières ni à quoi elle ressemblera. De plus en plus, les criminels organisés utilisent le blanchiment d’argent pour orchestrer leurs attaques.

De plus, les risques financiers sont devenus si divers qu’il est presque impossible de trouver une seule bonne façon de les réduire. De plus, la fraude multi-canaux rend encore plus difficile à attraper. Elle est dynamique et en constante évolution ».

Selon M. Heinzman, une chose est sûre : les systèmes hérités sur lesquels les institutions financières se sont appuyées ces 40 dernières années pour se protéger contre des éléments tels que la fraude et le blanchiment d’argent ne suffisent plus. « Ces systèmes s’appuient sur des règles historiques ou sur le blanchiment d’argent supervisé, mis en œuvre par les banques pour créer une alerte lorsque des signes d’une menace éventuelle sont détectés. Cette approche fonctionne bien pour détecter les menaces connues et documentées.

Mais les banques d’aujourd’hui sont confrontées à des attaques incessantes de la part de pirates informatiques sophistiqués qui utilisent des fraudes et des cyber-outils avancés pour se faufiler au-delà de leurs défenses et voler les données et l’argent des clients. Les systèmes de blanchiment d’argent supervisés n’ont aucun moyen de reconnaître les nouveaux types de menaces inconnues, et encore moins de passer au crible les montagnes de données clients générées quotidiennement pour repérer les activités suspectes. Au lieu de cela, ils voient une menace dans tout, générant une quantité écrasante de faux positifs qui créent d’énormes goulots d’étranglement et obligent les banques à engager des armées virtuelles d’analystes pour enquêter sur tous ces éléments.

Pire encore, ce faux positif crée d’énormes goulets d’étranglement et oblige les banques à engager des armées virtuelles d’analystes pour enquêter sur tous. Pire encore, cette fatigue des faux positifs peut en fait amener les institutions à passer à côté des vraies menaces. Ces problèmes peuvent être surmontés par un ML sans règles et sans supervision ».

Exemples

Plusieurs plateformes de ML sont disponibles aujourd’hui. Nous soulignons ici les quelques unes qui sont citées dans cet article.

ParallelM se concentre stratégiquement sur ce qu’elle considère comme la partie profonde du déploiement, de la gestion et de l’échelle des applications de ML en production et pour résoudre l’écart entre les MLOps de l’industrie. Sa solution suppose que les modèles ML réels ont été créés et testés sur d’autres plateformes ML qui se concentrent sur la génération et la validation de modèles, transforme les ensembles de modèles en applications ML réelles et, à partir de ce moment, automatise le déploiement et la gestion de ces applications ML sur les moteurs d’analyse pertinents qu’une organisation a choisi pour les exécuter.

La solution fournit une solution de gestion unique permettant aux équipes de MLOps, de science des données, d’informatique, d’analyse commerciale et de gouvernance de collaborer au sein d’une seule et même source de vérité sur ce qui se passe réellement avec ML en production. En outre, elle les aide à se diriger vers le succès ainsi que vers l’expansion et l’échelle des applications de ML qui sont essentielles et qui le deviendront encore plus pour leur entreprise.

SAS fournit une interface visuelle complète pour accomplir toutes les étapes liées au cycle de vie analytique. En plus des techniques innovantes de ML pour l’analyse des données structurées et non structurées, il intègre toutes les autres tâches dans vos processus analytiques. De la préparation et de l’exploration des données au développement et au déploiement de modèles, tout le monde travaille dans le même environnement intégré.

Le traitement évolutif et élastique offre la flexibilité et la rapidité nécessaires pour répondre plus rapidement aux questions complexes de ML. La solution combine les meilleurs algorithmes de ML, la préparation des données, la visualisation, l’évaluation des modèles et le déploiement des modèles dans un environnement unique. L’environnement collaboratif produit des résultats reproductibles, ce qui permet d’améliorer les processus organisationnels et de découvrir de nouvelles possibilités de croissance.

ThetaRay propose des solutions d’intelligence artificielle et de lutte contre le blanchiment d’argent sans supervision, axées sur la détection des crimes financiers, et plus particulièrement sur la lutte contre le blanchiment d’argent dans les domaines de la banque de détail, des correspondants et des entreprises, de la gestion de patrimoine, de la fraude en ligne/multicanal, des assurances et de la sécurité des distributeurs automatiques.

ThetaRay fournit une solution de surveillance et de sécurité conçue pour répondre spécifiquement au risque de menaces futures inconnues. La solution fonctionne en analysant l’activité dans les différents domaines. En observant le comportement de ces systèmes, elle établit une base de référence de ce à quoi ressemble l’activité normale et habituelle.

Lorsqu’une activité inhabituelle se produit, elle est classée en groupes d’événements inoffensifs et ceux qui justifient une enquête plus approfondie de diverses gravités. Les événements détectés comprennent les attaques physiques, les logiciels malveillants et les attaques de réseau, ainsi que les systèmes de blanchiment d’argent, la criminalité financière et le financement du terrorisme, y compris le financement du trafic de drogue et de la traite des êtres humains.

Le Staray peut être considéré comme le dernier niveau de défense pour identifier les risques qui ne sont pas encore connus et suivis par des règles au niveau des composants individuels.

Parmi les principales innovations, citons la détection non supervisée du blanchiment d’argent, l’analyse de données hyperdimensionnelles volumineuses qui génère une amélioration de plus de six fois des taux de détection et l’identification de modèles et de comportements jusqu’alors inconnus.

La détection et la classification précises conduisant à des taux de faux positifs sont exponentiellement inférieures aux technologies existantes – sans règles, modèles, signatures, étiquettes ou formation. La solution d’IA avancée est fournie avec des analystes de données médico-légales et des capacités de flux d’événements ou peut publier les résultats dans des applications SEIM tierces.

L’implémentation d’algorithmes brevetés de la société au sein de sa plate-forme d’analyse est basée sur une détection impartiale grâce à une série d’algorithmes avancés qui peuvent traiter un nombre illimité de caractéristiques des données. Ces attributs le distinguent des systèmes de détection de menaces classiques qui dépendent fortement de la connaissance des événements passés pour former et définir les règles de définition.

La solution fonctionne avec une rapidité, une précision et une échelle sans précédent, ce qui permet aux clients de détecter rapidement et efficacement les menaces inconnues, d’obtenir une valeur mesurable en quelques jours et de réaliser un déploiement complet en quelques semaines. La solution est conteneurisée à l’aide de technologies qui permettent un déploiement rapide. Les installations complètes peuvent être réalisées en moins d’une heure.

Technologie MLP

MLP comprend plusieurs ensembles de solutions qui ciblent les différentes étapes de la transformation numérique d’une entreprise. En identifiant les défis commerciaux, les MLP aident à mieux gérer les processus à l’aide d’algorithmes avancés.