Home Notre offre Modèles prédictifs

Modèles prédictifs

Réalisez des modélisations prédictives à l’aide du machine learning

Alcimed dispose d’une équipe de Data scientists qui vous accompagne dans la construction de modèles prédictifs, par le développement d’algorithmes de data mining ou l’analyse prédictive de données internes et externes à l’aide de modèles allant de la régression linéaire aux réseaux de neurones.

Contactez notre équipe !

modèles prédictifs Agence Cabinet Experts Spécialistes Conseil ConsultingLes enjeux liés AUX modèles prédictifs

  • Qu’est-ce qu’un modèle prédictif ?

Les modèles prédictifs sont le résultat de l’analyse de données passées et présentes, dans le but de prédire des événements ou des résultats à venir. Les modèles prédictifs théorisent ainsi l’évolution future d’une variable grâce à l’identification de motifs dans un grand ensemble de données historiques (on parle souvent de Big Data) obtenu grâce au data mining de sources diverses.

Cette identification se fait désormais de manière automatique à l’aide d’algorithmes et de modèles statistiques théoriques, comme la régression linéaire, les arbres de décision, le clustering par k-moyennes, les réseaux de neurones, ou encore d’autres techniques de machine learning.

  • Quels sont les enjeux liés aux modèles prédictifs et à l’analyse prédictive ?

Le modèle prédictif est un outil d’aide à la décision qui permet d’anticiper les tendances et les comportements futurs, d’améliorer l’efficacité opérationnelle, de réduire les coûts,  de minimiser les risques et plus généralement de rester compétitifs sur un marché.

De nombreux enjeux sont à considérer pour assurer la bonne qualité d’une analyse prédictive et notamment : choisir l’algorithme adéquat, définir un paramétrage et calibrage corrects, et collecter des données d’entraînement en quantité et représentativité suffisantes.

Avant de se lancer dans la construction d’une modélisation prédictive, il est primordial de reformuler votre cas d’usage métier pour mieux définir le but de l’analyse et la manière dont le modèle sera utilisé par vos équipes opérationnelles. En effet, en fonction de la nature de votre objectif (qualitatif ou quantitatif), il faudra préférer les algorithmes de classification ou les algorithmes de régression.

Par exemple, pour optimiser les ventes de votre entreprise, des modèles de régression vous permettront de prédire l’effet de nouvelles campagnes marketing sur votre part de marché (en se basant sur des observations historiques), tandis que la classification pourra vous aider à mieux segmenter votre clientèle et ainsi à mieux guider votre stratégie commerciale par exemple. Une fois ce choix réalisé, il faudra ensuite reconnaître le modèle théorique le plus adapté à votre problématique.

En effet, il existe une multitude d’algorithmes dans chacune de ces deux catégories et faire le bon choix n’est pas toujours aisé : comment choisir entre une régression linéaire ou polynomiale et une régression logistique, comment choisir entre un arbre de décision, une SVM ou un réseau de neurones… Leurs caractéristiques techniques rendront ces techniques plus ou moins adéquates non seulement en fonction de votre sujet (type de données en entrée, nombre de dimensions, résultat attendu…) mais aussi de vos besoins (rapidité, puissance…).

La capacité à interpréter les résultats de l’algorithme est notamment un aspect essentiel à intégrer dans le cahier des charges de la plupart des solutions apportées aux cas d’usage métier, car notre objectif n’est alors pas d’introduire de l’opacité technique dans vos process avec ces nouveaux outils mais bien au contraire de les simplifier et d’assurer une bonne utilisation et adoption du modèle dans les opérations quotidiennes de votre entreprise.

Identifier le bon algorithme nécessite donc à la fois une expertise technique et une bonne connaissance et compréhension des enjeux métiers.

Comment sélectionner le modèle le plus adapté à votre problématique et à vos besoins d’analyse ?
Une fois le bon algorithme sélectionné, un autre enjeu technique est d’adapter son paramétrage et calibrage pour éviter de sur-adapter le modèle au jeu de données existant, qu’on appelle le phénomène d’overfitting. En effet, la qualité du modèle est testée par différents indicateurs qui rendent compte de la fiabilité de la prédiction telle que la précision (taux de détection correct), la sensibilité (capacité à bien détecter les « vrais ») et la spécificité (capacité à bien détecter les « faux »).

Essayer de maximiser ces indicateurs peut conduire à inclure énormément de variables dans l’analyse prédictive ou d’utiliser des modèles toujours plus complexes. Il est important de garder un échantillon de son jeu de données non pas pour entrainer le modèle mais pour le tester. Sachant que les données d’entrainement sont souvent plus homogènes que les données réelles, il est aussi important de limiter la complexité du modèle de machine learning choisi au minimum requis. Assembler les résultats de plusieurs modèles est aussi une technique pour limiter les biais inhérents à chacun des modèles.

Comment assurer la qualité de son paramétrage ? Comment adapter un modèle de forecast pour anticiper des scenarios avec des évènements n’ayant jamais eu lieu dans le passé ?
Lors du calibrage et de l’entraînement du modèle, les données d’entrée sont également un enjeu crucial. Au-delà de la quantité de données, qui reste souvent l’un des défis principaux lorsque l’on se lance dans la construction d’un modèle de machine learning, leurs qualité et représentativité sont aussi clés pour pouvoir tirer des conclusions pertinentes. En particulier, des données mal équilibrées ou « imbalanced », peuvent biaiser l’apprentissage. Si on cherche à entrainer un algorithme à classifier des images de chats et de chiens sur la base de 1000 images de chats et 100 de chiens, la notion d’une plus grande fréquence d’occurrence de chats va ressortir dans la classification des nouvelles images.

Ce déséquilibre peut être facile à identifier s’il concerne l’objectif principal de détection mais beaucoup moins s’il s’agit d’un élément parmi d’autres, par exemple une sur-représentation de chatons parmi les images. Les bases de données historiques peuvent être biaisées, comme par exemple les bases de données d’essais cliniques dans lesquels les hommes caucasiens sont sur-représentés par rapport au ratio de la population générale. Lors de la récolte de données, il s’agit donc de repérer ces biais dans nos sources de données et de les corriger en diminuant la taille de l’échantillon sur-représenté (undersampling) ou en augmentant artificiellement celle de l’échantillon sous-représenté (oversampling).

Comment mieux sélectionner les sources de données d’entrée pour ne pas biaiser l’apprentissage de nos algorithmes ?
Au-delà de la sélection en amont des sources de données d’entrée, un nettoyage en aval des données collectées en masse est souvent nécessaire. Cette étape cruciale de tout processus de Data science conditionne la réussite de l’analyse au niveau technique mais aussi sa valeur au niveau interprétatif. Elle peut nécessiter de faire des choix afin d’augmenter le ratio signal sur bruit qui peuvent conduire à éliminer une partie du signal. En particulier, le domaine de la Data science focalisé sur l’analyse de données textuelles, le Natural Langage Processing, ou NLP, peut nécessiter un nettoyage particulièrement important des données en fonction de la source utilisée. La récolte d’informations sur les réseaux sociaux par exemple requiert un travail important si l’on veut réussir à détecter et à interpréter des mots mal orthographiés ou des abréviations.

Quelles données sont suffisamment riches pour que leur analyse apporte de la valeur ? Comment tirer de la valeur de bases de données internes ou externes que l’on possède ?

Vous avez un projet ? Écrivez-nous !

Comment nous vous accompagnons dans vos projets d’analyse prédictive et dans la construction de modèles prédictifs ?

Depuis près de 30 ans, Alcimed accompagne ses clients, industriel leaders, institutionnels et PMEs et start-ups innovantes, dans leurs projets d’innovation et de développement de nouveaux marchés.

Fort de cette expérience métier et de compétences en Data science acquises grâce à notre équipe dédiée, nous offrons un soutien personnalisé aux directions générales et aux directeurs de départements métiers (marketing, affaires commerciales, excellence opérationnelle, …)  dans de nombreux secteurs d’activité (santé, agroalimentaire, énergie et mobilité, chimie et matériaux, cosmétique, aérospatial et défense, …) où nous vous aidons à identifier les problématiques métiers auxquelles l’analyse prédictive peut apporter une réponse fiable et solide.

Notre équipe Data vous accompagne à chaque étape de votre projet, depuis l’identification du cas d’usage jusqu’à l’implémentation d’un modèle prédictif et la réflexion quant à ses implications. Cela inclut la sélection du modèle, le paramétrage, le data mining et le nettoyage, tant des données internes qu’externes, ainsi que la présentation des résultats dans un format ergonomique. Vous pouvez compter sur notre expertise pour mener à bien votre projet et obtenir des résultats concrets !

Un projet ? Contactez nos explorateurs !

EXEMPLES DE PROJETS RÉCENTS MENÉS POUR NOS CLIENTS DANS LE DOMAINE DES MODÈLES PRÉDICTIFS

Afin de soutenir notre client, un industriel leader du BTP, dans la prédiction de son volume de business, Alcimed a développé un algorithme de machine learning pour prédire, sur la base de données publiques historiques et avant qu’ils ne soient tous officiellement référencés par les administrations locales, le nombre de permis de construire total effectivement déposés dans le mois en cours. Ce projet a ainsi permis à notre client d’anticiper ses projections de vente et d’adapter nombreuses de ses activités en amont en conséquence.
Alcimed a accompagné un de ses clients, la filiale France d’une entreprise pharmaceutique internationale dans la définition, la conception, et la mise en place d’un outil de visualisation des données recueilles dans sa base de données d’Information Médicale, permettant à l’équipe produit de suivre mensuellement les sujets de préoccupation inhabituels et futurs des professionnels de santé. Notre équipe a mis en place des techniques de NLP et une analyse statistique poussée des requêtes textuelles permettant une détection automatique des thèmes et des mots inhabituellement mentionnés, avec le potentiel de devenir des sujets majeurs à l’avenir, et a accompagné le déploiement de cette démarche dans l’équipe produit et dans les systèmes de notre client.
Alcimed a accompagné un de ses clients, une entreprise pharmaceutique dans la modélisation d’un business case pour évaluer l’opportunité que représenterait le lancement d’un produit en oncologie sur les 15 prochaines années dans 6 marchés clés. Notre équipe a collecté des informations épidémiologiques et des données sur les taux d’utilisation des différents produits disponibles et en cours de développement pour réaliser une analyse prédictive des évolutions de la taille du marché et des parts de marché dans les géographies concernées. Nous avons ainsi pu prédire les performances futures d’un nouveau lancement, grâce à des techniques d’analyse de séries temporelles.

Créée en 1993, Alcimed est une société de conseil en innovation et développement de nouveaux marchés spécialisée dans les secteurs innovants : sciences de la vie (santé, biotechnologie, agroalimentaire), énergie, environnement, mobilité, chimie, matériaux, cosmétiques, aéronautique, spatial et défense.

Notre vocation ? Aider les décideurs privés et publics à explorer et développer leurs terres inconnues : les nouvelles technologies, les nouvelles offres, les nouveaux enjeux géographiques, les futurs possibles et les nouvelles manières d’innover.

Répartie dans nos 8 bureaux dans le monde (en France, en Europe, à Singapour et aux Etats-Unis), notre équipe est composée de 220 explorateurs de haut niveau, multiculturels et passionnés, ayant une double culture scientifique/technologique et business.

Notre rêve ? Être 1000, pour dessiner toujours plus avec nos clients le monde de demain.

PARLEZ-NOUS DE VOTRE TERRE INCONNUE

    Vous avez un projet et vous souhaitez en parler avec un de nos explorateurs, écrivez-nous ! Un de nos explorateurs vous recontactera très vite.

     

    Nos explorations