Tutoriel 1 : Comment optimiser la gestion des entrepôts avec la prévision des ventes

Tutoriel 750px/450px

La prévision des ventes permet de connaître le nombre de produits à commander ainsi que le nombre de colis qui vont être livrés. Par conséquent, il devient possible d'optimiser l’espace requis au sein d’un entrepôt et d’optimiser la gestion des transporteurs d’un lieu A à un lieu B. Cette connaissance entraîne une meilleure réactivité et rentabilité. Découvrez un tutoriel pour mettre en application le cas d’usage suivant : optimiser les emplacements réservés dans les entrepôts avec la prévision des ventes.

Dans notre article précédent, nous vous avons exposé les bénéfices que représente le machine learning sur l’ensemble de la chaîne de vente. Aujourd’hui, suivez les étapes détaillées du fonctionnement de notre plateforme dans le cas d’usage de prévision des ventes.

Cadrage du projet de Data Science :

La première étape dans un projet de data science est de poser la problématique. Il est important de savoir très précisément ce que l’on souhaite prédire,la fréquence de prédiction et la portée de la prédiction.

Dans notre cas :“Nous souhaitons prédire toutes les semaines (Fréquence de la prédiction) le nombre de ventes par jour (prédiction) pour le mois d’avril (portée de la prédiction) en fonction des ventes par jour des mois de février et Mars (données nécessaires à avoir).

Note : Plus la prédiction a une portée lointaine moins elle sera précise.

Un fois que la problématique est claire, il faut se demander :”De quelles données disposons-nous”. Ce sont en effet, les données qui alimentent les algorithmes de machine learning qui vont, par la suite faire en sorte que le modèle soit le plus précis possible.

Posez-vous les questions suivantes :

  • Qu’est ce qui selon vous impacte les ventes ? (météo ? événement particulier ? vacances scolaires ? etc)

  • Y’a t-il de la concurrence à proximité ?

Pour intégrer ses données au future modèle, nous allons connecter à Prevision.io des sources de données externes en plus des données relatives à votre activités.

Le projet de machine learning automatisé

Le machine learning pouvant se traduire par Machine qui apprend, demande un grand nombre de données pour apprendre. En effet, la machine va corréler des données entre elles afin de trouver des patterns communs.

Dans notre situation, il s’agit de faire la même chose, c’est-à dire de faire apprendre au modèle comment prédire les ventes grâce à un historique de vente de 2 ans. Chez Prevision.io nous demandons à nos clients de fournir un maximum de données, car plus il y a de données, plus le modèle devient précis.

Intégrer son data set dans Prevision.io

Notre plateforme de machine learning automatisée est accessible à tous. Il est possible de connecter la plateforme aux outils métiers directement, de connecter des bases de données open sources externes mais aussi tout simplement, de déposer une fichier .CSV directement. Nous avons différents moyens d’intégrer la donnée au sein de la plateforme. De plus, la plateforme va reconnaître le type de données qui lui sont envoyées : son, image, texte, données brutes.

Dans le cadre de ce tutoriel, le data set (jeu de donnée en français) utilisé a été adapté à la problématique et anonymisé. Il se présente sous la forme d'un fichier .CSV constitué de 8 colonnes et environ 8 000 lignes. Il représente 2 ans de données (janvier 2013-décembre 2015) pour 10 magasins de vente de produit de sport.

Les différentes colonnes du DataSet

Date : la colonne de date, qui va servir d'index temporelle de notre modèle (ici au format DD/MM/YYYY. (Notre plateforme accepte plusieurs formats de dates)

Store : nous avons attribué un identifiant unique à chaque magasin concerné. Ici, il y aurait 10 magasins concernés et numéroté de 1 à 10.

Day Of Week : nous avons numéroté les jours de la semaine, du lundi au vendredi, de 1 à 7.

Target : représente le volume de ventes réalisées par le magasin sur un jour donné

Open : O ou 1, indique si le magasin est ouvert ou non. O pour fermer, 1 pour ouvert.

Promo : O ou 1, indique si le magasin a une promotion ou non. O pour sans promo interne, 1 pour journée avec promotion

Holiday : 0 ou 1, indique si c’est un jour de vacance scolaire. O pour n’est pas un jour de vacances scolaire, 1 pour une journée de vacance scolaire.

Spécial évent : En cas de case vide, cela indique qu’il n’y a aucun évènement externe, sinon celui-ci est spécifié par du texte.

Choisir le projet

C:\Users\arnol\Pictures\Screenpresso\2018-12-14_15h39_50.png

Une fois que vous avez connecté vos données à la plateforme, il faut choisir le type de projet. Dans le cas présent, il faut choisir “Time Serie Advanced”.

Le Time serie s'utilise à condition d'avoir un data set temporel ce qui est notre cas, dûe à la variable « Date ». De plus la time serie est la série la plus adéquate pour déterminer une tendance temporelle à long terme et nous souhaitons prédire jusqu’à 30 jours.

Note : connaître les différentes tendances saisonnières est important pour ajuster correctement les approvisionnements en marchandise, le besoin en emplacement réservé en entrepôts, les livraisons puis la force commerciale nécessaire.

Paramétrer son projet de Data Science


C:\Users\arnol\Pictures\Screenpresso\2018-12-14_15h41_47.png

Paramétrer votre projet vous prendra en tout et pour tout 2 minutes de vérification. En effet, notre plateforme récupère l’ensemble des informations dont il a besoin pour pré remplir les cases correspondantes.

Sélectionner la date :

En sélectionnant la colonne “date”, la plateforme calcule automatiquement l'écart compris entre chaque échantillon (entre chaque ligne de la colonne “Date” du dataset). Ici, il s’agissait d’un data set de 2 ans, chaque ligne représente une journée de vente pour un magasin. La plateforme nous indique donc « 1 j ».

Sélectionner les Colonnes

Chaque colonne du data set est reconnue et reprise par la plateforme. Il suffira de sélectionner ou désélectionner les colonnes que vous souhaitez prendre en compte ou non. De plus, pour certaines colonnes, vous pouvez indiquer qu'elles sont connus 'a priori', dans le cas où ce sont des données dont vous connaissez déjà la valeur future (par exemple, les vacances scolaires ). Si il y a des variables dont vous ne connaissez pas encore les valeurs futures (par exemple les pannes de transport en commun) , la colonne " a priori" ne doit pas être choisie.

Attention, dans notre exemple,la colonne” magasin” est sélectionnée “groupe”, pour indiquer que l’ensemble des données (lignes) correspondant au magasin N°1 ou N°2 etc doit rester groupé.

La jauge temporelle

À partir des données de J-200 à j-28 (un trimestre de données d’apprentissage), on veut pouvoir prédire les ventes du prochain mois (j+28)

C:\Users\arnol\Pictures\Screenpresso\2018-12-14_15h42_46.png

Suite à ce paramétrage, cliquez sur « lancer l'entraînement ».

3-clic pour obtenir le meilleur modèle prédictif

La première partie du projet vient de se finir, l'entraînement est lancé à la recherche du meilleur modèle prédictif de prévision des ventes de J+30. Pendant tout le processus de modélisation, le dataset va être optimisé à l’aide de techniques de Feature Engineering enfin pour construire un modèle prédictif.

Le tableau de bord indique la progression dans le travail, le nombre de modèles entraînés, la performance de chacun, le temps espéré etc. Un pop-up push sera visible quand l'entraînement sera fini.

C:\Users\arnol\Pictures\Screenpresso\2018-12-14_15h47_16.png

La phase numéro un est terminée, il est désormais possible de d’intégrer un nouvel historique au sein de la plateforme pour réaliser des prédictions.

Prédire le mois prochain

Après 3-clic et 1½ journée, vous obtenez le meilleur modèle prédictif. La plateforme de machine learning a appris une tendance dans la prévision des ventes sur 2 ans d’historique. Prevision.io pourra prédire les ventes à +30jours et ainsi répondre à notre problématique de départ.

L’automatisation de de la prédiction est là ! Ouvrez « Make predictions » et intégrez le fichier contenant les données des mois de février et mars 2018 afin d’avoir une prévision de ventes précise pour le mois d’avril 2018.

C:\Users\arnol\Pictures\Screenpresso\2018-12-14_16h02_27.png

Voilà, il vous suffit de télécharger le fichier de prédiction des ventes pour Avril. Vous obtenez l’ensemble des informations nécessaires pour ajuster l’ensemble de votre chaîne d’approvisionnement : commandes & quantité produit, espace de stockage en entrepôts, contrat avec la société de transport, force commerciale sur le lieu de vente etc.

C:\Users\arnol\Pictures\Screenpresso\2018-12-14_16h08_00.png

Humain VS Machine

L’homme doit s’incliner face au travail des logiciels intelligents. Le croisement de nombreuses données fournies par l’historique des ventes des 2 dernières années sur 10 magasins permet au Machine Learning de réaliser une prévision optimale de toutes les actions de l’entreprise au sein de votre entrepôt : chaîne logistique, réalisation des commandes et gestion des stocks.

De plus, certaines variables (colonnes) peuvent être sans intérêt ou, à contrario essentielles. L’humain doit veiller à présenter à l’outil des données fiables. La puissance de calcul qu’offre le Machine Learning est sans pareil ! Et la plateforme automatisée de Prevision.io répond aux besoins des entreprises qui souhaitent obtenir une prévision des ventes optimales.

Prevision.io -

Our Latest
News