SQL Project

Digital Marketing Campaign Project

Major challenge : Analyzing binary data in Microsoft SQL server (presented in French). This is my version of a project realized with Ghislain Fepessi Kewou and Eveline Carine Kougang Soh.
Project image

Description

Ce projet a été réalisé avec une base de données d'une compagnie qui effectue des campagnes en ligne sur son site internet afin d'augmenter la visite de ce site, dans le but de favoriser les achats aussi bien en ligne qu'en magasin.

Les données captent les réactions de la clientèle face aux cinq campagnes publicitaires en ligne couvrant la période de juillet 2012 à juin 2014.

Leur taux de succès est mesuré par le nombre de visites du site web, le nombre d'achats par campagne et la rapidité avec laquelle l'achat a été effectué après la lecture de la publicité. Il s'agit de la vente de six grandes catégories de produits, y compris de l'or, des sucreries, du poisson, de la viande, des fruits et du vin.

Les caractéristiques socio-économiques de la clientèle sont captées par leur année de naissance, niveau d'éducation, statut marital, revenu familial, et le nombre d'enfants et d'adolescents à la maison. Les clients proviennent de sept pays dont l'Allemagne, l'Espagne, le Canada, l'Afrique du Sud, les USA, l'Australie et l'Inde.

Structure des données

  • Nombre de colonnes : 28

  • Nombre de lignes : 2240

#
Table 1. Noms des variables et types de données
Nom de colonneDescriptionType de donnée avantData de donnée après
IDUnique identifier for each customersmallintsmallint
Year_BirthYear of birth of the customersmallintsmallint
EducationCustomer's level of educationnvarchar(50)nvarchar(50)
Marital_StatusCustomer's marital statusnvarchar(50)nvarchar(50)
IncomeCustomer's yearly household incomenvarchar(50)int
KidhomeNumber of small children in customer's householdtinyinttinyint
TeenhomeNumber of teenagers in customer's householdtinyinttinyint
Dt_CustomerDate of customer's enrollment with the companydatedate
RecencyNumber of days since the last purchasetinyinttinyint
MntWinesAmount spent on wines in the last 2 yearssmallintsmallint
MntFruitsAmount spent on fruits in the last 2 yearstinyinttinyint
MntMeatProductsAmount spent on meat products in the last 2 yearssmallintsmallint
MntFishProductsAmount spent on fish products in the last 2 yearssmallintsmallint
MntSweetProductsAmount spent on sweet products in the last 2 yearssmallintsmallint
MntGoldProdsAmount spent on gold products in the last 2 yearssmallintsmallint
NumDealsPurchasesNumber of purchases made with discounttinyinttinyint
NumWebPurchasesNumber of purchases made through company's websitetinyinttinyint
NumCatalogPurchasesNumber of purchases made using catalogtinyinttinyint
NumStorePurchasesNumber of purchases made directly in storestinyinttinyint
NumWebVisitsMonthNumber of visits to company's website in the last monthtinyinttinyint
AcceptedCmp31 if customer accepted the offer in the 3rd campaign, 0 otherwisebitbit
AcceptedCmp41 if customer accepted the offer in the 4th campaign, 0 otherwisebitbit
AcceptedCmp51 if customer accepted the offer in the 5th campaign, 0 otherwisebitbit
AcceptedCmp11 if customer accepted the offer in the 1st campaign, 0 otherwisebitbit
AcceptedCmp21 if customer accepted the offer in the 2nd campaign, 0 otherwisebitbit
Response1 if customer accepted the offer in the last campaign, 0 otherwisebitbit
Complain1 if customer complained in the last 2 yearsbitbit
CountryCustomer's countrynvarchar(50)nvarchar(50)

Source des données

Kaggle: https://www.kaggle.com/datasets/sahilnbajaj/marketing-campaigns-data-set

Analyse des données

Afin d'obtenir des informations pertinentes pour affiner notre stratégie de marketing, j'ai procédé aux requêtes suivantes :

  1. Nombre total de clients par pays dans l'ordre décroissant

  2. Quel status maritals a le revenu moyen le plus élevé?

  3. Le niveau d'education et le nombre des clients dont les revenus sont supérieurs à la moyenne des revenus de l'échantillon d'analyse

  4. La liste des clients qui ont déjà fait au moins un achat sur le site web de la compagnie

  5. Relation entre le nombre d'enfants et adolescent àla maison et le montant des achats

  6. Le nombre de clients mariés et leur ancieneté de statut de client avec la compagnie, au 31 décembre 2023

  7. Le nombre de clients depuis leur dernier achat

  8. Le nombre de visites web par mois

  9. Le taux de réponse positif aux campagnes de marketing

  10. Statistiques de toutes les campagnes de marketing ('Succès' si le client a acheté pendant la campagne en question et 'Échec' si le client n'a pas fait d'achat pendant la campagne en question)

  11. Le nombre de plaintes effectuées par pays

  12. Quelle est la moyenne des achats par type de produit ?

  13. Le produit le plus vendu et la date de la vente

  14. L'année à laquelle on a eu la plus grande vente en ligne

  15. Le nombre total des ventes provenant de tous les circuits de vente

  16. Le pourcentage des ventes selon le type de circuit de vente

  17. Le montant dépensé sur le vin pendant les deux dernières années selon le niveau d'éducation des clients

  18. Les caractéristiques socio-économiques des célibataires les plus âgés selon leur pays

  19. Le nombre de clients par generation, ainsi que leur âge moyen et leur voie d'achat préférée

Le code SQL de ces 19 requêtes se trouve ICI.

Resultat de l'Analyse

La majorité des clients proviennent d'Espagne, contribuant ainsi à 49 % des ventes totales. Les clients ayant le statut de 'Absurd' ont le revenu moyen le plus élevé. Attention : ceux-ci ne représentent que 0,1 % de la population. Il serait donc sage de prêter attention plutôt aux mariés, qui constituent 38,6 % de la clientèle.

En termes de niveau d'éducation, les clients ayant un doctorat sont les plus nombreux, suivis par ceux ayant une maîtrise et ceux ayant un niveau collégial en troisième position. Il est néanmoins important de souligner que les clients ayant au moins un niveau collégial constituent la majorité de la clientèle.

La majorité des clients ont un enfant/adolescent à la maison ; cependant, les clients qui n'ont ni enfant ni adolescent à la maison sont responsables de la grande majorité des achats effectués.

Les campagnes publicitaires en ligne, toutes campagnes confondues, ont eu un taux de succès de 30 %, avec la campagne No. 4 ayant le plus grand succès à 7,4 % et la campagne No. 2 ayant le moindre succès à 1,3 %.

Le vin est le produit le plus demandé, avec la plus grande vente effectuée le 22 mai 2013.

La compagnie réalise 12 % de ses ventes en magasin de plus qu'en ligne. La vente par les catalogues et les offres promotionnelles est non négligeable, car elles contribuent à 33 % des ventes totales.

Les Gen X constituent la majorité de la clientèle. Ils ont un âge moyen de 51 ans et préfèrent magasiner davantage en magasin.

Points Forts du Projet

  1. Richesse des Données :

    • La base de données est riche et diversifiée, contenant des informations détaillées sur les clients, y compris des données démographiques et des comportements d'achat.

    • Les données couvrent plusieurs pays, ce qui permet des analyses comparatives intéressantes entre les différentes régions.

  2. Analyse Complète des Campagnes :

    • Les données permettent de mesurer le taux de succès des campagnes publicitaires de manière détaillée, y compris le nombre de visites et d'achats, et la rapidité des achats post-publicité.

    • Les campagnes sont analysées sur une période de deux ans, ce qui permet de discerner des tendances et des évolutions dans les comportements d'achat.

  3. Segmentation Socio-Économique :

    • La segmentation des clients par statut marital, niveau d'éducation, et revenu familial offre des insights précieux pour adapter les stratégies marketing aux différents segments de la clientèle.
  4. Multicanal :

    • Les données incluent différents types de canaux d'achat (en ligne, en magasin, via catalogue), permettant d'analyser la performance de chaque canal et de comprendre les préférences des clients.

Faiblesses du Projet

  1. Données Anciennes :

    • Les données couvrent une période de juillet 2012 à juin 2014. Elles peuvent ne plus refléter les comportements actuels des consommateurs ou les tendances du marché.
  2. Manque de Données Qualitatives :

    • Les données sont principalement quantitatives. Des informations qualitatives sur la satisfaction des clients ou leurs motivations d'achat pourraient enrichir l'analyse.
  3. Représentation Inégale des Catégories de Produits :

    • Les six catégories de produits analysées peuvent ne pas couvrir l'ensemble de l'offre de la compagnie, limitant ainsi la portée des conclusions.
  4. Problèmes de Segmentation :

    • La segmentation par statut marital inclut une catégorie "Absurd" avec un revenu moyen élevé mais ne représentant que 0,1 % de la population, ce qui pourrait biaiser les analyses.
  5. Données Sur Les Réclamations :

    • Bien que le nombre de plaintes soit collecté, il n'y a pas d'analyse approfondie des raisons des plaintes ou de la satisfaction globale des clients, ce qui est crucial pour l'amélioration continue des services.

6. Analyse des données:

Cette analyse se limite aux statistiques descriptives du donnée. Une ètude plus approfondi utilisant les regressions par exemple, pourrais faire resortir la dependance entre les variables et leurs niveaux de correlation.

Conclusion

Ce projet présente une base solide pour l'analyse des campagnes marketing avec des données détaillées et diversifiées. Toutefois, des mises à jour des données, une inclusion de données qualitatives et une analyse plus approfondie des réclamations des clients pourraient améliorer la pertinence et la profondeur des insights obtenus.

Partagez votre avis!

Qu'en pensez-vous de cette analyse?