Airbnb est un site internet permettant la diffusion d'annonces de locations saisonnières. Le propriétaire ou le gestionnaire du logement
(hôte) peut créer un compte et créer une annonce. Le client (voyageur) peut consulter les annonces et faire une demande de location directement à l'hôte.
Le site internet se positionne en tiers de confiance pour le paiement et les litiges. Un système de commentaires réciproques sur le voyageur et le logement construit la réputation
des deux parties.
Pour optimiser son taux de remplissage et son revenu, l'hôte peut paramétrer de
nombreuses options :
Cette section présente un tableau de bord succint de l'activité. Pour préserver l'anonymat du loueur, aucune référence n'est faite au logement
et les revenus ont été normalisés à 100€ en moyenne. Les graphiques ont été produits avec Matplotlib, il ne s'agit pas d'images interactives comme on peut les rencontrer sur les sites web qui utilisent javascript.
Page Git-hub du projet
Louer pour une nuit est frustrant pour l'hôte : gestion des arrivées et des départs, nettoyage et revenu minimal. L'analyse montre
pourtant que dans son cas, l'hôte ne peut pas se passer des courts séjours. La figure A montre que l'essentiel des revenus est assuré par
les séjours d'une nuit, puis les séjours de trois et quatre nuits. En revanche, la figure B montre que le délai médian pour les séjours
d'une nuit est supérieur à celui des séjours de 2, 3 ou 4 nuits mais inférieur à celui des séjours de 5 nuits ou plus (qui restent en revanche assez rares).
Les voyageurs d'une nuit, plus anticipateurs,
empêcheraient-ils les voyageurs de 3 à 4 nuits de réserver ?
Nous pouvons préconiser une gestion dynamique du calendrier : à long terme autoriser les séjours de 3 nuits et plus, puis à court terme,
autoriser les séjours à partir d'une seule nuit.
Les réservations de dernière minute ne rapportent pas plus que les autres (4,6% du revenu total potentiel), mais pire, elles incitent fortement l'hôte à refuser la demande. Refuser une demande est une action possible pour l'hôte mais elle entraine à moyen-terme une moins bonne visibilité de l'annonce. La Figure C montre que les demandes de réservation réalisées une ou deux nuits avant la date d'entrée dans les lieux ont un taux de refus bien supérieur aux autres demandes. La figure D montre que les revenus potentiels des réservations de dernière minute (un ou deux jours avant) sont négligeables par rapport au revenu potentiel total.
Si l'hôte peut diminuer son taux de refus, il ne peut guère influencer l'issue de la demande : celle-ci va-t-elle aboutir sur une réservation acceptée ou va-t-elle expirer ? Plusieurs variables expliqueront que le logement ne soit pas réservé : il ne convient pas, un autre a été trouvé etc. Le prix semble avoir son influence sur le statut final de la demande. La figure E présente les revenus du séjour en fonction de sa durée et distingue le statut de la demande (Acceptée ou Expirée).
Le machine-learning peut apporter un éclairage intéressant à cette problématique. Il s'agit d'un problème de classification. Les variables d'entrées sont :
Score = 0,79
Score = 0,70
Score = 0,79
Les figures F à H présentent les résultats des trois modèles sous forme de carte avec la frontière de la décision (DecisionBoundary). Les axes des abscisses et des ordonnées
représentent respectivement le nombre de nuits du séjour et les revenus du séjour. Les points croisent ces deux variables et la couleur symbolise l'issue de la demande
(violet : 0, expirée ; jaune : 1, acceptée), il s'agit des données issues de l'observation. Les deux zones colorées représentent les résultats du modèle (0 ou 1) quand il est appliqué aux variables et la frontière serait
le revenu maximal du séjour par nuit tout en ayant la demande de réservation acceptée.
Les scores obtenus par les trois tentatives de modélisation ne sont pas plus élevés que si l'on avait classifié les données au hasard. C'est donc un échec.
Il reste une autre option pour essayer de déterminer le prix maximal par durée de séjour :