Face aux enjeux de personnalisation de services décrits dans le livre électronique « Personnalisation de services : quelles technologies pour la préservation de la vie privée ? » [Kaa19] publié par la Chaire VPIP en avril 2019, les membres de la Chaire, en coopération avec son mécène Qwant, ont conçu un service de recherche web coopératif ayant pour objectif d’empêcher la collecte fine des profils des utilisateurs tout en permettant l’affichage de publicités et de « news » adaptées à leurs centres d’intérêts.
La solution proposée offre un bon compromis entre vie privée et utilité des réponses reçues, à la fois vis-à-vis de la requête elle-même – son interception ne permet pas d’accéder à son contenu – et des publicités ou « news » retournées par le service de recherche web – ces publicités/news étant personnalisées en fonction des goûts des utilisateurs, et leur sont donc potentiellement utiles –. Cette solution fait coopérer un utilisateur soumettant une requête (ci-après « le client ») et un ensemble d'utilisateurs complémentaires.
D’un point de vue technique, l’approche consiste dans un premier temps à regrouper des utilisateurs disposant d’un profil relativement voisin, c’est-à-dire dont les centres d’intérêts sont proches (figure 1). Ce regroupement peut être réalisé en recourant à un service de type publish-subscribe, service permettant aux utilisateurs d’échanger sur leurs goûts respectifs grâce à un mécanisme de publication / abonnement où chacun peut, sans connaissance préalable sur les autres participants, publier des informations qu’un abonné recevra en fonction des catégories d’intérêt qui l’intéressent.
Figure 1 : Exemple de profils d'utilisateurs et de clients considérés comme proches
Dans un second temps, comme le montre la figure 2, un client émet une requête vers un serveur de recherche web (WSE – Web Search Engine). Pour cela, il construit un chemin via Internet vers le serveur WSE, ce chemin comprenant plusieurs sauts qui correspondent chacun à un utilisateur dont le profil est proche. Chaque utilisateur ajoute un ou plusieurs éléments associés à son profil, de manière à bruiter progressivement de saut en saut le profil original. Le serveur WSE reçoit la requête et le profil bruité. Il transmet aux tierces parties (régies publicitaires, éditeurs de news – Third Parties, notées TP) le profil agrégé et reçoit en retour des publicités et des news correspondant à ce profil. Le serveur renvoie alors sa réponse, associée à des publicités / news, à l’utilisateur du dernier saut. Puis, de proche en proche, la réponse parvient au client originel. Sur le chemin du retour, chaque utilisateur intermédiaire peut récupérer des publicités / news qui correspondent à son profil et le client récupère la réponse à la requête ainsi que des publicités / news en lien avec sa requête et / ou le profil agrégé.
Figure 2 : Architecture réseau de l’approche
(la requête issue du client transite via plusieurs utilisateurs avant d’arriver au serveur WSE de recherche web qui transmet le profil agrégé à des tierces parties TP)
Grâce au chiffrement des éléments communiqués sur le réseau, plusieurs propriétés sont obtenues : l’anonymat du client et des utilisateurs intermédiaires vis-à-vis du serveur, ainsi que la confidentialité de la requête qui est chiffrée de bout en bout, entre client et serveur. Le serveur ne dispose que du profil agrégé des participants et ne connaît que l’utilisateur du dernier saut, auquel il peut associer le profil agrégé.
Cette solution permet au service de recherche web de respecter la vie privée des clients, tout en offrant une meilleure expérience utilisateur. Elle est compétitive vis-à-vis des autres solutions proposées par la littérature ayant les mêmes objectifs de préservation de la vie privée [Sho12, Rom15], ou de consommation d’énergie [Cet16, Lai18]. Le client reçoit certes des publicités / news moins pertinentes que s’il avait interagit directement avec le serveur, mais il s’agit là du compromis à adopter pour mieux préservation la vie privée. Retenons également que, via la réception de publicités / news ciblées, les utilisateurs intermédiaires sont incités à participer au service coopératif.
À noter que ce travail entre dans la catégorie des techniques de préservation de la vie privée, référencées comme « Techniques à tiers de confiance » dans le livre électronique [Kaa19] de la Chaire VPIP (section 8, page 161 et suivantes). Cette solution a été développée par des étudiantes de Télécom SudParis dans le cadre d’un projet de l’option de dernière année SSR (Sécurité des Systèmes et des Réseaux). Elle est actuellement en cours de soumission à une conférence scientifique majeure.
Maryline Laurent, Professeure en sciences informatiques à Télécom SudParis et Membre fondateur de la Chaire
Nesrine Kaâniche, University of Sheffiledk, United Kingdom, Membre de la Chaire
Souha Masmoudi, doctorante Télécom SudParis, Membre de la Chaire