Aller au contenu principal Skip to page footer

#29 Le marketing digital peut-il être éthique ? - Avec Liva Ralaivola

Liva Ralaivola

Liva Ralaivola est Vice-Président Recherche chez Criteo et dirige le Criteo AI Lab, le laboratoire d’intelligence artificielle de l’entreprise. À la tête d’une équipe de plus de 100 chercheurs et ingénieurs, il pilote les travaux de recherche et d’innovation en IA ainsi que leur intégration dans les produits de Criteo.

Entré chez Criteo en 2018 comme chercheur à temps partiel, il y a pris la direction de la recherche en 2019. Parallèlement, Liva Ralaivola est professeur à l’Université d’Aix-Marseille (AMU), où il contribue activement au développement de la recherche académique en apprentissage automatique.

 

France Charruyer

France Charruyer est fondatrice d’Altij & Oratio Avocats, réseau Baker Tilly, avocate en propriété intellectuelle, technologies de l’information et protection des données, DPO / AI Officer. Présidente de l’association d’intérêt général Data Ring, fondatrice du Lab IA Data Ring, elle s’engage activement pour une gouvernance éthique et responsable des données, au service d’une innovation durable et sécurisée.

Elle est chargée d’enseignement à l’INSA sur les enjeux de l’IA de confiance, et intervient à l’Université Paris-Dauphine dans le cadre du D.U. RGPD et délégué à la protection des données. Elle enseigne également à l’Université Toulouse 1 Capitole (Master II DJCE – Master II Propriété Intellectuelle) ainsi qu’à Toulouse Business School (TBS) sur la gouvernance des données, les cyber-risques, et les enjeux liés à l’entrepreneuriat et aux startups.

Description

 

Entre innovation, performance et respect du consentement, comment concilier efficacité publicitaire, transparence et explicabilité des algorithmes d’intelligence artificielle ?
France Charruyer reçoit Liva Ralaivola, directeur du Criteo AI Lab, pour explorer les tensions entre recherche, éthique et business : détection des biais, gouvernance de l’IA, nouvelles places de marché de la donnée… et les dilemmes d’un marketing responsable à l’ère de l’automatisation.

Un podcast enregistré dans le cadre de notre Café IA dédié au marketing digital, au e_commerce et à la publicité en ligne Replay à revoir ici.

Transcription Podcast

 

France Charruyer

Vous écoutez le podcast de Data Ring, nos causeries data. J'ai le plaisir de recevoir Liva Raveola du laboratoire de recherche Criteo. Je sens que j'ai écorché son nom à nouveau. Allez-y Liva.

 

Liva Ralaivola

Alors bonjour, mon nom est Liva Ralaivola.

 

France Charruyer

Je vais y arriver. Même moi j'ai un biais, vous imaginez la suite.

 

Liva Ralaivola

Pourtant il n'y a pas beaucoup de syllabes pour un nom malgache.

 

France Charruyer

Ah, normalement je devrais y arriver, venant des îles aussi. Alors Léva, qu'est-ce que vous faites chez Criteo?

 

Liva Ralaivola

Alors je suis chez Criteo depuis 2018, j'y suis ce qu'on appelle vice-président recherche et actuellement je suis à la tête du Criteo AI Lab, une unité de recherche et d'innovation qui a été créée en 2018 et qui vise à essayer de détecter et de créer l'intelligence artificielle qui nous permet de proposer à l'ensemble de nos clients des produits qui seront capables de tirer au mieux des parties des données et de faire du marketing digital de qualité.

 

France Charruyer

Alors, quels arbitrages faites-vous entre innovation, puisque vous avez plus de 120 chercheurs et ingénieurs au sein de ce laboratoire, entre innovation, performance, respect des consentements, que veulent exactement vos clients?

 

Liva Ralaivola

Je ne sais pas si on doit parler d'arbitrage parce qu'étant une entreprise notamment basée en France, le siège est en France, on est soumis aux réglementations françaises. Donc, il y a d'abord cette barrière-là qui vient dire ce qu'on doit faire, ce qu'on ne peut pas faire et on ne peut pas s'en départir. Et puis par ailleurs, il y a des demandes de clients qui, elles, veulent des performances. Et notre manière de travailler, c'est précisément d'essayer d'intégrer ces contraintes qui viennent un petit peu de partout, de différentes natures, aussi bien des clients, des utilisateurs finaux à qui on doit de la transparence et de la loyauté. Et puis les réglementations ou les lois même à la fois françaises et européennes. Et en fait, dans le laboratoire, on se nourrit de ça avec cette idée que la contrainte, c'est aussi ce qui est gage de créativité. Donc, on se nourrit de ces contraintes-là et c'est à l'intérieur de ce périmètre qu'on essaie de créer de nouveaux algorithmes qui arrivent à répondre à l'ensemble des besoins de tous les partenaires avec qui on travaille.

 

France Charruyer

Donc, de la créativité, ce n'est pas uniquement des machines à extruder des images et des textes chez Criteo?

 

Liva Ralaivola

Non, pas du tout. Pour vous dire un exemple de l'endroit jusqu'auquel on va, On a créé il y a trois ans une équipe projet avec un organisme de recherche qui s'appelle INRIA, qui met côte à côte des économistes, des chercheurs en intelligence artificielle et des spécialistes de l'apprentissage sans biais. Et ce qu'on essaye d'anticiper, c'est précisément ce renforcement qui va apparaître d'un point de vue réglementaire sur la nécessité d'avoir de la transparence, de l'explicabilité sur ce que vont décider les algorithmes d'intelligence artificielle. Et donc, on a mis en place cette structure qui fait du travail très en amont, qui fait de la recherche très académique et qui travaille sur ces questions d'équité, sur la question de place de marché ou la donnée qu'on essaie d'échanger. Les biens qu'on essaie d'échanger sur ces places de marché, c'est de la donnée qui a été transformée grâce aux algorithmes d'intelligence artificielle. et pour faire ça, on essaie d'étudier de manière presque indépendante de Criteo comment se mettent en place des dynamiques de marché. Et donc c'est pour ça qu'on a des gens qui font aussi de la théorie des jeux parce que quand on fait du marketing digital, ce qu'on fait c'est de l'échange entre des biens à vendre, des biens à acheter et puis de la satisfaction client.

 

France Charruyer

Alors il y a deux réponses qui m'intéressent dans ce que vous venez de me dire. La première, c'est vos recherches avec des partenariats, notamment avec l'INRIA, sur la détection de biais, c'est-à-dire pour s'assurer que les chatbots déployées pour la relation client renforcent la confiance et ne soient pas uniquement destinées à générer de la frustration ou le sentiment d'un service au rabais. Comment vous faites sur cette détection de biais ou de discrimination? Quels apports de la recherche dans les partenariats que vous faites pour stimuler l'innovation? 

 

Liva Ralaivola

Alors en fait une chose qu'il y a à comprendre, c'est que les biais ils sont de manière primaire dans les données. Ils sont complètement encodés dans les données et ce que sont capables de faire les algorithmes d'intelligence artificielle ou de machine learning plus précisément, c'est d'objectiver ces biais qui sont de toute manière dans les données. Et donc la grande question, c'est étant donné que ces biais sont dans les données et que les algorithmes qu'on va créer et donc les modèles qui vont être appris auront tendance à retranscrire ces biais et peut-être à les amplifier, c'est comment on fait pour éviter ce phénomène, notamment quand c'est des biais qui sont peut-être contraires à l'éthique ou à la loi, comme des biais liés par exemple au genre ou à l'origine ethnique, etc. Sachant que par ailleurs, la particularité qu'on a chez Criteo, c'est qu'on n'a pas ces informations-là. Donc on doit être capable d'assurer que nos algorithmes et nos modèles ne sont pas porteurs de ces biais, sachant qu'on n'a pas les données qui permettraient de mesurer à quel point ces biais sont présents ou pas. Et en fait, c'est le moment où on a un peu une tâche qui est insoluble. Et quand on arrive à des endroits comme ça, on arrive précisément à ce qu'on appelle l'innovation. Il y a des gens qui disent que l'innovation, c'est la résolution de contradictions. Et donc, pour aller dans l'innovation, ce qu'on fait, c'est qu'on va se réfugier. On va travailler dans le domaine de la recherche académique. Et donc, dans la recherche académique, la question de faire des algorithmes d'apprentissage, de machine learning qui sont dénués de biais, c'est une question qui existe depuis très, très longtemps. Et il y a beaucoup de techniques qui permettent d'abord de recalculer la donnée, ce qu'on appelle la ground truth, qui permettrait de dire oui, on est dans une situation où il n'y a pas de biais par rapport à tel paramètre, par exemple le sexe ou bien l'origine ethnique ou bien les revenus. de retranscrire, de recalculer ces données sans les avoir. Et puis il y a une deuxième question qui est peut-être la plus compliquée parce qu'elle n'est pas que technique. Qu'est-ce que c'est qu'un biais? Comment est-ce qu'on définit ça? Est-ce que lorsqu'on supprime un biais, on ne va pas en recréer à d'autres endroits? Donc c'est des débats qui existent par ailleurs sur l'équité, sur par exemple la diversité,

 

France Charruyer

 la discrimination,

 

Liva Ralaivola

la discrimination positive. Est-ce que quand on fait ça...

 

France Charruyer

Quand je n'ai pas assez de jeux de données sur les femmes par exemple, est-ce que j'en réinjecte? Elle est où la limite?

 

Liva Ralaivola

C'est là qu'il y a un aspect qui est très intéressant. Je suis assez content de vivre ça. C'est que la technologie, l'aspect technique, l'aspect mathématique, l'aspect informatique, doit avancer de concert avec d'autres aspects qui sont moraux, éthiques et qui sont déterminés par la société. On a un jeu de ping-pong entre ce qui est acceptable, l'endroit où on ne peut pas aller, ce qu'on trouve être convenable en matière d'équité, Sachant que, voilà ce qu'on a dit sur la discrimination et la discrimination positive. Et c'est pour ça que les mots même de discrimination positive, de temps en temps, on dit aux Etats-Unis, il disait affirmative action, qui disait que ça ne va pas être de la discrimination positive. Mais quand on efface un biais, on en recrée à d'autres endroits. En fait, il y a un peu un théorème central dans la vie, c'est le no free lunch theorem. Quand on enlève quelque chose quelque part, ça vient se décaler autre part.

 

France Charruyer

Alors, quelles garanties on donne aux consommateurs, puisqu'on a une législation qui devient essentiellement consumériste? Quelles limites on pose? Et comment on structure la gouvernance interne et externe? Vous faites aider d'un comité IA, est-ce qu'il est en capacité de vous dire non? Est-ce qu'il doit vous dire non? Est-ce qu'il peut vous dire non?

 

Liva Ralaivola

Alors, la première limite, c'est celle dont j'ai parlé tout à l'heure, c'est la limite législative, elle existe.

 

Speaker 3

On opère dans des pays qui ont des lois, celle-là, on est obligé de la respecter.

 

Liva Ralaivola

à cela viennent s'ajouter d'autres limites qui sont discutées actuellement par des instances comme au Parlement européen, par ensuite des autorités de concurrence, etc. Et donc, on est soumis à ça. Après, concernant ce qu'on fait avec nos utilisateurs et ce qu'on fait, comment on travaille cette question, en fait, chez Criteo, on a ce qu'on appelle un Product Ethics Committee, donc un comité d'éthique produit, qui vient regarder l'endroit où on va utiliser l'intelligence artificielle, mais pas seulement, et l'ensemble de ce qu'on s'autorise au-delà des lois qui déjà nous en sert. C'est-à-dire qu'on peut avoir des contraintes législatives, mais nous on peut décider, pour des questions morales, éthiques et de positionnement, d'aller au-delà et d'être encore plus contraignant et d'être encore plus enserré par un positionnement éthique, sur des publicités qu'on ne veut pas faire, sur des types de produits sur lesquels on ne veut pas faire de publicités, ou encore sur des sites sur lesquels nous, on ne veut pas faire apparaître de publicité.

 

France Charruyer

D'accord, donc c'est toujours un enjeu de confiance. La question qui suit, que je trouve très intéressante, préalablement, dans ce que vous m'avez dit, c'est qu'on est en train de vivre un déplacement de la valeur sur la donnée avec la création d'une nouvelle place de marché. Est-ce que vous pouvez m'en dire plus sur ce qui se dessine dans les cinq ans qui viennent?

 

Liva Ralaivola

Alors ça, c'est un peu fictionnel. Alors c'est à la fois fictionnel et c'est à la fois...

 

France Charruyer

On est là pour rêver ensemble.

 

Liva Ralaivola

Alors il y a deux choses. C'est à la fois fictionnel et c'est en même temps ce qui a toujours eu cours depuis des années. Sauf que ce que je crois, moi, c'est que ça va s'objectiver de plus en plus et qu'on va venir travailler vraiment au niveau de la donnée. Donc quand je dis que ça a déjà cours, c'est qu'aujourd'hui, il y a le monde de la publicité en ligne, mais il y a d'autres mondes où il y a cet aspect-là, ne serait-ce que le web 2.0, où on a des échanges qui se font entre la personne qui va recevoir une publicité, qui va peut-être cliquer dessus. En cliquant dessus, elle va donner de l'intelligence ou elle va fournir de la donnée. Les gens qui vont fournir des produits, ils vont aussi donner de l'intelligence et de la donnée à l'ensemble de ce qu'est le web. Et donc, en fait, il y a déjà un échange qui est organisé. Et nous, Criteo, ce qu'on doit faire, c'est précisément valuer cet échange en disant, ce produit-là, il irait bien sur ce site-là, à cet endroit-là, pour cet utilisateur-là. Et l'échange de valeurs va être tel qu'on va rémunérer le publisher, enfin l'éditeur qui va mettre de la publicité en ligne. Et puis ensuite, on va avoir un autre échange qui va se faire avec l'annonceur qui va fournir un bien ou un service à l'utilisateur final. Et donc, en fait, ce qu'on fait depuis longtemps, c'est précisément cet échange entre trois parties. Et ce qu'on essaie de trouver, nous, chez Criteo, et ce qu'on sait bien faire, c'est trouver le bon prix qui permet de faire cet échange. Et en fait, maintenant, on peut se dégager de simplement l'aspect publicitaire, même si c'est ce qui est quand même en creux, et se dire que ce qui se passe, c'est que chaque entité avec laquelle on travaille fournit de la donnée. Ces données sont peut-être très hétérogènes. Et ce qu'on va essayer de faire de ces données, un peu comme de la matière première, c'est d'en extraire ce qui est très important et ce qui va permettre de faire ces échanges-là. Et en fait, l'outil qui va nous permettre de faire de l'extraction, le déric, l'équivalent du déric pour les pluies de pétrole, c'est l'intelligence artificielle. On va prendre des données qui seront brutes, hétérogènes, qui seront parcellaires. Et l'intelligence artificielle permettra d'extraire de la donnée et de raffiner la donnée. Et à partir de ça, on va être capable de faire cet échange. Et en fait, c'est un travail qui est assez important, qui vient un peu à la suite de tout ce qu'on entend en tant que grand public, tout ce qu'on voit qui est vraiment les LLM, l'IA générative, qui est vraiment à portée de main. En fait, il faut savoir que derrière, il y a tout ce travail qui est fait et qui est étudié, notamment du point de vue de la recherche scientifique, sur ce qu'on appelle la data valuation. la valuation des données, les critères d'utilité des données et le marché des données.

 

France Charruyer

Est-ce qu'on ne va pas avoir une dévaluation du travail des créatifs, des traducteurs, des community managers, des journalistes réduit au rôle de babysitter de l'IA dans cette place de marché?

 

Liva Ralaivola

Alors, il y a deux sujets presque différents. Il y a un sujet qui est large, qui est, que va-t-il se passer avec l'avènement de ces outils d'intelligence artificielle qui sont de plus en plus sophistiqués pour certains métiers? Et puis, il y a l'autre question qui est plus liée à la place de marché. Donc, sur la place de marché, je pense que c'est, ce que je vais répondre assez rapidement, c'est un sujet sur lequel, je pense, les gens se penchent actuellement. On est en train d'essayer de voir, d'organiser ces places de marché. On voudrait les organiser de manière presque générique. Souvent, vous allez m'entendre parler de généricité ou d'invariance parce que quand on est chercheur, ce qu'on essaie de faire, c'est de trouver des invariances sur des sujets. Une fois qu'on a une invariance, on est content parce qu'on arrive à trouver des solutions qui sont génériques, qui peuvent être utilisées à plein d'endroits différents. Et donc, ces places de marché, ces places de marché de données, c'est un endroit qui est un objet d'étude qui est important et qui met côte à côte des gens de l'économie, de la théorie des jeux, du machine learning. S'agissant de l'autre question, en fait, c'est une question sur laquelle je ne vais pas dire grand-chose, ou en tout cas, pas grand-chose d'intelligent, parce que c'est les principes...

 

France Charruyer

Que ça soit spontané.

 

Liva Ralaivola

C'est les principes de destruction créatrice qui sont toujours...

 

France Charruyer

Chers à Agamben…

 

Liva Ralaivola

Schlumpeter, c'est des choses qui arrivent, qui disent qu'il y a eu des révolutions qui sont passées à plusieurs époques dans l'humanité. À chaque fois, il y a eu cette question de la destruction de...

 

France Charruyer

Destruction création. Vous savez, c'est très intelligent.

 

Liva Ralaivola

Je ne sais pas. Je ne sais pas, mais en tout cas, il y a toujours ce phénomène. Il y a toujours cette question de déplacement de connaissances, de déplacement d'expertise. Et puis après, il y a un autre aspect qui est beaucoup moins, je pense, d'un point de vue micro, qui n'est peut-être pas le plus glamour, mais d'un point de vue macro qui est intéressant, c'est qu'il y a un déplacement des expertises qui va être demandé. Et d'un point de vue macro, je pense qu'il y a quand même une demande d'expertise en IA, de l'utilisation de ces outils qui va être généré, qui va apparaître.

 

France Charruyer

Alors pour finir, j'ai deux questions encore, assurez-vous, ça va bientôt être fini. Les challenges entre R&D et course au mieux-disant, est-ce qu'on assiste à une guerre à mort à la puissance de calcul ou à une logique plus inventive, plus souple, plus sobre, chère aux Chinois notamment dans l'avalanche de produits issus du chat maigre, et vous pardonnerez l'expression, ou vers des... On stimule des IA hybrides à l'heure où la Chine vient d'indiquer qu'elle ne commanderait plus de puces Nvidia. Est-ce qu'on n'a pas deux mondes qui vont s'opposer?

 

Liva Ralaivola

Alors, je pense... Alors là, c'est vraiment un avis que je n'ai pas vraiment travaillé. Je pense qu'il y a deux mondes qui s'affrontent. Il y a vraiment cette course ça au plus gros, plus puissant, qui a des bénéfices quand même, parce que c'est là qu'il y a des effets d'échelle. En consommant plus de données, tout à coup, on voit apparaître un savoir-faire, une expertise dans ces modèles d'IA qu'on n'avait pas vu avant. Et donc ça, c'est vraiment important. Et en même temps, pour des raisons purement économiques et des raisons aussi de rapidité et de latence de ces modèles, il y a tout un pan de la recherche et tout un pan de l'innovation qui essaie de faire des modèles plus petits, plus adaptés, plus réactifs. Et donc, ces modèles-là, ils vont avoir de plus en plus d'adeptes, ne serait-ce que parce que, encore une fois, tout le monde n'a pas la capacité à acheter des GPU, à acheter des puissances de calcul complètement folles. Et donc, ça, ça va avec un aspect qui est hyper important, que moi, je trouve vraiment fondamental. C'est qu'aujourd'hui, dans tous les cursus universitaires, on commence à avoir de l'IA qui est proposé. Et donc, ça met à disposition de plus en plus de gens la possibilité de réapprendre d'autres modèles avec moins de ressources de calcul. Et donc, il y a peut-être une autre communauté qui est en train de se dessiner, qui est peut-être plus distribuée, qui ressemble peut-être à de l'open source. On va voir, mais de l'open source complètement distribuée, c'est-à-dire même faite de non-experts. Et précisément, les non-experts, ce qu'ils pourront apporter, et ça, je reviens à l'histoire des places de marché, les non-experts, s'ils ne savent pas programmer, s'ils ne savent pas faire des modèles, ce qu'ils vont apporter, c'est précisément des données, comme je l'ai dit précédemment. Et donc, c'est leur manière de contribuer à la création de nouveaux modèles peut-être plus frugaux, plus distribués, qui seront plus le bien commun. Et donc il y a un peu ces deux courants qui marchent en parallèle.

 

France Charruyer

Finalement la troisième voie, chère à Data Ring, celle des communs, c'est-à-dire la production de valeurs tous ensemble, d'intelligence collaborative et collective. Et ces espaces publics où on retrouve le sens de l'altérité, on retrouve le sens de l'échange, même si je vous torture un peu, mais avec beaucoup d'affection. J'ai envie de vous poser une dernière question. Comment vous faites, vous qui êtes un chercheur, pour faire le pont entre la recherche académique et le business?

 

Liva Ralaivola

Alors, d'abord sur ma caractéristique de chercheur, au fond de moi, je le suis vraiment, vraiment. Dans la pratique, comme je dois gérer ce lab, j'ai moins le temps de produire de la science. Donc, je suis un quart de chercheur, on va dire. Et la deuxième chose qui est fondamentale, et on va revenir à l'histoire des invariants dont j'ai parlé tout à l'heure, les chercheurs, pour avoir des idées de sujets sur lesquels ils travaillent, ils doivent avoir des contraintes. On ne peut pas juste leur dire, fais de la recherche. Et donc, c'est pour ça que quand quelqu'un commence une thèse de doctorat, on lui donne un sujet de thèse. Et pour ça qu'on lui donne, qu'il a un ensemble d'outils, des outils parfois mathématiques, parfois ça peut être dans sciences humaines, parfois ça peut être en biologie. Et ces outils-là vont finalement venir contraindre l'endroit dans lequel il va pouvoir se déplacer. Et c'est comme ça partout. Et donc, le fait d'être lié à du business, au lieu de contraindre, ça va aussi alimenter de nouvelles problématiques. On se dit, ah tiens, quand je parlais d'invariance, ce qu'on essaie de voir, c'est, tiens, ce problème-là, on veut essayer de proposer à un utilisateur le bon produit, on veut le faire en moins d'un milliseconde avec très peu de données. Comment on fait ça? Et là, on se pose la question en tant que chercheur, quel est le problème exact qu'on est en train de voir? En fait, c'est un problème de recommandation. Mais la recommandation, comment ça s'écrit? Avec quel type de modèle mathématique? Et donc, on recule, on recule, on recule. Et à la fin, on se dit, ah ben voilà, en fait, ce problème s'écrit comme je veux minimiser telle fonction sous telle contrainte avec x, y qui apparaissent ici. Et puis, on arrive à un problème mathématique qui est intéressant en tant que tel, un problème scientifique qui est intéressant pour la communauté. Et après, la question, c'est de pouvoir redescendre, entre guillemets, à la paillasse et de pouvoir l'utiliser au problème qui l'a suscité. Et donc, il y a plutôt quelque chose de très vertueux à être dans une contrainte business qui vient alimenter de problématiques et qui, en plus, est le terrain de jeu pour essayer et éprouver les modèles qui ont été créés d'un point de vue de la recherche presque fondamentale.

 

France Charruyer

Mais quelle réponse? Vous avez synthétisé aujourd'hui ce qui différencie une intelligence artificielle, quelle qu'elle soit, d'un homme. C'est-à-dire que l'IA ne doute jamais, elle produit des réponses, Alors que l'homme se pose beaucoup de questions, et il a raison de tout, c'est celle de l'esprit. Et nous en terminons avec Data Ring sur ses podcasts. Et à bientôt, je l'espère.

 

Liva Ralaivola

Merci.