Etude de cas
L’étape clef pour vos contenus : le classement algorithmique
C’est en classifiant bien vos contenus qu’ils pourront être visibles et accessibles à vos interlocuteurs cibles. D’expérience, confier le classement de millier d’articles et de documents l’humain génère perte de temps et manque de cohérence du fait de la subjectivité des individus. C’est pour cela qu’expert.ai – que l’agence La Suite and Co / MilleSoixanteQuatre accompagne pour ses relations presse – a développé des solutions de classement algorithmique pour des acteurs dans des secteurs aussi variés que les médias, la défense et le renseignement, le secteur public ou encore l’assurance.
Focus, avec Eric Frances et Ian Cameron d’expert.ai, sur deux exemples d’acteurs majeurs du monde des médias et de la documentation.
Politico : des parcours utilisateurs adaptés à chaque lecteur
Politico propose à ses lecteurs des articles qui traitent tant de l’actualité géopolitique que de cybersécurité ou d’innovation technologique. Sur le site internet et l’application de ce média international, le nombre d’articles référencés est considérable et ne cesse de croître. Comment dès lors l’audience peut-elle s’y retrouver ? Comment faire pour proposer à chaque lecteur des contenus susceptibles de l’intéresser ? Ce sont les questions sur lesquelles se sont penchés les spécialistes d’expert.ai pour mettre en place une taxonomie performante et spécifique à Politico en à peine trois mois.
La première étape consiste à classifier les contenus : sujets abordés, lieux, dates, évènements… Les outils d’IA sémantique ont permis d’automatiser l’attribution de mots-clefs, l’étiquetage (tag) et la classification des contenus. Confier ces tâches à un algorithme est bien plus efficace que lorsque c’est l’humain qui les réalise.
Prenons l’exemple des élections présidentielles en France. Pour un article sur les similitudes entre les programmes des différents candidats, un journaliste pourra utiliser plusieurs tags, ce qui complique fortement la remontée d’informations lors d’une recherche.
Les outils automatiques seront quant à eux capables d’identifier que l’article en question fait référence au contexte politique français d’avril 2022. Ils vont ainsi le classifier en conséquence (en utilisant le tag le plus pertinent), et pouvoir proposer au lecteur des contenus liés à cette thématique et ses préférences personnelles en les identifiant dans la base d’articles du média. Ce qui enrichit considérablement l’expérience utilisateur des visiteurs du site Politico.
« #ElectionsPrésidentielles ou #PrésidentiellesFrance ou #Elections2022 : trois étiquettes différentes pour un même sujet et une vraie perte d’efficacité lors de la remontée d’informations. »
Ian Cameron, VP Media & Entertainement chez expert.ai
BAnQ : donner accès à une base documentaire optimisée en un temps record
BAnQ est l’acronyme de Bibliothèque et Archives nationales du Québec, l’équivalent de l’INA en France. Elle dispose ainsi d’archives par milliers, sur des thématiques variées et sous des formats très différents. Comme dans une bibliothèque traditionnelle, les documents sont classés selon plusieurs critères.
Cependant pour les chercheurs, identifier le ou les documents qui vont nourrir leur réflexion n’est pas chose aisée. De même que pour la classification des articles de presse, une taxonomie efficace vient ici accélérer le processus de sélection des informations. Le temps de recherche de données est réduit, ce qui permet aux experts en interne de se concentrer sur le traitement et l’analyse, et donc d’optimiser leur valeur ajoutée.
Les outils basés sur l’IA sémantique vont même plus loin, car ils permettent d’identifier dans les documents la réponse à une question précise. Ils vont ainsi sélectionner des extraits de documents pour les mettre directement à la disposition d’un chercheur, sans que ce dernier n’ait par exemple à parcourir les 500 pages d’un rapport complet.
« Donner accès facilement aux bons documents, c’est permettre aux chercheurs de se concentrer vraiment sur leurs analyses ! »
Eric Frances, VP Sales chez expert.ai
Traitement du langage naturel et machine learning, la combinaison gagnante d’expert.ai
Pour expliquer concrètement, prenons l’exemple d’un avion : il s’agit d’un véhicule, qui atterrit sur un aéroport, qui a pour homonyme les termes « long courrier ». Les outils algorithmiques d’expert.ai intègrent cette connaissance et peuvent analyser, lire et comprendre n’importe quel contenu textuel et non structuré. Ils s’inscrivent pour cela dans une démarche hybride, et reposent sur des modèles de connaissances qui sont construits a priori.
La combinaison des modèles de connaissances et d’une taxonomie permet de comprendre les actions, d’identifier les verbes, de bénéficier d’analyses sémantiques et grammaticales… mais aussi de prendre en compte le contexte du contenu comme le ferait un être humain. Le terme « orange » dans un contenu qui parle de téléphonie fait donc référence à l’entreprise de télécommunications, alors que s’il s’inscrit dans un contexte agricole, il se rapporte au fruit. La suite de mots « couper l’herbe sous le pied » sera reconnue comme une expression française signifiant « devancer quelqu’un » et non pas comme une action de jardinage. On parle d’IA symbolique.
A cette technologie de compréhension et de traitement du langage naturel, expert.ai intègre également une composante d’apprentissage automatique (machine learning) qui lui permet, en fonction des situations et des besoins des entreprises, d’enrichir ses algorithmes et de proposer la technique la plus adaptée et les meilleures performances possibles.