Vous êtes ici

Comment faire... - Samedi 09 Septembre 2023

Recherche d’information avec l’IA : première approche (Partie 1) : recommandations et moteurs de recherche

L’objectif de ce zoom est de communiquer sur l’intelligence artificielle (IA) d’une manière très générale et sur quelques fonctionnalités qui en découlent d’ores et déjà pour la recherche d’information.

Definition de l’I.A.

Nous retenons ici deux définitions citées dans l’article “Defining artificial intelligence for librarians” :

- celle de l’OCDE : "Artificial intelligence (AI) is ‘a machine-based system that can, for a given set of human defined objectives, make predictions, recommendations, or decisions influencing real or virtual environments. AI systems are designed to operate with varying levels of autonomy’". (OECD, 2020).

- et la définition de la Commission européenne, qui est aussi très générale : "Simply put, AI is a collection of technologies that combines data, algorithms and computing power". (European Commission, 2020: 2).

Pour aller au-delà de ces simples définitions, vous pouvez consulter notamment les ouvrages suivants au K-lab de l’ESSEC : 

Couverture du livre : sur un fond rouges, deux yeux verts. L'oeil de gauche est normal, celui de droite contient des lignes comme sur une puce électronique  Agrawal, Ajay Bansidhar. Prediction Machines : the Simple Economics of Artificial Intelligence. Boston, Massachusetts: Harvard Business Review Press, 2018.
Couverture du livre  Crawford, Kate. Atlas of AI : Power, Politics, and the Planetary Costs of Artificial Intelligence. New Haven: Yale University Press, 2021.

Et pour une compréhension simple et située par rapport à des questions sociales de l’I.A., consulter en ligne le guide en libre accès :

Couverture du livre Onuoha, Mimi and Nucera, Diana. A people's guide to AI. A People’s Guide Press, 2018

 

Usages possibles de l’I.A. pour retrouver de l’information

Trois exemples d’applications de l’IA aux services des bibliothèques envers leurs usagers sont citées dans l’article “Defining artificial intelligence for librarians” :

  • Le premier est l’usage des classements et recommandations automatisés dans les outils de découverte, tels que Discovery.
  • Le second, l’implémentation de robots conversationnels pour interagir avec les usagers de la bibliothèque, répondre à leurs questions, les orienter dans l‘usage des services et de ressources.
  • Le troisième usage est l’automatisation des revues de littérature scientifique afin de suivre l’ampleur et le rythme accéléré des publications.

Ces usages ne sont a priori pas encore très répandus pour  de raisons de coûts et de complexité d’implémentation, mais le Learning Center de l’ESSEC reste en veille sur les nouveaux outils ou fonctionnalités de ce type.

Les recommandations

Les recommandations font partie depuis plusieurs années du paysage informationnel. Elles se basent sur l’analyse de traits récurrents dans les parcours de consultation de documents d’une ou plusieurs personnes pour tenter de prévoir ce qui peut répondre à leurs besoins d’information précis.  Un exemple d’application raisonnée de ce type de techniques est fourni par la base de données CAIRN.   
Précisons pour commencer que ce service de recommandations n’est accessible qu’après la création d’un compte qui implique la gestion de données personnelles. Il faut donc bien mesurer l’intérêt d’un service demandant une contrepartie qui est loin d’être anodine. En ce sens, l’I.A. peut mettre encore plus le projecteur sur des questions d’éthique qui se posaient déjà avec acuité tant sur les réseaux sociaux que les services web gratuits monétisés par la publicité ciblée. 

Capture d'écran de la page 'création de compte' de CAIRN. Sous les champs 'nom', 'prénom' et 'adresse email', une case à cocher 'J'accepte les conditions d'utilisation de Cairn.info'

Les critères de recommandations utilisés par CAIRN sont explicités et limités à quelques-uns, en partie paramétrables par l’utilisateur lui-même : proximité sémantique, “rebonds” sur des auteurs cités en référence des publications déjà consultées, autres articles lus par des lecteurs d’un même article que vous. Le prestataire d’information rappelle que “l’algorithme ne peut se substituer à la recommandation humaine, élaborée par un expert de la discipline ou du domaine concerné.”.

Les moteurs de recherche

Depuis plusieurs années également, les moteurs de recherche se basent sur du machine learning pour délivrer les meilleures réponses aux requêtes de leurs utilisateurs. Celles-ci tendent de plus en plus à être formulées en langage naturel, et de moins en moins en combinaisons de mots-clés, équations de recherche avec opérateurs booléens ou équivalents d’une recherche avancée avec champs de recherche précis. Cette démarche garde néanmoins sa pertinence.

Capture d'écran des résultats de la recherche Google 'l'intelligence artificielle dans les moteurs de recherche'. Le premier résultat est un extrait d'un article du site geekflare.com, dont la phrase 'Le NLP permet aux moteurs de recherche IA de mieux comptendre et interpréter le langage humain' est surlignée.

Les différents usages de l’I.A. dans les moteurs de recherche visent ainsi d’une part à dédoublonner les résultats, et écarter ceux qui n’apportent pas de valeur informationnelle, tout en classant les résultats dans un ordre de pertinence évoluant sans cesse avec de nouveaux critères. D’autre part, il est utile pour les moteurs de recherche tel Google de désambiguiser les termes employés, afin de toujours mieux déchiffrer le langage naturel. Un exemple classique est celui d’une recherche sur le terme “orange” pour laquelle il faudra déterminer s’il s’agit de la ville, de la couleur, du fruit, de la marque… Cet affinage du sens permet à l’outil d’essayer de “comprendre et détecter l’intention de l’utilisateur” lorsque ce dernier inscrit sa requête dans la boîte de recherche. L’impression de pertinence qui ressort des résultats fournis par le moteur en est augmentée, et ce sans même encore faire intervenir ces fameux agents conversationnels dont il est beaucoup question actuellement.

La deuxième partie de ce Zoom abordera les agents conversationnels.

Sources :

Notez ce contenu