Prototypage d'une solution avec OpenAI platform,
par Magnétic (2/2)

Lire ou relire la première partie de l'article

Seconde partie

Les avantages d'OpenAI platform

Revenons à notre objectif : il faut détecter si un contenu est obsolète dans un contexte donné, pour que les contributeurs puissent venir corriger l'article correspondant.

Par exemple, imaginons que nous ayons une conversation pendant les vacances d'été. Si nous parlons des vacances d'hiver entre-nous, vous, vous savez déjà que je parle du passé. Un observateur externe pourrait aussi penser que je parle de mes futures vacances.

En fait, c'est le contexte de notre échange qui permettra de savoir de quoi l'on parle. Un ordinateur lambda ne peut pas avoir un contexte complet. Il ne vous connait pas personnellement, il n'a pas grandi avec vous, et ne vous pose pas des questions personnelles à la machine à café. Ce qu'il a à sa disposition, ce sont les informations que vous lui avez laissées.

À ce propos, on pourrait parler des données privées et de la tendance des GAFAM à récolter à l'excès un max d'informations privées, mais je digresse. (Source: https://www.lebigdata.fr/gafam-tout-savoir )

Pour revenir au sujet précédent, l'ordinateur n'est pas si malin que ça, il a du mal à comprendre un contexte plus fin sans indice clair. C'est là où OpenAI platform brille : avec quelques éléments de langage, le service comprend très rapidement là où nous voulons en venir et peut sortir des contenus avec un minimum de corrélations et de contextes fournis par ses utilisateurs. En lui donnant explicitement un peu de contexte en amont, les modèles pré-entrainés peuvent nous sortir des identifications très proches de la réalité.

Nous avons déjà des informations liées aux articles, comme leurs dates de publication, que nous enregistrons. Corrélées avec les détections fournies par les modèles d'OpenAI, nous obtenons très rapidement un algorithme qui va nous identifier les sujets identifiés dans les contenus.

Et c'est cela que je souhaite exprimer : notre besoin colle parfaitement à ce dont est capable le service. Nous avons un objectif qui est d'identifier les contenus obsolètes, mais pas de les rédiger. Au final, le résultat est binaire. "Est-ce que cet article est obsolète ? Oui ou non ?"

La cerise sur le gâteau, c'est que nous pouvons demander au service de se justifier. Avec nos paramètres, cela génère un petit contenu texte qui permet d'étoffer la détection et ajoute des résultats enrichis destinés aux utilisateurs.

Le futur du prototype

Évidemment, la dépendance à un service tiers génère pas mal d’écueils : les prix de l'API peuvent augmenter, le service peut même s'arrêter et au vu des problèmes que les générateurs par intelligence artificielle connaissent avec les futures législations européennes (sources ici et ici), pas sûr que le futur soit si prévisible que cela.

De surcroît, il ne faut pas oublier qu'OpenAI platform (et ChatGPT) sont des services proposés par une entreprise. La technologie, elle, et donc les sciences de l'informatique qui vont avec, continuent d'évoluer.

Et dans notre cas, nous avons réalisé un prototype. Notre objectif était de pouvoir valider le plus rapidement possible si notre service de détection est pertinent pour nos clients et leurs collaborateurs. À l'heure où cet article est écrit, nous avons commencé les tests avec ces derniers. Au final, ce sont les utilisateurs qui nous diront si les apports de l'intelligence artificielle correspondent à leurs besoins réels et qui trancheront de la pertinence de notre développement.

Quelques réflexions sur l'intelligence artificielle

Dans l'absolu, si l'on peut se passer de l'intelligence artificielle, il vaut mieux le faire. Premièrement, parce que ces techniques coûtent de l'énergie : il y a derrière tout ça un paquet d'ordinateurs qui consomment de l'électricité. Si votre projet peut s'en passer, et qu'un moteur de recherche suffit, voire carrément une implémentation de code naïve, ne vous fatiguez pas plus. Les questionnements sur l'IA pourraient s'ouvrir sur plein d'autres sujets. Ici, nous avons à peine évoqué les débats sur les problématiques de protection de données des utilisateurs, ou bien sur le plagiat des œuvres d'artistes par les IA qui génèrent des illustrations, ou encore le manque d'éthique dont a pu faire preuve les différents acteurs du milieu envers leurs testeurs. En outre, il y a aussi des questionnements par rapport aux apports réels et à l'éthique de l'intelligence artificielle. Je tiens à répéter que nous avons développé un outil pour aider les contributeurs et qui n'a pas pour objectif de les remplacer. Mais on pourrait se poser la question : est-ce qu'un coût de développement ne justifierait pas de remplacer les rédacteurs de notre client par un bot qui ferait tout à leur place ?

Clairement, dans notre cas, l'intérêt serait très rapidement limité : la connaissance métier nécessaire pour la rédaction est beaucoup trop précise et élevée et même si l'IA s'améliore quotidiennement à un rythme fou, nous sommes encore loin d'avoir un outil magique qui pourrait tout faire. Au final, nos tests sont pertinents car les astres se sont alignés pour notre sujet : notre prototype est parfait pour une implémentation des outils d'OpenAI. Avec des besoins définis et surtout des objectifs cadrés, nous utilisons l'IA pour améliorer la qualité de vie des gens et je pense que c'est un outil qui est parfaitement taillé pour ce cas. L'IA est un assistant, quelque chose qui permet d'aller plus loin dans les automatisations dont nous disposons déjà avec la programmation.

Et je pense que c'est le conseil que je donnerais aux équipes ou aux personnes désireuses d'utiliser l'IA. Utilisez cet outil si cela vous facilite la vie, mais surtout quand il s'agit de tâches répétitives, voire fastidieuses. Bref, employons l'informatique quand c'est pertinent et quand l'automatisation nous permet de faire des choses utiles. C'est la machine qui doit servir les humains, et pas l'inverse. Bref, il vaut mieux utiliser l'IA pour compter des arbres que pour faire de l'art et de la poésie.

Thomas Joiris - Web Développeur chez Magnétic

Crédits photo : https://unsplash.com/
Légende photo : CSIR Mk 1, un des cinq premiers ordinateurs au monde.