Une IA repère 40 000 scientifiques de premier plan négligés par Wikipedia

ia sciences wikipedia

L’IA est souvent critiquée pour sa tendance à perpétuer les préjugés de la société, mais elle est tout aussi capable de les combattre. L’apprentissage machine est actuellement utilisé pour analyser les études scientifiques et les nouvelles afin d’identifier les scientifiques éminents qui ne figurent pas sur Wikipedia. Beaucoup de ces scientifiques sont des femmes, et leur omission est particulièrement importante dans l’encyclopédie la plus populaire du monde, où 82 pour cent des biographies sont écrites sur des hommes.

La recherche a été menée par une jeune entreprise d’intelligence artificielle appelée Primer pour démontrer l’expertise de l’entreprise dans le traitement du langage naturel (NLP). Il s’agit d’un sous-domaine stimulant mais vivant de l’intelligence artificielle qui vise à comprendre et à générer du texte numérique. Wikipedia est souvent utilisé comme source pour former ce genre de programmes, mais Primer veut redonner au site.

Dans un billet de blog, John Bohannon, directeur scientifique de Primer, explique comment la société a développé un outil nommé Quicksilver (du nom de l’auteur de science-fiction Neal Stephenson « parce que nous sommes des nerds ») pour lire quelque 500 millions de documents sources, trier les chiffres les plus cités, puis rédiger un article de base sur eux et leur travail.

Par exemple, voici un article écrit par AI sur Teresa Woodruff, une scientifique qui n’a pas d’entrée sur Wikipedia mais qui a été nommée l’une des  » Personnes les plus influentes  » du magazine Time en 2013. Son travail comprend la conception d’ovaires imprimés en 3D pour les souris.

Teresa K Woodruff est une scientifique de la reproduction à l’Université Northwestern. Elle se spécialise en gynécologie et obstétrique. Elle est membre de l’Institut de recherche sur la santé des femmes. Woodruff est une scientifique de la reproduction et directrice du Women’s Health Research Institute de la Feinberg School of Medicine de la Northwestern University à Chicago. Elle a inventé le terme « oncofertilité » en 2006, et elle est au centre du mouvement depuis lors. Cinq ans plus tard, elle y parvient : le 28 mars, l’équipe annonce la naissance d’Evatar, un appareil reproducteur féminin miniature fait de tissus humains et de tissus de souris. Largement reconnue pour son travail, elle détient 10 brevets américains et a été nommée en 2013 sur la liste des  » Personnes les plus influentes  » du magazine Time. [6]

C’est un article de base, mais il est convaincant et clairement source, ce qui est le point de départ parfait pour un éditeur de Wikipedia pour créer un article sur Woodruff, dit Primer.

A ce jour, la startup a identifié 40 000 scientifiques « manquants » dont la couverture est similaire à celle des individus qui ont des articles de Wikipedia, et a publié 100 résumés d’IA. Il a également participé à trois éditions de Wikipedia destinées à améliorer la représentation en ligne des femmes dans les sciences. (Les Editathons sont des événements où les spécialistes s’enseignent mutuellement à créer et éditer des articles Wikipedia, généralement pour renforcer la couverture de leur sujet. Et comme le note Bohannon, au moins une personne repérée par la technologie de Primer a déjà reçu un article de Wikipedia à cause de cela – la roboticienne canadienne Joëlle Pineau.

Jessica Wade, physicienne à l’Imperial College de Londres qui a écrit la nouvelle entrée de Pineau, a parlé à Wired des avantages du système. « Wikipedia est incroyablement partial et la sous-représentation des femmes dans les sciences est particulièrement mauvaise « , a déclaré Wade. « Avec Quicksilver, vous n’avez pas besoin de traîner pour trouver les noms manquants, et vous obtenez une énorme quantité d’informations de bonne source très rapidement. »

Primer affirme que sa technologie s’appuie sur les travaux antérieurs de Google et d’autres chercheurs, y compris une étude publiée en janvier de cette année qui a également utilisé l’apprentissage machine pour générer des articles de base sur Wikipedia. Cependant, l’entreprise affirme que ses objectifs sont plus pratiques que cela. Plutôt que d’utiliser Wikipedia comme banc d’essai pour des expériences, elle veut créer des outils avec des avantages clairs pour l’écosystème de l’information en ligne.

Pour ce faire, Quicksilver ne se contente pas de repérer les individus oubliés et de générer des projets d’articles. Il peut également être utilisé pour maintenir les entrées de Wikipedia et identifier quand elles n’ont pas été mises à jour depuis un certain temps. La société dit que l’entrée Wikipedia pour le scientifique Aleksandr Kogan est un bon exemple. Kogan a développé l’application au cœur du scandale de Cambridge Analytica, et il a créé une page Wikipedia à son sujet en mars de cette année. Primer note que l’édition de l’entrée de Kogan s’est arrêtée à la mi-avril (ce qui signifie que les mises à jour sur Kogan, comme le fait qu’il a également accédé aux données de Twitter, n’ont pas encore été ajoutées).

Bien sûr, même des outils comme celui-ci peuvent être susceptibles d’être biaisés. Si l’abécédaire négligeait les scientifiques en raison de leur inclusion dans les nouvelles, cela pourrait bien refléter les intérêts de la presse scientifique. Mais Bohannon est convaincu que les outils de l’entreprise peuvent encore être utiles en tant qu’assistant d’un processus dirigé par l’homme.

« Les éditeurs humains de la plus importante source d’information publique peuvent être soutenus par l’apprentissage automatique « , a-t-il déclaré à The Register. « Les algorithmes sont déjà utilisés pour détecter le vandalisme et identifier les articles sous-peuplés. Mais les machines peuvent faire beaucoup plus.

Ajouter Un Commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *