Comment savoir si un texte a été écrit par un homme ou une femme quand celui qui l'a écrit se dissimule derrière un pseudonyme, ou bien qu'il porte un prénom androgyne ou exotique ?
En développant un programme capable de détecter correctement le sexe de l'auteur dans 80 % des cas, le professeur Moshe Koppel et ses collègues du département d'informatique de l'Université Bar-Ilan en Israël ont apporté une réponse empirique à une vieille controverse de la linguistique : le style est-il sexué ?
D'après Koppel, les hommes, qui préfèrent catégoriser les choses, utilisent plus de déterminants (le/ la, cette/ce, un/une, etc.) et de quantificateurs (deux, plus, peu, etc.). Les femmes, elles, s'intéressent plus aux relations et recourent donc plutôt plus que les hommes aux pronoms personnels (je, tu, moi, son, etc).
L'algorithme de Koppel consiste donc à quantifier dans un texte la récurrence de 467 mots clés anglais (a, too, us, yourself, their, etc.) afin de "calculer" le sexe de son auteur. Ses travaux seront prochainement publiés dans les revues Literary and Linguistic Computing et Text...
Suite de l'article: https://www.transfert.net
Imprimé depuis Cafeduweb - Archives (http://archives.cafeduweb.com/lire/3334-programme-pour-devoiler-sexe-auteurs.html)