Mois : avril 30, 2018

La linguistique comme de l’ingénierie.

Je n’ai jamais aimé Chomsky, malgré le fait que je n’ai jamais rien lu de lui. Ses idées sont aussi répandues dans la linguistique, du moins aux universités américaines, qu’il ne faut pas vraiment lire ses œuvres pour être exposé à ses idées. Cependant, pour moi, c’est important d’avoir une bonne idée du context dans équel des idées ont été proposées et développées, ça fait que j’ai enfin lu Syntactic Structures (Chomsky, 1957/2002), équel résume, je crois, tout quelque chose que je n’aime pas par rapport à Chomsky et l’espèce de linguistique théorique à équelle ses idées ont mené.

Mais premièrement, quittez-moi dire que je ne pense pas que Syntactic Structures est un livre sans valeur. Quand même si je ne suis pas d’accord avec un tas de ce que Chomsky a écrit, il a bien posé des questions intéressantes, et ça lui donne une value en soi. Par exemple, Chomsky a avancé que les grammaires ne devraient être développées qu’à partir des moyens formels, en mettant complètement de côté la sémantique (pp. 93-94). J’ai plusieurs arguments contre cette idée, équels je n’exposerai pas là, parce que mon point est simplement que c’est une question intéressante à considérer.

Ce que je n’aime pas par rapport à Chomsky et l’espèce de linguistique théorique qu’il a engendrée, c’est le mépris quasiment complet des preuves empiriques de quoi que ce soit. La linguistique théorique s’est proche entièrement appuyée sur les intuitions comme «données», souvent les intuitions des linguistes mêmes, non des informateurs. Malgré le fait que Syntactic Structures est souvent dépeint comme un œuvre fondateur des sciences cognitives, ça n’a jamais suggéré que les linguistes usent des méthodes comme l’expérimentation pour valider leurs théories tout comme ceux dans d’autres domaines scientifiques qui s’intéressent à la cognition feraient, tels que les psychologues et les neuroscientistes.

Il y a deux affaires dans Syntactic Structures qui ont permis aux linguistes d’aborder leur «science» comme ça, je crois:

  1. Chomsky a avancé que les grammaires n’ont pas rien à voir avec ni la synthèse ni l’analyse (p. 48)
  2. Chomsky a avancé que l’objectif de la linguistique théorique est de développer une procédure d’évaluation (pp. 50-52)

Équand il dit la synthèse et l’analyse, Chomsky veut dire la manière que les humains produisent le langage et la manière qu’eux comprend le langage, respectivement. Il ne pensait pas que les grammaires expliquent ces phénomènes, qui est absolument bizarre. Exactement quoi les grammaires expliquent sinon l’un de ces phénomènes ou les deux? On diserait qu’on est plutôt après concevoir la manière qu’une grammaire pourrait fonctionner pour ce qui est d’un être artificiel imaginé, à équel cas on n’a pas besoin de considérer des preuves empiriques générées par l’observation de ou l’expérimentation sur les êtres humains réels.

Quant à la procédure d’évaluation, Chomsky voulait dire que le développement d’une théorie linguistique qui pourrait nous dire si une grammaire donnée est la bonne grammaire pour une langue donnée est trop dur, et le développement d’une théorie linguistique qui pourrait générer une grammaire d’un corpus est encore plus dur, ça fait qu’on ferait mieux développer une théorie linguistique qui nous dit simplement si une grammaire dépeint mieux une langue donnée qu’une autre grammaire. Et selon quel critère on juge équelle la dépeint mieux? Selon la simplicité.

Mais le problème avec le focus sur une procédure d’évaluation est que ça minimise encore l’importance des preuves empiriques. Il n’y a pas de besoin de tester les êtres humains pour savoir si ça emploie des transformations, par exemple; on a juste besoin de démontrer que les transformations simplifient la grammaire plus qu’une autre proposition ferait, cette autre proposition ayant été également développée sans tester que ça s’applique à ce qui se passe dans les esprits des êtres humains.

Finalement, la direction que Chomsky a établie pour la linguistique dans Syntactic Structures ressemble s’intéresser à la meilleure manière de concevoir une grammaire efficace, non à une manière de comprendre comment les humains font le langage. Si la linguistique chomskyenne explique en définitive ce que les humains font, ce résultat est tout à fait accidentel, puisqu’il n’y a pas rien dans l’approche qui est capable d’établir ce lien.

Sans surprise, les résultats de l’approche de la linguistique à Chomsky s’applique le mieux au développement des logiciels qui traitent la synthèse vocale et la reconnaissance vocale, c’est-à-dire l’ingénierie. Les IA n’ont pas besoin de faire le langage de la même manière que les humains font le langage; ça doit simplement fonctionner. Et moi, je suis bien content que ça fonctionne. Moi j’use Google Assistant tout le temps, et j’ai hâte de pouvoir causer à ma maison comme le personnel de l’USS Enterprise cause à son vaisseau spatial.

Cependant, quant à l’avancement de la linguistique comme une science, je crois que l’approche à Chomsky, comme il l’a établie dans Syntactic Structures, a mené à une perte de temps et de ressources monumentale. De nombreux linguistes créatifs et intelligents ont passé quelques 60 années effectivement après jouer un casse-tête qui n’a pas du tout éclairé comment les humains font exactement le langage, et moi je ne pense pas que je vais trop loin si je dis que les idées à Chomsky, en combinaison avec son énorme influence dans le domaine, sont responsables.


Chomsky, N. (2002). Syntactic Structures (2e éd.). Berlin; New York: Mouton de Gruyter. (Œuvre original publié en 1957)

Comment la confusion de terminologie aide les racistes à valider leur racisme.

Plus ou moins lié à un post récent à moi, j’ai arrivé sur cet article troublant dans le NY Times par David Reich, généticien à Harvard qui ressemble être régulièrement dépeint comme «éminent», dans équel il avance l’idée que «il n’est simplement plus possible d’ignorer les différences génétiques moyennes entre ‘les races.’»1 Il ressemble avoir des motivations positives — il commence même par admettre que la race est une construction sociale — et je n’ai aucun doute que sa connaissance de la génétique est beaucoup plus profonde que la mienne, qui n’existe pas, mais malgré ses motivations et sa connaissance dans ce domaine-là, il ressemble ne pas du tout avoir consulté des spécialistes en sciences sociales. Le nœud du problème est qu’il confond «la race» et «la population». En effet, tout de suite après son admission que la race est une construction sociale, il déclare le suivant:

L’orthodoxie va plus loin en maintenant que nous devrions craindre la recherche sur les différences parmi les populations.2

Il ressemble être après user les deux termes comme synonymes, ou pour le moins, il est suffisamment négligent avec son usage des deux qu’on diserait qu’il est après les user comme synonymes. Je doute sérieusement qu’il y ait des généticiens qui avanceraient l’idée que les différences génétiques parmi les populations n’existent pas, mais ça, ce n’est pas du tout équivalent à un argument pour ou contre l’idée que les différences génétiques entre les races existent.

Il y a déjà de bonnes réponses à l’article, une sur BuzzFeed, cosignée par quelque 67 scientistes, et une autre par une la sociologue Ann Morning, qui a également cosigné l’article sur BuzzFeed. Ces réponses réussissent joliment bien à expliquer le problème avec l’article à Reich — bien que je pense que l’article sur BuzzFeed aurait mieux été si ça n’aurait pas tenté de remarquer si tant sur les trouves génétiques — ça fait, je veux juste causer pour l’exemple à Reich de sa propre recherche qui est supposé de démontrer comment la race peut être bien mise en œuvre pour l’étude de la génétique. Voilà la citation pertinente de l’article:

Pour comprendre comment on fait la recherche génétique sur les différences biologiques moyennes à travers les populations, examinons un exemple de mon propre travail. À partir de 2003 environ, j’ai commencé à explorer si le mélange des populations qui a eu lieu au cours des derniers siècles passés aux Amériques pourrait être exploité pour découvrir des facteurs de risque pour le cancer de la prostate, une maladie qui affecte 1,7 fois plus de personnes auto-identifiées comme afro-américaines qu’euro-américaines. On n’était arrivé à expliquer cet écart à partir des différences ni alimentaires ni environnementales, ce qui suggère que des facteurs génétiques peuvent jouer un rôle.

Justement, l’ascendance génétique d’environ 80% des personnes qui s’auto-identifient comme afro-américaines provient en moyenne des Africains réduits à l’esclavage et amenés aux États-Unis entre le 16e siècle et le 19e siècle. Mes collègues et moi avons cherché dans 1597 hommes afro-américains qui souffrent du cancer de la prostate les endroits dans le génome où la fraction des gènes fournis des ancêtres de l’Afrique de l’Ouest était plus grande qu’elle l’était ailleurs dans le génome. En 2006, nous avons trouvé exactement ce que nous cherchions: un endroit dans le génome avec plus de 2,8% plus d’ascendance africaine que le moyen.

Dès que nous l’avons examiné plus en détail, nous avons trouvé que cette région contenait au moins sept facteurs de risque indépendants pour le cancer de la prostate, tous plus fréquents en Afrique de l’Ouest. Nos découvertes ont pu complètement rendre compte des taux plus élevés du cancer de la prostate dans les Afro-Américains que dans les Euro-Américains. Nous avons pu conclure cela car les Afro-Américains qui ont justement une ascendance entièrement européenne dans cette petite partie de leur génome avaient plus ou moins le même risque pour le cancer de la prostate que des Européens pris au hasard.3

Reich présente ça comme un exemple de la manière que l’usage de la race comme une variable peut être fructueux, mais moi je pense que ça qu’il fait vraiment, c’est qu’il affaiblit son propre argument. Ça qu’il cause pour, finalement, ce n’est pas les Afro-Américains, mais les personnes qui ont une section de leur génome qui correspond à ça qui était souvent trouvé dans les personnes qui restaient dans l’Afrique de l’Ouest. Ça ressemble être la population qui est pertinente à son étude, mais il insiste sur le fait de causer pour ses résultats en termes de race quand même, après référer à des Afro-Américains à tout moment, un groupe culturellement divers qui est trop souvent traité comme monolithique et qui n’a pas tout à fait cette ascendance, un fait que Reich admet dans ce même extrait.

L’usage de l’étiquette afro-américain dans son explication ne sert à rien d’explanatoire et en fait n’est même pas bien précis. Ça qui vient de l’étiquette, c’est que ça permet plus facilement aux racistes de clamer qu’un généticien de Harvard a validé leur racisme, et présente des idées confondues aux personnes moyennes qui ne sont pas versées dans les subtilités des distinctions de terminologie pour référer à des groupes de personnes, dans équelles Reich, lui-même, ne ressemble même pas versé. Il dépeint ces sujets comme «auto-identifiés» plusieurs fois, ce que je suppose qu’il faise pour s’exonérer de la responsibilité pour l’usage de l’étiquette, mais comme j’ai expliqué dans un post antérieur, cette stratégie n’offre aucune protection aux gens qui seraient heurtées par les stéréotypes qui sont générées équand on use des variables sociales comme la race.

En effet, c’est vrai que ce n’est pas scientifique, mais mon sondage de Twitter m’a conduit à ça qui ressemble être trois espèces de réaction à cet article: 1) des chercheurs des sciences sociales après indiquer que l’article est irresponsable, 2) des généticiens après se moquer des scientistes doux et/ou après extoler le traitement délicat d’un thème difficile dans l’article et 3) des racistes inconditionnels et flagrants après citer l’article pour valider leur racisme. (3) devrait tracasser suffisamment ceux dans (2) pour leur faire accroire que ça devrait aller causer avec ceux dans (1) pour des meilleures méthodes pour traiter le côté social de leurs recherches.


1. «it is simply no longer possible to ignore average genetic differences among ‘races.’»
2. «The orthodoxy goes further, holding that we should be anxious about any research into genetic differences among populations.»
3. «To get a sense of what modern genetic research into average biological differences across populations looks like, consider an example from my own work. Beginning around 2003, I began exploring whether the population mixture that has occurred in the last few hundred years in the Americas could be leveraged to find risk factors for prostate cancer, a disease that occurs 1.7 times more often in self-identified African-Americans than in self-identified European-Americans. This disparity had not been possible to explain based on dietary and environmental differences, suggesting that genetic factors might play a role.

Self-identified African-Americans turn out to derive, on average, about 80 percent of their genetic ancestry from enslaved Africans brought to America between the 16th and 19th centuries. My colleagues and I searched, in 1,597 African-American men with prostate cancer, for locations in the genome where the fraction of genes contributed by West African ancestors was larger than it was elsewhere in the genome. In 2006, we found exactly what we were looking for: a location in the genome with about 2.8 percent more African ancestry than the average.

When we looked in more detail, we found that this region contained at least seven independent risk factors for prostate cancer, all more common in West Africans. Our findings could fully account for the higher rate of prostate cancer in African-Americans than in European-Americans. We could conclude this because African-Americans who happen to have entirely European ancestry in this small section of their genomes had about the same risk for prostate cancer as random Europeans.»

© 2024 Josh McNeill

Theme by Anders NorenUp ↑