Justin Roy bio photo

Justin Roy

Chargé de projet à Minwashin

Email

L’application de méthodes de fouille de textes (text mining ou text analytics) gagne en importance auprès des partis politiques canadiens. Cette tendance met en évidence la pertinence, pour les chercheurs et chercheuses en science politique, de considérer ces procédés en contexte de recherche. Aussi avons-nous, Yutaka Suzuki et moi, soumis à divers algorithmes d’intelligence artificielle les plateformes électorales des principaux partis politiques québécois. Ce billet de blogue fait le compte-rendu d’une partie de notre travail.

Analyser le discours des partis politiques avec la méthode du calcul des spécificités

Inspirés par les travaux de Dominic Forest et de Damon Mayaffre, nous avons recouru au calcul des spécificité pour relever les mots caractéristiques de 5 partis : la Coalition avenir Québec (CAQ) ; le Parti libéral du Québec (PLQ) ; Québec solidaire (QS) ; le Parti québécois (PQ) ; le Parti conservateur du Québec (PCQ).

Made with Flourish

Coalition Avenir Québec

Les mots « enfant », « scolaire » et « décrochage » sont surreprésentés dans les documents programmatiques de cette formation. Cette spécificité concorde avec les nombreuses allocutions lors desquelles François Legault a affirmé qu’une de ses priorités était l’éducation ; elle découle peut-être aussi du fait que la CAQ a souvent courtisé le vote des familles. Notons que ces termes sont aussi surreprésentés au PCQ, tout comme l’est « contribuable ». Les deux formations, campées à droite de l’axxe politique, semblent donc se disputer un même électorat.

Parti Libéral du Québec

Les documents programmatiques de ce parti affichent une sur-représentation de termes génériques. Les mots à saveur procédurale, comme « conseil », « membre », « exécutif » ou « comité » , y abondent. Cette absence de contenu idéologique, au sein même des documents pourtant censés traduire l’orientation politique du P.L.Q., pourrait refléter un mal qui gangrène le parti depuis quelques années, à savoir que la formation peine à redéfinir son identité à une époque marquée par la disparition progressive du clivage souveraineté-fédéralisme. La perte en vitesse de ce débat, qui profitait encore à Charest en 2003, semble avoir privé le Parti libéral d’un projet central, inscrit dans la longue durée. Rappelons toutefois que la plateforme électorale complète du parti pour 2022 n’était pas accessible au moment de constituer notre corpus.

Québec Solidaire

Les mots « droit », « femme », « peuple » et « autocthone » sont sur-représentés au sein des documents programmatiques de ce parti marqué à gauche de l’échiquier politique, mais sous-représentés chez les autres formations. Le thème de la démocratie et de la citoyenneté, exprimé par les mots « participatif », « collectivité » et « citoyen », distingue également Q.S. Certains parallèles entre les formes caractéristiques de QS celles et des autres partis s’avèrent dignes de mention. D’abord, soulignons qu’à la fois QS et le PQ se démarquent par leur surutilisation des mots « communautaires », « travailleur », « public » et « social ». Puis, que le PCQ comme QS emploient plus souvent que les autres formations les termes « alternative », caractéristique d’une posture contestataire, et « public », lequel fait écho à un sujet sur lequel les deux partis s’opposent : celui du financement des services publics.

Parti Québécois

La surreprésentation des mots « fier », « protéger », « français », « indépendance » et « nation » évoque le caractère nationaliste de cette formation traditionnellement attachée à la protection de la langue française et à la séparation du Québec du reste du Canada. À cet égard, soulignons deux choses. D’abord, que le terme « indépendance » est sous-représenté chez QS, une formation pourtant indépendantiste. Puis, que « français » est aussi surutilisé par la CAQ, qui a déposé une refonte de la Loi 101 plus tôt en 2022. Pour revenir au PQ, la surrutilisation de certains mots associés à la transition énergétique - « énergétique », « émission », « réduction » - traduisent une fibre écologiste.

Parti Conservateur du Québec

Les documents programmatiques du PCQ que nous avons pu trouver traduisent des enjeux de la dernière campagne électorale. La surutilisation des mots « logement », « locataires » et «loyer » indique que la formation semble avoir fait de la question du logement une priorité, bien qu’elle nie l’existence d’une crise du logement. Sur ce point, notons que les mots « privé » et « marché », aussi surreprésentés dans les documents programmatiques des Conservateurs, sont généralement employés lorsque le parti propose supprimer des initiatives gouvernementales en matière de logement. On pourait s’étonner que la formation d’Éric Duhaime surrutilise le mot « subventionner » ; mais celui-ci est utilisé négativement par le parti, tout comme « tramway », qui fait référence à un projet de transport en commun auquel s’opposait son chef. Enfin, la surreprésentation des mots « sanitaire » et « urgence » évoque l’importance du thème de la gestion de la crise pandémique pour ce parti.

Corpus

Notre corpus rassemble les documents programmatiques émis par les cinq principaux partis politiques québécois entre 2007 et 2022. Il couvre les plateformes électorales des formations et leurs programmes ; il exclut les messages publiés par les partis sur les réseaux sociaux et les documents à saveur administrative comme les règlements.

Malheureusement, les plateformes électorales pour l’année 2022 du PLQ et du PQ n’étaient pas accessibles en ligne au moment où nous avons constitué notre corpus. Nous avons compensé ce manque en récoltant plusieurs documents officiels portant sur des enjeux spécifiques, comme le développement économique des régions et l’indépendance du Québec. Par ailleurs, aucun document émis par le PCQ avant 2020 n’était acessible en ligne au moment de créer notre corpus. Le profil de cette formation représente donc uniquement les orientations que lui a données son nouveau chef, Éric Duhaime.

Méthodologie

Le modèle du calcul des spécificités de Lafon propose de comparer la fréquence d’un mot dans un corpus en entier avec sa fréquence dans un échantillon donné. Cette approche permet de distinguer les mots dont la présence dans un texte pourrait relever du hasard (0) de ceux qui s’éloignent du modèle soit positivement (+1) ou négativement (-1). Les mots qui s’éloignent positivement du modèle sont surreprésentés dans l’échantillon, tandis que les mots qui s’en éloignent négativement sont sous-représentés.