A new method for computational cultural cartography: From neural word embeddings to transformers and Bayesian mixture models

Can Rev Sociol. 2022 May;59(2):228-250. doi: 10.1111/cars.12378. Epub 2022 Apr 24.

Abstract

Recently, computational social scientists have proposed exciting new methods for 'mapping meaning space' and analysing the structure and evolution of complex cultural constructs from large text datasets. These emerging approaches to 'cultural cartography' are based on a foundation of neural network word embeddings that represent the meaning of words, in relation to one another, as vectors in a shared high-dimensional latent space. These new methods have the potential to revolutionize sociological analyses of culture, but in their current form, they are dually limited. First, by relying on traditional word embeddings they are limited to learning a single vector representation for each word, collapsing together the diverse semantic contexts that words are used in and which give them their heterogeneous meanings. Second, the vector operations that researchers use to construct larger 'cultural dimensions' from traditional embeddings can result in a complex vector soup that can propagate many small and difficult-to-detect errors throughout the cultural analysis, compromising validity. In this article, we discuss the strengths and limitations of computational 'cultural cartography' based on traditional word embeddings and propose an alternative approach that overcomes these limitations by pairing contextual representations learned by newly invented transformer models with Bayesian mixture models. We demonstrate our method of computational cultural cartography with an exploratory analysis of the structure and evolution of 120 years of scholarly discourse on democracy and autocracy.

Récemment, des spécialistes des sciences sociales informatiques ont proposé de nouvelles méthodes passionnantes pour “cartographier l'espace de sens” et analyser la structure et l'évolution de constructions culturelles complexes à partir de grands ensembles de données textuelles. Ces nouvelles approches de la “cartographie culturelle” reposent sur une base de réseaux neuronaux d'intégration de mots qui représentent la signification des mots, les uns par rapport aux autres, sous forme de vecteurs dans un espace latent partagé à haute dimension. Ces nouvelles méthodes ont le potentiel de révolutionner les analyses sociologiques de la culture, mais dans leur forme actuelle, elles sont doublement limitées. Premièrement, en s'appuyant sur les encastrements de mots traditionnels, elles se limitent à l'apprentissage d'une seule représentation vectorielle pour chaque mot, ce qui réduit les divers contextes sémantiques dans lesquels les mots sont utilisés et qui leur confèrent leurs significations hétérogènes. Deuxièmement, les opérations vectorielles que les chercheurs utilisent pour construire des “dimensions culturelles” plus importantes à partir des encastrements traditionnels peuvent donner lieu à une soupe vectorielle complexe susceptible de propager de nombreuses petites erreurs difficiles à détecter dans l'ensemble de l'analyse culturelle, ce qui en compromet la validité. Dans cet article, nous discutons des forces et des limites de la “ cartographie culturelle ” computationnelle basée sur les encastrements de mots traditionnels et nous proposons une approche alternative qui surmonte ces limites en associant des représentations contextuelles apprises par des modèles de transformation nouvellement inventés à des modèles de mélange bayésiens. Nous démontrons notre méthode de cartographie culturelle computationnelle par une analyse exploratoire de la structure et de l'évolution de 120 ans de discours savants sur la démocratie et l'autocratie.