Une étude réalisée sur près de 250 000 mots.
BestOf.one à analyser la liste de mots de la base Frantext. Cette base rassemble un corpus de 4 000 textes français allant du XVIe au XXe siècle. Elle permet d'obtenir un large évantail de mots distincts et donc d'obtenir une fréquence des lettres au plus juste. Chaque mot n'est enregistré qu'une seule fois pour les raisons décrites ci-dessous.
Pourquoi étudier la fréquence des lettres sur des mots ?
En faisant le calcul sur un ensemble de mots et non sur un ensemble de textes (corpus), nous évitons d'influencer le résultat par les styles narratifs, les types de documents et les vocabulaires spécifiques. Par exemple, un livre utilisant majoritairement le vouvoiement augmenterait considérablement le nombre de Z alors que peu de mots le contiennent.