On propose un indice de vocabulaire partagé γ afin d'évaluer les ressemblances et les différences entre les ensembles de mots utilisés dans deux sous-groupes d'une communauté. Cet indice mesure la différence entre le nombre moyen de mots partagés par deux locuteurs, l'un dans le premier groupe, l'autre dans le deuxième et le nombre prédit par une hypothèse nulle basée sur une distribution globale de la fréquence des mots. La formulation de γ permet des variations dans la taille de l'échantillon lexical d'un locuteur à l'autre. On présente la formule pour la variance de γ sous l'hypothèse nulle. Une application de l'indice à des données sur les emprunts à l'anglais dans le français parlé à Ottawa-Hull nous aide à comprendre l'utilisation de ces emprunts à l'intérieur des différents groupes d'âge.
An index of sharedness γ is proposed for evaluating how similar or different are the lexical stocks of two subgroups of a larger comunity. This index measures the average number of words common to the vocabulary of two speakers, one in the first group, and on in the second, in excess of (or less than) the number predicted by a null hypothesis based on a global word-frequency distribution. The formula for γ alows the size of the vocabulary sample to vary from speaker to speaker. An expression is found for the variance of γ under the null hypothesis. Applying the index to data on borrowings from English in Ottawa-Hull French leads to an understanding of the use of loanwords among different age groups.
@article{MSH_1993__121__41_0, author = {Sankoff, David}, title = {Le vocabulaire partag\'e par des sous-groupes d'une communaut\'e}, journal = {Math\'ematiques informatique et sciences humaines}, pages = {41--47}, publisher = {Ecole des hautes-\'etudes en sciences sociales}, volume = {121}, year = {1993}, zbl = {0784.92031}, language = {fr}, url = {http://archive.numdam.org/item/MSH_1993__121__41_0/} }
TY - JOUR AU - Sankoff, David TI - Le vocabulaire partagé par des sous-groupes d'une communauté JO - Mathématiques informatique et sciences humaines PY - 1993 SP - 41 EP - 47 VL - 121 PB - Ecole des hautes-études en sciences sociales UR - http://archive.numdam.org/item/MSH_1993__121__41_0/ LA - fr ID - MSH_1993__121__41_0 ER -
%0 Journal Article %A Sankoff, David %T Le vocabulaire partagé par des sous-groupes d'une communauté %J Mathématiques informatique et sciences humaines %D 1993 %P 41-47 %V 121 %I Ecole des hautes-études en sciences sociales %U http://archive.numdam.org/item/MSH_1993__121__41_0/ %G fr %F MSH_1993__121__41_0
Sankoff, David. Le vocabulaire partagé par des sous-groupes d'une communauté. Mathématiques informatique et sciences humaines, Tome 121 (1993), pp. 41-47. http://archive.numdam.org/item/MSH_1993__121__41_0/
Conséquences linguistiques du contact des langues : un modèle d'analyse variationniste", Langage et société, 43, 1988, 23-48.
, "The social correlates and linguistic processes of lexical borrowing and assimilation" Linguistics, 26, 1988, 47-104.
, , , "