La musique urbaine latino-américaine au crible de la linguistique de corpus : le cas Bad Bunny
Benjamin Aguilar Laguierce est traducteur professionnel. Après des études hispaniques spécialisées en traduction et linguistique (master études hispaniques et hispano-américaines) et en traduction (master traduction pour l’édition, spécialité anglais), il se dédie à la recherche en traductologie, linguistique et lexicologie, la traduction éditoriale, la jurilinguistique et la traduction technique.
Introduction
2020 semble avoir été l’année de tous les superlatifs pour Bad Bunny, chanteur de reggaeton portoricain. Artiste musical le plus écouté sur Spotify[1], il a reçu plusieurs nominations aux Latin Grammy et Grammy Awards avant d’être reconnu compositeur de l’année 2020 par les prestigieux prix ASCAP[2].
Méthodologie
C’est ce contexte qui nous invite à nous pencher sur l’œuvre de Bad Bunny pour en tirer des conclusions d’un point de vue linguistique. Aussi, afin d’obtenir un échantillon cohérent et scientifiquement viable, nous avons décidé d’étudier le corpus de paroles des chansons issues de l’album YHLQMDLG sorti en 2020. Cet album est composé de vingt titres, à savoir :
- Si veo a tu mamá
- La difícil
- Pero ya no
- La santa
- Yo perreo sola
- Bichiyal
- Soliá
- La zona
- Qué malo
- Vete
- Ignorantes
- A tu merced
- Una vez
- Safaera
- 25/8
- Está cabrón ser yo
- Puesto pa’ guerrial
- P FKN R
- Hablamos mañana
- <3
Pour des raisons de rigueur scientifique, nous avons rétabli dans les chansons les ablations, élisions et abréviations de mots employées. Pour des raisons de concision et de disponibilité ample de l’information, nous ne retranscrirons pas l’ensemble des paroles de chanson.
Premiers résultats
Le corpus ainsi obtenu est composé de 9455 mots, pour 2024 formes uniques, soit un indice de richesse lexicale de 0,214, ce qui est assez peu élevé[3] pour un corpus à caractère musical. Nous ne sommes pas surpris que les termes les plus fréquents soient d’abord des mots outils, à l’image de no (377 occurrences), que (308), a (234), yo (224), la (214), y(210), me (207) ou encore ey (200). Ce dernier est peut-être le premier terme surprenant dans la mesure où il s’agit d’une interjection, mais étant caractéristique du style musical du chanteur-compositeur, notre surprise est à relativiser.
Il nous est possible de deviser dès à présent une très forte concentration terminologique réflexive de la voix poétique, ce qui nous invite à penser que le moi occupe une place prépondérante dans les préoccupations de Bad Bunny (ainsi, on dénombre 547 déclinaisons de termes réflexifs : yo, me, mí et mi)
Le premier lemme dans la liste des termes les plus fréquents est perreo (34 occurrences), suivi de baby (28), ella (27), hoy(26), sola (26), mami (23) ou encore dios (15), ce qui nous donne une suite assez hétérogène et plutôt digne d’oxymore, dans un champ lexical général orienté autour des relations amoureuses voire simplement charnelles entre la voix poétique et les femmes.
Nous observons également une profusion d’onomatopées qui a de quoi dérouter certains, à l’image de ey (200 occurrences), eh (95), prr (31), ah (29), wuh (28), as (25), ja (22), yeh (21), yeah (20), mo (19), r (17), eh-eh (14), brr (12), jaja (12), ma (12), hmm (9), oh (9), be (8), he (8), mu (8), nah (8), pr (8), ay (6), bla (6) ou encore huh (6), soit un total accumulé de 579 occurrences d’onomatopées, ce qui représente pas moins de 0,6% du texte de l’ensemble des chansons de l’album en question.
Ordre | Terme | Occurrences |
1 | no | 377 |
2 | que | 308 |
3 | a | 234 |
4 | yo | 224 |
5 | la | 214 |
6 | y | 210 |
7 | me | 207 |
8 | ey | 200 |
9 | te | 174 |
10 | de | 140 |
11 | en | 135 |
12 | se | 132 |
13 | lo | 121 |
14 | pero | 106 |
15 | el | 103 |
16 | si | 101 |
17 | eh | 95 |
18 | con | 91 |
19 | está | 81 |
20 | los | 79 |
21 | qué | 68 |
22 | ya | 65 |
23 | mí | 64 |
24 | para | 60 |
25 | por | 58 |
Tableau 1 – Liste des 25 termes les plus fréquents dans YHLQMDLG
Préoccupations majeures de l’œuvre YHLQMDLG
En analysant un peu plus en profondeur la fréquence de termes connexes et redondants, il est possible de dégager quatre thématiques principales dans cette œuvre, à savoir :
Séduction
Perreo (34 occurrences), Baby (28), Sola (26), Mami (23), Gusta (12), Darte (11), Rico (11), Flow (10), Cojones (9), Entera (9), Cama (8), Duro (8), Papi (8), Perrea (8), Perrearte (8), Bum-bum (7), Amas (6), Amiguita (6), Babies (6), Culo (6), Fucking (6), Amo (5), Amor (5), Panty (5), Amiga (4), Bebé (4), Mojada (4), Romance (4).
Désir et volonté
Quiero (33), Quieres (20), Gana (15), Quieren (15).
Spiritualité
Vivo (17), Dios (16), Vida (10).
Solitude
Soltera (11), Solo (10).
Conclusion
Pour conclure sommairement, nous manifesterons notre relative surprise de ne voir que très peu de lemmes figurer au sein des 25 termes les plus fréquents de l’album en question.
[1] https://www.dw.com/es/triunfa-la-música-latina-bad-bunny-es-el-artista-más-escuchado-este-año-en-spotify/a-55785757
[2] https://www.slang.fm/noticias/bad-bunny-es-reconocido-como-compositor-del-ano-en-los-premios-ascap-2020/
[3] D’après les pistes théoriques tracées par Mathieu VALETTE, Méthodes pour la veille lexicale. Journée d’étude : le dictionnaire électronique, 2007, Kénitra, Maroc. pp.15-29. Le corpus est scindé en trois sous-corpus issus de la presse hebdomadaire française de 2004 à 2008.