Le centre Valibel – Discours et Variation gère une base de données textuelles comprenant actuellement 22 corpus constitués d'enregistrements de productions orales (1987-1995), transcrits et encodés sur support informatique. Ces corpus représentent 373 heures d'enregistrement auprès de 533 informateurs originaires de Bruxelles et de la Wallonie. L'ensemble de ces corpus compte plus de 3 900 000 mots, correspondant à quelques 9 000 pages transcrites et encodées. La répartition des informateurs (au moment de l'enregistrement des corpus) est la suivante :
sexe | âge | lieu de naissance |
degré de scolarité | profession | localisation géographique |
La base de données VALIBEL est une base de données "ouverte" et non un méga-corpus clos, constitué une fois pour toutes. Il convient donc de gérer en permanence l'accroissement des données textuelles et leur diversité. Ainsi pas moins de 194 enregistrements réalisés depuis 2000 attendent d'être versées dans la base de données (transcriptions, allignements et/ou révisions incomplets).
La plupart des corpus ont été réalisés à l'occasion de recherches orientées vers des thématiques précises: enquêtes sur l'accent, sur les représentations linguistiques, sur la liaison, etc. Néanmoins, ces corpus peuvent être exploités à diverses fins (sociolinguistique, lexicologique, pragmatique, syntaxique, didactique).
Chaque corpus est accompagné de fiches d'identification précisant :
• les caractéristiques sociologiques de chaque locuteur (âge, degré de scolarité, profession, etc.);
• les caractéristiques de l'interaction elle-même (durée, nombre de locuteurs, contextes spatial et temporel, degré de formalité, etc.).
Actuellement, la banque de données Valibel est constituée des 22 corpus suivants, dont une partie seulement est consultable via l'interface [moca], les autres données sont accessibles sur demande (via le formulaire en ligne):
Corpus |
Taille # enreg / # loc |
Thématique |
Date de constitution |
Format vidéo |
Type d'interaction |
Degré de formalité |
Dans [moca] |
nor |
32/30 |
"Norme(s) de prononciation et accents régionaux. Réflexions et enquêtes sur un aspect du français parlé en Belgique francophone et ses incidences dans l'enseignement". (mémoire de licence, UCL) |
1988 |
non |
interview |
semi-formel |
non |
dig |
14/43 |
Étude des représentations linguistiques d'une communauté ardennaise |
1987 |
non |
interview |
semi-formel |
non |
sou |
1/7 |
"Ellipse et cohésion d'après Halliday et Hasan. Application à un corpus oral spontané". (mémoire de licence, UCL) |
1988 |
non |
conversation |
informel |
non |
acc |
50/51 |
"Les locuteurs et l'accent régional. Enquête sociolinguistique dans la région de Charleroi". (mémoire de licence, UCL) |
1989 |
non |
interview |
semi-formel |
non |
job |
4/4 |
"Analyse des comportements linguistiques et stratégies mis en jeu lors d'entretiens de recrutement". (mémoire de licence, UCL) |
1989 |
non |
interview |
formel |
non |
lec |
1/1 |
"Une classe de français dans l'enseignement secondaire supérieur (leçon consacrée à l'analyse d'un texte littéraire) au collège d'Alzon (Bure)". |
1989 |
oui |
discours pédagogique |
semi-formel |
non |
lia |
40/40 |
"Approche sociolinguistique de la liaison". (mémoire de licence, UCL) |
1989 |
non |
|
non |
|
ibm |
1/5 |
"Stratégies d'ajustement du discours et des comportements. Application à un entretien commercial". (mémoire de licence, UCL) |
1989 |
non |
conversation |
semi-formel |
non |
alt |
2/3 |
"L'alternance de codes. Problèmes théoriques et application à un corpus français-espagnol". (mémoire de licence, UCL) |
1989 |
non |
conversation "code-witching" |
informel |
non |
deb |
2/11 |
"La maîtrise des tours de parole dans un débat télévisé". (mémoire de licence, UCL) |
1990 |
oui |
débat |
formel |
oui |
mag |
1/2 |
"La variation lexicale (les emplettes)". (enregistrement réalisé à Bastogne) |
1990 |
non |
|
non |
|
plu |
6/13 |
Tintange, le village aux quatre langues |
1990 |
non |
|
non |
|
mar |
14/16 |
"Bruxellois et fiers de l'être. Pratiques et attitudes linguistiques dans le quartier des Marolles". (mémoire de licence, UCL) |
1991 |
non |
|
non |
|
ilr |
108/108 |
Les jeunes Belges francophones et l'insécurité linguistique |
1991 |
non |
interview |
semi-formel |
non |
sci |
55/22 |
Verbalisation des concepts scientifiques (recherche menée en collaboration avec le laboratoire de pédagogie des sciences, UCL) |
1991 |
non |
|
non |
|
cha |
7/7 |
La productivité lexicale des corpus oraux |
1992 |
non |
|
oui |
|
med |
"La langue des médias". (mémoires de licence, UCL , Olivier De MUL et Anne-Françoise KROONEN) |
1992 |
non |
|
non |
||
ile |
50/50 |
Représentations linguistiques des journalistes belges francophones de la presse écrite |
1993 |
non |
interview |
semi-formel |
non |
ilj |
25/25 |
Représentations linguistiques des journalistes belges francophones de la presse audiovisuelle |
1993 |
non |
interview |
semi-formel |
non |
ilc |
50/50 |
Les décideurs économiques francophones face au français |
1994 |
non |
interview |
semi-formel |
non |
ilp |
49/49 |
"L'insécurité linguistique en Belgique francophone. Enquêtes sur les représentations linguistiques de la classe politique". (mémoire de licence, UCL) |
1992-97 |
non |
interview |
semi-formel |
non |
irt | 31/9 | 2000 | |||||
fam | 15/9 | 2003 | |||||
bla | 60/12 | 2004 | conversation | ||||
sty | 11/11 | 2008 | formel | oui | |||
aca | 4/4 | 2006-2008 | allocution | formel |
A suivre...