VALIBEL: contenu

VALIBEL

Le centre Valibel – Discours et Variation gère une base de données textuelles comprenant actuellement 22 corpus constitués d'enregistrements de productions orales (1987-1995), transcrits et encodés sur support informatique. Ces corpus représentent 373 heures d'enregistrement auprès de 533 informateurs originaires de Bruxelles et de la Wallonie. L'ensemble de ces corpus compte plus de 3 900 000 mots, correspondant à quelques 9 000 pages transcrites et encodées. La répartition des informateurs (au moment de l'enregistrement des corpus) est la suivante :

sexe âge lieu de naissance
degré de scolarité profession localisation géographique

 

La base de données VALIBEL est une base de données "ouverte" et non un méga-corpus clos, constitué une fois pour toutes. Il convient donc de gérer en permanence l'accroissement des données textuelles et leur diversité. Ainsi pas moins de 194 enregistrements réalisés depuis 2000 attendent d'être versées dans la base de données (transcriptions, allignements et/ou révisions incomplets).

La plupart des corpus ont été réalisés à l'occasion de recherches orientées vers des thématiques précises: enquêtes sur l'accent, sur les représentations linguistiques, sur la liaison, etc. Néanmoins, ces corpus peuvent être exploités à diverses fins (sociolinguistique, lexicologique, pragmatique, syntaxique, didactique).

Chaque corpus est accompagné de fiches d'identification précisant :
• les caractéristiques sociologiques de chaque locuteur (âge, degré de scolarité, profession, etc.);
• les caractéristiques de l'interaction elle-même (durée, nombre de locuteurs, contextes spatial et temporel, degré de formalité, etc.).

Actuellement, la banque de données Valibel est constituée des 22 corpus suivants, dont une partie seulement est consultable via l'interface [moca], les autres données sont accessibles sur demande (via le formulaire en ligne):


 Corpus

Taille

# enreg / # loc

 Thématique

 Date de constitution 

 Format vidéo

 Type d'interaction

 Degré de formalité

Dans [moca]

 nor

 32/30

"Norme(s) de prononciation et accents régionaux. Réflexions et enquêtes sur un aspect du français parlé en Belgique francophone et ses incidences dans l'enseignement". (mémoire de licence, UCL)

 1988

 non

interview

semi-formel

 non

 dig

 14/43

Étude des représentations linguistiques d'une communauté ardennaise

 1987

 non

 interview

semi-formel

 non

 sou

 1/7

"Ellipse et cohésion d'après Halliday et Hasan. Application à un corpus oral spontané". (mémoire de licence, UCL)

 1988

 non

 conversation

informel

 non

 acc

 50/51

"Les locuteurs et l'accent régional. Enquête sociolinguistique dans la région de Charleroi". (mémoire de licence, UCL)

 1989

 non

 interview

semi-formel

 non

 job

 4/4

"Analyse des comportements linguistiques et stratégies mis en jeu lors d'entretiens de recrutement". (mémoire de licence, UCL)

 1989

 non

 interview

formel

 non

 lec

 1/1

"Une classe de français dans l'enseignement secondaire supérieur (leçon consacrée à l'analyse d'un texte littéraire) au collège d'Alzon (Bure)".

 1989

 oui

 discours pédagogique

semi-formel

 non

 lia

 40/40

"Approche sociolinguistique de la liaison". (mémoire de licence, UCL)

 1989

 non

 

 

 non

 ibm

 1/5

"Stratégies d'ajustement du discours et des comportements. Application à un entretien commercial". (mémoire de licence, UCL)

 1989

 non

 conversation

semi-formel

 non

 alt

 2/3

"L'alternance de codes. Problèmes théoriques et application à un corpus français-espagnol". (mémoire de licence, UCL)

 1989

 non

 conversation

"code-witching"

informel

 non

 deb

 2/11

"La maîtrise des tours de parole dans un débat télévisé". (mémoire de licence, UCL)

 1990

 oui

 débat

formel

 oui

 mag

 1/2

"La variation lexicale (les emplettes)". (enregistrement réalisé à Bastogne)

 1990

 non

 

 

 non

 plu

 6/13

Tintange, le village aux quatre langues

 1990

 non

 

 

 non

 mar

 14/16

"Bruxellois et fiers de l'être. Pratiques et attitudes linguistiques dans le quartier des Marolles". (mémoire de licence, UCL)

 1991

 non

 

 

 non

 ilr

 108/108

Les jeunes Belges francophones et l'insécurité linguistique

 1991

 non

 interview

semi-formel

 non

 sci

 55/22

Verbalisation des concepts scientifiques (recherche menée en collaboration avec le laboratoire de pédagogie des sciences, UCL)

 1991

 non

 

 

 non

 cha

 7/7

La productivité lexicale des corpus oraux

 1992

 non

 

 

 oui

 med

 

"La langue des médias". (mémoires de licence, UCL , Olivier De MUL et Anne-Françoise KROONEN)

 1992

 non

 

 

 non

 ile

 50/50

Représentations linguistiques des journalistes belges francophones de la presse écrite

 1993

 non

 interview

semi-formel

 non

 ilj

 25/25

Représentations linguistiques des journalistes belges francophones de la presse audiovisuelle

 1993

 non

 interview

semi-formel

 non

 ilc

 50/50

Les décideurs économiques francophones face au français

 1994

 non

 interview

semi-formel

 non

 ilp

 49/49

"L'insécurité linguistique en Belgique francophone. Enquêtes sur les représentations linguistiques de la classe politique". (mémoire de licence, UCL)

 1992-97

 non

 interview

semi-formel

 non

 irt  31/9    2000        
 fam  15/9    2003        
 bla  60/12    2004   conversation    
 sty  11/11    2008      formel  oui
 aca  4/4    2006-2008    allocution  formel  

 

A suivre...