U kijkt naar de website van NRC Handelsblad gedurende de periode 1995-2001. Bezoek ook de de huidige site.
    M E D I A  
NIEUWS  | TEGENSPRAAK  | SUPPLEMENT  | AGENDA  | ARCHIEF  | ADVERTENTIES  | SERVICE 

  NIEUWSSELECTIE  
  KORTE BERICHTEN  
  RADIO & TELEVISIE  
  MEDIA  

Nederlandse spreektaal wordt in kaart gebracht


Om met computergestuurde apparaten te kunnen praten, niet alleen in losse woorden maar ook in vloeiende zinnen, wordt de Nederlandse spreektaal minutieus vastgelegd.

Door een onzer redacteuren

NIJMEGEN, 23 DEC. De Nederlandse spreektaal wordt de komende vijf jaar in kaart gebracht. Onderzoekers uit Nederland en Vlaanderen willen een lijst van tien miljoen gesproken woorden opstellen, inclusief versprekingen en vreemde uitspraken. Prof. W. Levelt van het Max Planck Instituut in Nijmegen heeft de leiding van het project 'Corpus Gesproken Nederlands'.

Het project heeft een technologisch en een wetenschappelijk doel. Huishoudelijke apparaten worden steeds vaker voorzien van computergestuurde spraakherkenners. Een lamp springt aan als je hem aanspreekt en de mobiele telefoon belt zelf de geliefde na het roepen van 'schat'. ,,Maar die spraakherkenners reageren overwegend op losse woorden. Het is de bedoeling dat ze ook vloeiende zinnen kunnen begrijpen'', zegt R.Schreuder, namens de Katholieke Universiteit Nijmegen betrokken bij Corpus Gesproken Nederlands.

Technologieconcerns worden bewust buiten het onderzoek gelaten, omdat commerciële bemoeienis volgens hem niet gewenst is. Als het project over vijf jaar is afgerond, kunnen de technologen hun apparaten testen op de resultaten.

Ook taalkundigen zitten te springen om een overzicht van de gesproken taal. ,,Al het onderzoek komt de facto neer op schrijftaal'', aldus Schreuder. In het taalproject wordt geprobeerd de frequentie van woorden in de spreektaal te bepalen. Ook wordt de grote verscheidenheid in de uitspraak onderzocht, zowel bij één persoon als tussen verschillende mensen. ,,Een snoepje in de mond kan al een andere klank opleveren. En door het verschil in tongval worden veel woorden in Utrecht anders uitgesproken dan in Limburg'', zegt hij.

In de lijst van tien miljoen woorden zullen 'de' en 'zijn' zeer veelvuldig voorkomen. ,,Het woord machinefabriek zal misschien hooguit één keer worden vermeld. Dat wordt niet veel gebruikt in het alledaagse spraakgebruik'', denkt Schreuder.

Komend voorjaar begint het onderzoek. Prof. Levelt heeft drie jaar aan de voorbereiding ervan gewerkt, waarbij niet alleen enkele Nederlandse universiteiten zijn betrokken maar ook de Nederlandse Taalunie. Sinds een jaar doen ook Vlaamse universiteiten en onderzoeksinstellingen mee. Door de deelname van Vlaanderen wordt het resultaat representatief voor het hele Nederlandse taalgebied.

Het project kost ongeveer negen miljoen gulden. Op voorstel van de Vlaamse minister-president Luc Vandenbrande heeft zijn regering besloten eenderde van het project te betalen. De Nederlandse overheid betaalt de rest.

De opzet van het onderzoek wordt de komende maanden uitgewerkt. Daarbij wordt speciaal gekeken naar Groot-Brittannië waar twee jaar geleden een soortgelijk onderzoek is afgerond.

Tijdens het onderzoek zullen waarschijnlijk zo'n vijftig mensen een paar maanden met een bandrecorder op zak lopen. Vooral het uitwerken van de cassettebandjes is een tijdrovend karwei.

Schreuder: ,,Er staat veel geruis en gerammel van kopjes op. Daarom worden ook enkele technisch zuivere, maar wel spontane interviews opgenomen.''

NRC Webpagina's
23 DECEMBER 1997


    Bovenkant pagina

NRC Webpagina's © NRC HANDELSBLAD (web@nrc.nl)