U kijkt naar de website van NRC Handelsblad gedurende de periode 1995-2001. Bezoek ook de de huidige site.
Apestaartje
NIEUWS  TEGENSPRAAK  SUPPLEMENT  DOSSIERS  ARCHIEF  ADVERTENTIES   SERVICE


Archief

Discussie

In deze rubriek, die twee keer per week verschijnt, bericht Marie-José Klaver over ontwikkelingen op Internet. Reacties en tips: klaver@nrc.nl

Zoeken en vinden

MARIE-JOSÉ KLAVER
Djoerd Hiemstra is onlangs aan de Universiteit Twente gepromoveerd op een betere zoekmethode voor internet. Hij stelt een zoektechniek voor die is gebaseerd op natuurlijke taal en beter aansluit bij de manier waarop de meeste internetgebruikers denken. Zijn dissertatie 'Using Language Models for Information Retrieval' zal echter door de meeste zoekmachines niet worden gevonden omdat de tekst in PDF (portable document format) is. Alleen Google herkent sinds kort PDF's. Veel wetenschappers publiceren hun artikelen in PDF en ook overheidsorganen stellen informatie vaak in dit formaat beschikbaar. Via Google wordt nu een zee aan informatie ontsloten die voorheen nauwelijks doorzoekbaar was. Tot nu toe zijn er 13 miljoen PDF-documenten geïndexeerd.

Zolang Hiemstra's zoektechnologie nog niet beschikbaar is voor het grote publiek, zijn we aangewezen op bestaande zoekmachines als Google, Altavista en Vindex die verre van perfect zijn. De meeste zoekmachines hebben steeds meer moeite om het snel groeiende web bij te houden. Veel gebruikers van zoekmachines raken gefrustreerd omdat ze niet de informatie vinden die ze nodig hebben. Uit een Amerikaans onderzoek onder 566 internetgebruikers van 18 jaar en ouder blijkt dat slechts 18 procent van de deelnemers altijd de benodigde informatie kan vinden via zoekmachines. 29 Procent van de deelnemers raakt 'zeer gefrustreerd' door alle irrelevante informatie waarmee zoekmachines komen aanzetten. In totaal is ongeveer driekwart van de deelnemers aan het onderzoek 'gefrustreerd' als ze niet kunnen vinden wat ze zoeken. Iets minder dan de helft van de deelnemers heeft ruim een kwartier nodig om boos te worden op de zoekmachines die ze gebruiken. 86 Procent van de gebruikers vindt zoeken op het web inefficiënt.

Een ander probleem waar zoekmachines mee te maken hebben, is geldgebrek. De meeste zoeksites maken geen winst en zijn net als andere internetbedrijven afhankelijk van investeerders. David Sullivan, de hoofdredacteur van Search Engine Watch sprak onlangs zijn bezorgdheid uit over het voortbestaan van de zoekmachines. Go.com (eigendom van Disney) is bijvoorbeeld zomaar gesloten omdat het moederbedrijf geen zin had om nog langer miljoenen dollars in een verliesgevende site te pompen. Altavista, Excite en Looksmart hebben personeel moeten ontslaan om te bezuinigen. Honderden medewerkers zijn de afgelopen maanden op straat komen te staan. Sullivan geeft in zijn artikel 'The End for Search Engines?' een goed overzicht van de (financiële) geschiedenis van internationale zoekmachines. Het Nederlandse Ilse en het linkoverzicht Startpagina.nl worden waarschijnlijk verkocht door eigenaar VNU, die op zoek is naar geld om onderzoeksbureau ACNielsen te kopen. Een ander gevolg van de moeilijke financiële positie van zoekmachines is dat er bijna geen zoekmachines meer zijn die volkomen onafhankelijk zijn. Vrijwel alle zoekmachines bieden zogeheten 'gesponsorde links' aan. Gesponsorde links zijn sites die bovenaan in de lijst met zoekresultaten staan. Bedrijven betalen ervoor om op die manier onder de ogen van de zoeker te komen. Ook Yahoo, dat wel winst maakt, is twee weken geleden met betaalde links begonnen. De vermeldingen van bedrijven maken het zoeken moeilijker omdat er meer gescrolld moet worden en omdat de gebruiker veel alerter moet zijn. Je moet nu ook de tekst om een link heen lezen voordat je op een zoekresultaat klikt.

Websites:

wwwhome.cs.utwente.nl/~hiemstra/papers/thesis.pdf

www.google.com

www.searchenginewatch.com

NRC Webpagina's
12 februari 2001

    Bovenkant pagina

NRC Webpagina's © NRC Handelsblad