|
In deze rubriek, die twee keer per week verschijnt, bericht Marie-José Klaver over ontwikkelingen op Internet. Reacties en tips: klaver@nrc.nl
|
Zoeken en vinden
MARIE-JOSÉ KLAVER Zoeken en vinden blijft moeilijk op Internet. Slechts een deel van de aanwezige websites is geïndexeerd door zoekmachines. Naarmate het aantal webpagina's toeneemt, neemt de vindbaarheid van informatie af. In december 1997 was 60 procent van de 300 miljoen webpagina's te vinden via de zes grootste zoekmachines (AltaVista, Excite, HotBot, Infoseek, Lycos en Northern Light), aldus het onderzoek Accessibility of information on the web dat in juli 1999 in Nature is verschenen. In februari 1999 zijn er volgens onderzoekers Steven Lawrence en C. Lee Giles van het NEC Research Institute in Princeton ongeveer 800 miljoen webpagina's, waarvan 42 procent te vinden is via zoekmachines. Voor de tweede studie zijn 11 zoekmachines onderzocht. Het world wide web wordt een steeds belangrijker informatie- en publicatiebron. Lawrence en Giles noemen wetenschappelijke artikelen als voorbeeld. Voordat ze in tijdschriften worden gepubliceerd en in databanken van universiteitsbibliotheken en uitgeverijen terecht komen, publiceren wetenschappers hun artikelen op hun eigen homepage of op de site van hun vakgroep of faculteit. Als de papers niet in zoekmachines terechtkomen, blijven ze onvindbaar voor collega's en andere geïnteresseerden. Er komen steeds meer algemene en gespecialiseerde zoekmachines bij, wat zoeken steeds tijdrovender maakt. In 1997 had je aan 6 algemene zoekmachines genoeg. Nog geen anderhalf jaar later moesten Lawrence en Giles er al elf onderzoeken om een enigszins compleet overzicht te maken. Voor een nieuwe zoekmachine-studie zullen Lawrence en Giles waarschijnlijk 13-15 search engines moeten testen. Niet alle nieuwe zoekmachines zijn ook even goed. Gestimuleerd door het commerciële succes van grote search engines als Yahoo! en AltaVista proberen steeds meer bedrijven een eigen zoekmachine op te zetten. Zo werd in Nederland vorige week de zoekmachine Zoekhet geopend. Zoekhet had gisteren 1.905 Nederlandse webpagina's geïndexeerd, vertelt eigenaar Emile Verbeek. Het is de bedoeling dat Internetgebruikers zelf hun homepage aanmelden. De meeste zoekmachines hebben een minder afwachtende houding en sturen een spider of crawler op pad om sites aan de databank toe te voegen. Webcrawlers zijn robotachtige computerprogramma's die samenvattingen van websites (titel van de pagina, trefwoorden, plaatjes en andere bestanden) maken. Verbeek hoopt over 2 jaar meer dan een miljoen pagina's in zijn database te hebben. Dat is een mooi streven, maar maakt Zoekhet er op dit moment niet bruikbaarder op. Wie nu iets zoekt bij de nieuwe zoekmachine, weet vrijwel zeker dat het onvindbaar is. Een praktischer nieuw zoekinitiatief is SelfSeek. SelfSeek is een zoekmachine die op de PC van de gebruiker draait. Het programma doorzoekt de sites die de gebruiker opgeeft. Voor gerichte zoekacties heeft dat grote voordelen. Veel websites hebben geen eigen zoekmachine of een heel slechte (langzaam, onnauwkeurig, niet actueel). En veel zoekmachines indexeren slechts een paar pagina's van een website. Sommige sites bestaan uit tienduizenden pagina's. Als je vermoedt dat de informatie die je zoekt op een bepaalde site staat, doorzoekt Selfseek die hele site. Een traditionele zoekmachine beperkt zich tot de pagina's die ze zelf heeft bezocht en geïndexeerd. Een ander nieuw zoekprogramma is GuruNet. GuruNet, dat net als SelfSeek gratis is, is een soort levende encyclopedie. Het programma werkt op de achtergrond. Als een gebruiker bijvoorbeeld op de site van de New York Times een artikel over Shell leest en meer wil weten over dat bedrijf, klikt hij het woord aan. GuruNet komt dan in een apart venster met een korte beschrijving van Shells activiteiten en links naar artikelen over het bedrijf. Klikken op Peter Mandelson in een artikel over het opgeschorte zelfbestuur levert een uitgebreide biografie van de minister op. Alwetend is GuruNet niet. Over Roger van Boxtel en Bram Peper weet het programma niets. Spy on it is de naam van een nieuwe zoekdienst voor mensen die steeds naar dezelfde informatie op Internet zoeken. Fans van filmsterren of publicisten bijvoorbeeld kunnen de naam van het object van hun adoratie invullen bij Spy on it. Elke keer als er iets nieuws over of van de ster of schrijver op het web verschijnt, ontvangen ze een e-mail met de vindplaats. Spy on it is ook praktisch voor mensen die in algemene onderwerpen zijn geïnteresseerd, zoals biotechnologie, strafrecht of beleggen.
Accessibility of information on the web: www.wwwmetrics.com
Zoekhet: www.zoekhet.nl
SelfSeek: www.selfseek.com
GuruNet: www.guru.net
Spy on it: www.spyonit.com
|
NRC Webpagina's 14 februari 2000
|
Bovenkant pagina |
|