Skip to content

De opkomst van semantificerende diensten

23/04/2008
tags:

Het afgelopen jaar is er op de diverse blogs een aardige strijd geweest tussen de bottom-up en top-down benadering van het semantic web. Die strijd kwam er op neer dat de bottom-up benadering alle pagina’s van het internet wil annoteren (het liefst met RDF), en dat dit volgens de top-down benadering onhaalbaar en onpractisch is. Er zijn in de afgelopen jaren immers ook nauwelijks concrete resultaten geboekt met de bottom-up benadering. Het top-down kamp ziet meer in slimme applicaties die de betekenis van pagina’s kunnen doorgronden.

Gelukkig zien we steeds meer applicaties komen die een brug tussen beide overtuigingen slaan. Die zijn trouwens ook weer ruwweg in te delen in top-down services en bottom-up services. Het doel van alle services is om webpagina’s van RDF te voorzien. Zijn ze geannoteerd met RDF, dan kunnen ze met behulp van SPARQL gevonden worden. Maar ook een zoekengine als Yahoo zal binnenkort RDF kunnen herkennen en verwerken. Andere zoekengines zullen ongetwijfeld volgen.

Ik ben tot nu toe de volgende typen van services tegengekomen:

Top-down services

  • Context-herkenning, zoals bijvoorbeeld de semantic signatures van TextWise. Deze kent gewichten toe aan concepten in een pagina. Als twee verschillende pagina’s hoge gewichten toekennen aan dezelfde concepten, dan gaan ze over hetzelfde onderwerp, aldus TextWise.
  • Natural language processing, Calais is daar een voorbeeld van. De service beperkt zich overigens nu nog tot het engels.
  • Herkennen van databasestructuren achter applicaties: de meeste applicaties op het internet maken gebruik van een achterliggende database om de content op webpagina’s te tonen. In die database staan bijvoorbeeld personen met hun eigenschappen als naam, geslacht, interesses etcetera. Andere webapplicaties zien echter alleen maar een stuk tekst, waaruit ze niet direct kunnen abstraheren welke tekst een persoon voorstelt. Triplify is een dienst die probeert de achterliggende databasestructuur te doorgronden door een aantal simpele queries te stellen aan een webapplicatie. De resultaten van de queries worden vervolgens in RDF, JSON of Linked Data formaat teruggegeven.


Bottom-up services

  • Versimpeling van annotatie, zie bijvoorbeeld de Semantify-service van Dapper. Als je Dapper gebruikt hoef je geen RDF te kennen. In plaats daarvan ken je velden toe aan onderwerpen op je pagina’s. Eventueel kun je die velden linken aan semantische vocabularies, zoals bijvoorbeeld FOAF. Dapper maakt er tenslotte goede RDF van.

Services als hierboven genoemd moeten nog beter worden en gemakkelijker inzetbaar. Als je kijkt naar de stappen die je moet nemen voor inzet van Triplify of TextWise dan zullen nog niet veel webapplicaties hiervan gebruik gaan maken. Maar dat is slechts een kwestie van tijd. Hoeveel tijd precies is moeilijk te zeggen.

Advertenties
No comments yet

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s