Skip to content

Calais 4 brengt semantic web stap dichterbij

23/01/2009
tags:

Calais werd vorig jaar al genoemd als één van de beste semantische applicaties van dat moment. Met de komst van release 4.0 komt de echte realisatie van het semantic web in zicht. 

Nog even kort wat Calais inhoudt: Calais is een webservice die je een willekeurig stuk tekst of een webpagina kunt aanbieden. De webservice scant de tekst op entiteiten (in feite alle onderwerpen die je kunt verzinnen). Van de entiteiten die Calais herkent geeft het de metadata in RDF formaat terug.

De release bevat 2 veelbelovende nieuwe features:

Calais combineert entiteiten die hij herkent met informatie die erover bekend is in het Linked Data ecosysteem.
In de praktijk komt dat er op neer dat informatie wordt gehaald uit
Wikipedia, DBPedia, Geonames, IMDBen andere bronnen. Dat is dus echt het semantic web in actie! Calais combineert hierbij de top-down en bottom-up benadering. Het herkent entiteiten via Natural Language Processing, top-down dus, en koppelt deze bottom-up via RDF aan de Linked Data collectie.

Het is leuk om te zien hoe het in de praktijk werkt. Daarom heb ik in de Calais Viewer een willekeurig stuk tekst uit de Lonely Planet ingevoerd:

Calais geeft aan 3 entiteiten te herkennen:

Mooi dat de Calais Viewer aangeeft dat Washington een stad in de VS is (Calais herkent dus dat we het nu niet over de staat of de persoon Washington hebben!), nog interessanter is de koppeling onder water naar het Linked Data systeem. Immers, het resultaat bevat de entiteiten beschreven in RDF. Als ik de URI van Washington uit de RDF haal en die in een browser open dan krijg ik nog veel meer informatie over de stad:


 
Mijn tekst uit de Lonely Planet is dus sterk verrijkt door gebruik te maken van Calais.

Calais Marmoset voorziet je applicatie automatisch van microformats.
Marmoset is een stukje php-code dat je website voorziet van microformats zodra een semantische zoekmachine als Yahoo! Search Monkey langskomt.
Als een normale bezoeker de site bezoekt gebeurt er niks, als de crawler langs komt roept Marmoset de Calais webservice aan en voorziet de content van microformats. De site wordt daarmee semantisch vindbaar via Yahoo!.

Advertenties
No comments yet

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s