Det semantiske web, eller web 3.0, er karakteriseret ved at der bliver tilføjet en mening som maskinerne kan forstå. Som det er i dag forstår maskinerne syntaks og grammatik, men de har ingen anelse om hvad der egentlig står.

Mennesker forstår betydningen af en sætning, d.v.s. at mennesker forstår det semantiske indhold af en sætning. Et eksempel fra nedenstående video er:

Den semantiske betydning af begge udsagn er den samme og det kan vi mennesker forstå, det kan maskiner ikke, de kan kun se at der er ændret i syntaksen.

Opbygningen af det semantiske web

For at maskinerne skal kunne forstå meningen med en webside er det nødvendigt at strukturere data på en måde der er læsbar for maskinerne. XML danner udgangspunkt for denne strukturering som kan være organiseret via microformats, eller RDF (Resource Description Framework) eller en anden standard. Microformats og RDF er dog de mest sandsynlige formater for fremtiden, RDF udvikles og vedligeholdes af w3c.org

Både microformats og RDF er en måde at tilføre et dokument mening, når der f.eks. står Peter Ulstrup Hansen ved maskinerne ikke hvad det er, men hvis navnet får en attribut som person, ved maskinerne at der er tale om en person og dermed får de et udviddet kendskab til indholdet i et givent dokument.

Opbygningen af det semantiske web er fint fremstillet i en video af Manu Sporny fra Digital Bazaar

Google Rich Snippets

Google har netop indtroduceret Rich Snippets i søgeresultaterne (for udvalgte test sites). Rich Snippets vises efter at et Google Page Map er blevet parset og de semantiske oplysninger er blevet tilgængelige for Google.

I denne illustration ser vi at der er givet karakterer, antallet af anmeldelser og prisklassen. Der er her tale om en søgning på restauranten Drooling Dog og siden der henvises til i søgeresultatet er fra Yelp som er et anmeldelses site, se siden her: Yelp.

Der er ikke nogen tvivl om at semantiske meta data får en betydning i fremtiden (som ikke er langt væk). Som Tom Tague siger i artiklen The Google Effect and the Semantic Web: “Google is now harvesting semantic metadata,” Tague says. “And I guarantee you they will use it to decide on rankings. So while this was a nice to have a week ago, now it’s a must have. You must embed semantic metadata within your web pages.”

Social Media og det semantiske web

W3C RDFa har i dag 3 standardiserede måder at formidle semantisk metadata: hCard, hCalendar og hReview. hCard svarer er beskrivelse af en person, se f.eks. denne blogs kontaktside hvor hCard er implementeret. hCalendar er en kalender og hReview er en anmeldelse. Disse standardiserede formidlinger af semantisk data kan bruges på tværs af websider og sociale medier.

Microformats arbejder på at få implementeret en standard for det jeg kalder superidentitet, altså at du med én identitet kan logge på og forbinde dine sociale netværk. Målet med microformats arbejde er at du bliver i stand til at kunne importere din personlige profil og dine venner til nye sociale netværk. Dette arbejde er endnu ikke færdigt men du kan læse mere her: Social Network Portablility.

Web 3.0 og det semantiske web

Der ligger både store udfordringer og store muligheder i semantiske metadata, det vil givet skabe nogle betænkeligheder i forhold til privacy og hvor meget det er hensigtsmæssigt at forskellige webtjenester ved om dig og dit netværk, men omvendt vil det også kunne skabet et stort sammenhængende netværk.

Se også artiklen: Web 3.0 Fremtiden er lige om hjørnet.