Predstavitev področja

Trenutna različica svetovnega spleta (WWW) je ogromna množica med seboj povezanih dokumentov, ki jih prenašajo računalniki in predstavljajo ljudje. Nastali so iz povezanih sistemov z razliko, da lahko vsak prispeva svoj del. To pa tudi pomeni, da kvalitete informacij ali celo trajne hrambe dokumentov ne moremo vedno zagotoviti. Trenutni splet vsebuje številne podatke, informacije in znanja, vendar je vloga računalnikov v tem trenutku zgolj dostavljanje in predstavitev vsebine dokumentov, ki opisujejo to znanje. Ljudje moramo povezati vse vire pomembnih informacij in jih sami interpretirati.

Ideja semantičnega spleta je izboljšati trenutni splet, v tej meri, da bodo računalniki lahko procesirali podatke na spletu, jih interpretirali, povezali in na takšen način pomagali ljudem pri iskanju zahtevanega znanja. Na isti način kot je svetovni velik porazdeljen povezan sitem, je namen semantičnega spleta zagotoviti veliko porazdeljeno bazo znanja. Semantični splet se osredotoča na skupno rabo podatkov in ne dokumentov. Z drugimi besedami gre pri tem projektu za vzpostavitev skupnega ogrodja, ki bi omogočalo skupno rabo podatkov in ponovno uporabo med aplikacijami, podjetji in mejami skupnosti. Gre za skupno sodelovanje, ki ga vodi World Wide Web konzorcij (W3C).

Sklad semantičnega spleta

Zgornja slika prikazuje arhitekturo semantičnega spleta v obliki sklada. Najnižja raven temelji na URI in UNICODE, ki sta pomembna elementa obstoječega svetovnega spleta.

  • UNICODE

    Standard za zapis množice mednarodnih znakov in omogoča, da lahko na spletu uporabljamo poljuben svetovni jezik (za pisanje in branje) v standardizirani obliki.

  • URI

    Niz v standardizirani obliki, ki omogoča enolično poimenovanje virov (npr. dokumentov). Podmnožica URI-ja je URL, ki določa mehanizem dostop in (omrežno) lokacijo dokumenta (npr. http://www.lavbic.net/). Uporaba URI-ja je zelo pomembna v porazdeljenem internetnem okolju, saj je z njegovo pomočjo izvedena identifikacija vseh virov. Mednarodna različica URI-ja je IRI , ki omogoča pri identifikatorju uporabo UNICODE znakov.

Naslednja raven z jezikom XML se ukvarja predvsem s sintakso podatkov in z XML shemo opredelitvijo imenskega prostora.

  • XML

    Označevalni jezik za splošno uporabo, ki se uporablja za opis dokumentov s strukturirano vsebino. XML dokument vsebuje elemente, ki jih lahko gnezdimo in lahko imajo atribute ter vsebino.

  • XML shema

    S pomočjo XML imenskega prostora pa lahko opredelimo različne označevalne slovarje v okviru istega XML dokumenta. XML shema se uporablja za izražanje sheme določene množice XML dokumentov.

  • RDF

    Osnovni format za zapis podatkov na semantičnem spletu je RDF (Resource Description Framework), ki je ogrodje za predstavitev podatkov o virih v obliki grafa. Prvotni namen jezika je bila predstavitev metapodatkov o virih na svetovnem spletu, kot so npr. naslov, avtor in datum spremembe strani, vendar ga lahko uporabimo za shranjevanje vseh ostalih podatkov. Temelji na trojčkih osebek-predikat-predmet, ki sestavljajo graf podatkov. Vsi podatki na semantičnem spletu uporabljajo RDF kot primarni jezik za predstavitev podatkov. Normativna sintaksa za serializacijo RDF-a je XML v obliki RDF/XML.

  • RDF shema

    RDF se uporablja za opis grafa, ki je sestavljen iz trojčkov. Vsak lahko opredeli slovar izrazov, ki se uporablja za bolj podroben opis. RDF shema (RDF/S) je naslednja raven, ki je nastala z namenom, da imamo na voljo standardiziran način za opis taksonomij. Formalna semantika RDF sheme je zapisana v jeziku RDF. RDF/S se uporablja za opis razrednih taksonomij in taksonomij lastnosti – na ta način lahko razvijemo "lahke ontologije".

  • OWL

    Bolj podrobne ontologije lahko opredelimo v jeziku OWL (Web Ontology Language). Jezik OWL temelji na opisni logiki in ima na voljo več konstruktov kot RDF/S. Sintaktično je integriran v RDF, tako da kot RDF/S prinaša dodaten standardiziran slovar. OWL najdemo v treh oblikah – OWL Lite za opredelitev taksonomij in enostavnih omejitev, OWL DL za polno podporo opisni logiki in OWL Full za največjo izrazno moč.

  • SWRL

    RDF/S in OWL imata opredeljeno semantiko, ki je uporabna za sklepanje na ravni ontologij in baz znanj, opisanih s tema jezikoma. Za podporo pravilom, poleg konstruktov že omenjenih jezikov, ki so že na voljo, na področju semantičnega spleta ravno tako obstajajo standardizirani jeziki za pravila. Trenutno sta najbolj uporabljana standarda RIF in SWRL.

  • SPARQL

    Za poizvedovanje po RDF podatkih in RDF/S ter OWL ontologijah je na voljo SPARQL (Simple Protocol and RDF Query Language). SPARQL poizvedovalni jezik je podoben SQL-u, vendar uporablja RDF trojčke in vire za predstavitev poizvedbe in za vrnjene rezultate. Ker RDF/S in OWL temeljita na RDF, je SPARQL neposredno uporaben tudi za poizvedovanje po ontologijah. SPARQL pa ni le poizvedovalni jezik, ampak je tudi protokol za dostop do RDF podatkov.

Vsa semantika in pravila se izvajata na ravneh pod ravnjo zaupanja, rezultati mehanizma sklepanja pa se bodo uporabili za dokazovanje sklepov. Formalen dokaz, skupaj z zaupanjem vrednimi viri bo pomenilo, da lahko rezultatom zaupamo, kar je prikazano na zgornji ravni sklada arhitekture semantičnega spleta. Za zagotavljanje zanesljivih virov se bo uporabljala kriptografija, kot so digitalni podpisi za preverjanje izvora virov. Nad vsemi temi ravnmi lahko tako gradimo aplikacije z uporabniškimi vmesniki.

Uporabne povezave

  • Protégé

    Eden najbolj priljubljenih urejevalnikov ontologij in ogrodje za implementacijo baz znanj.

  • JENA

    Odprtokodno ogrodje za manipulacijo z ontologijo z dobro podporo skupnosti.

  • KAON2

    Ogrodje za manipulacijo z ontologijo, ki podpira sklepanje tudi z SWRL pravili.

  • Semantic Web wiki

    Portal z uporabnimi povezavami na temo semantičnega spleta.

Gradivo

©2010 Dejan Lavbič

SLO  ENG