Predstavitev področja

Ontologija je po eni strani filozofska disciplina, medtem ko se ontologija na področju računalništva in informatike ukvarja s predstavitvijo podatkov in znanja. Na področju računalništva jo lahko preprosto opredelimo kot besede in njihov pomen, ki se uporabljajo za opis in predstavitev znanja določenega področja - specializacija konceptualizacije.

Ontologije so povezane s številnimi področji in tehnologijami, kar nam prikazuje spodnja slika. Na sliki vidimo, da se pri pojmovanju ontologije razširjeni ER modeli in predikatna logika, s podporo odločanju, mehanizmi sklepanja in EAI, nahajajo bolj v zalednem delu (spodnji del slike), saj je na tej ravni semantika formalno določena. Ostali elementi pridejo v ospredje pri opravilih, kot so povpraševanje, pridobivanje informacij, navigacija in nenazadnje predvsem souporaba znanja.

Delitev ontologij

Danes se soočamo z vprašanjem, kako zgraditi splet podatkov, ki bi ga lahko računalniki samodejno obdelovali. Najprej moramo spremeniti pogled na podatke. V preteklosti so bili podatki shranjeni in zaklenjeni v zaščitenih programih ter pri sami obdelavi niso igrali glavne vloge. Ker so nekateri spoznali, da takšen pristop ni pravilen, so začeli razmišljati v drugo smer. Velik uspeh je doživel internet in z njim XML ter v zadnjih časih zelo priljubljen semantični splet, kjer se vedno bolj osredotočamo na podatke in ne na programe. Ključni element pri samodejni računalniški obdelavi podatkov pa je priprava "pametnejših" podatkov.

Semantična moč

Zgornja slika prikazuje stopnjo inteligence, ki so jo podatki pridobivali skozi čas. Začnemo s takšnimi, ki za nadaljnje sklepanje vsebujejo zelo malo semantičnih informacij, in končamo pri ontologijah:

  • Tekst in podatkovne baze (pred XML)

    Začetna faza, kjer so podatki pripadali določenemu programu.

  • XML dokumenti za določeno domeno

    Faza, kjer podatki v določeni problemski domeni dosežejo določeno neodvisnost od programov. Podatki se lahko prenašajo med različnimi programi znotraj določene problemske domene (npr. XML standardi v zdravstvu, zavarovalništvu ali nepremičninski industriji).

  • Taksonomije in dokumenti z mešanimi slovarji

    Podatke lahko združimo iz različnih domen in jih tudi ustrezno klasificiramo v obliki hierarhične taksonomije. Pravzaprav lahko klasifikacijo uporabljamo za odkrivanje podatkov, enostavna razmerja med kategorijami in taksonomijo pa za povezovanje in združevanje podatkov. Podatki so v tej fazi dovolj "inteligentni", da jih lahko enostavno odkrijemo in razumno združimo z ostalimi podatki.

  • Ontologije in pravila

    Na tej ravni lahko iz obstoječih podatkov izpeljemo nove s pomočjo logičnih pravil. Podatki so sedaj že na dovolj visoki ravni, da jih lahko opišemo z dejanskimi medsebojnimi povezavami in naprednimi formalizmi, s pomočjo katerih nad to "semantično algebro" izvajamo logične izračune. Takšne podatke lahko povezujemo na bolj atomarnem nivoju in izvajamo analize podatkov z majhnimi zrni. V tem primeru podatki ne predstavljajo zgolj surovine, ampak so del nekakšnega naprednega mikrokozmosa. Primer takšne predstavitve podatkov je samodejni prevod dokumenta iz enega problemskega področja v ekvivalentni (oz. čimbolj podoben) dokument v drugi problemski domeni.

Uporabne povezave

  • Ontology development 101

    Splošne smernice za razvoj ontologij in koristni nasveti pri gradnji

  • Protégé

    Eden najbolj priljubljenih urejevalnikov ontologij in ogrodje za implementacijo baz znanj.

  • JENA

    Odprtokodno ogrodje za manipulacijo z ontologijo z dobro podporo skupnosti.

  • Repozitorij obstoječih ontologij

    Primeri ontologij, ki se uporabljajo v praksi.

©2010 Dejan Lavbič

SLO  ENG