5 stars of Linked Data

5 stars of Linked Data

Splošne teme diplomskih in magistrskih nalog

  • Implementacija arhitekture za spletno označevanje

    (Web Annotation Data Model, Web Annotation Vocabulary, Web Annotation Protocol, Open Annotation community group, wiki Web Annotation, AnnotatorJS)

    S strani organizacije W3C je pripravljeno priporočilo za označevanje spletnih dokumentov, kjer je ključna ideja, da se metapodatki hranijo neodvisno in ločeno od samih podatkov na spletni strani. Pri tem je omogočen prikaz javnih in zasebnih komentarjev na določeni strani ter omogočeno sodelovanje uporabnikov v zvezi z določeno vsebino. Gre za nadgradnjo ideje, ki je že prisotna npr. na novičarskih spletnih portalih, kjer lahko uporabniki komentirajo novice. Najnovejši W3C predlog priporoča podatkovni model, slovar in protokol, ki omogoča takšno funkcionalnost na poljubni spletni strani. V okviru diplomske naloge je potrebno implementirati Proof-of-Concept (PoF), kjer demonstrirate praktično vrednost omenjenega koncepta na spletni strani ter omogočite enostavno interacijo v poljubno spletišče.)

    Web Annotation Architecture

  • Analiza podatkov časovnih serij na področju IoT

    (InfluxDB, InfluxDB + Grafana)

    Področje IoT oz. avtomatizacija na vseh področjih je zelo aktivno področje razvoja. Pri vedno večjem številu povezanih naprav pa se soočamo tudi z vedno večjo količino podatkov, ki jih moramo shranjevati in tudi analizirati. V okviru diplomske naloge se naj študent osredotoči na izbiro podatkovne baze, ki je primerna za shranjevanje in obdelavo podatkov časovnih serij in naj pripravi prototip (Docker), ki je sestavljen iz izbrane podatkovne baze in komponente za vizualizacijo ter analizo shranjenih podatkov. Za problemsko domeno se lahko izberejo podatki pametnega doma, prometa, zdravja ipd.

  • Avtomatizacija trgovanje s finančnimi inštrumenti v okolju R

    (Systematic Investor Toolbox (SIT)), A Simple Shiny App for Monitoring Trading Strategies, Using CART for Stock market forecasting, Introduction to Candlesticks, Candlestick trading)

    Ena izmed najbolj razširjenih trgovalnih strategij so japonski svečniki, ki s svojo intuitivnostjo in prilagodljivostjo omogočajo izgradnjo naprednih trgovalnih strategij, ki imajo visoko stopnjo interpretabilnosti trgovalnih odločitev. V okviru diplomske naloge je potrebno razviti informacijsko rešitev za izvajanje in testiranje trgovalnih strategij v okolju R. Rešitev naj podpira opredelitev poljubne trgovalne strategije in naj predvsem podpira trgovalno strategijo japonskih svečnikov.

    Japanese candlestick

  • Produktivizacija NoSQL podatkovnih baz

    (Apache Lucene, Elastic)

    Ko podjetje izvede prehod iz relacijske podatkovne na NoSQL podatkovno bazo, to pogosto predstavlja številne omejitve na ravni podatkovnega modela in predvsem zmožnosti izvajanja različnih poizvedb. Pri doseganju visokih performančnih zmogljivosti se tudi v relacijskem svetu zanašamo na iskanje po polnem besedilu, kar predstavlja zelo dobro nadgradnjo NoSQL podatkovnih baz.

    Elastic search

  • Analiza velike količine podatkov in poslovno poročanje

    (Shiny, Apache Zeppelin, SparkR, Using Apache SparkR to power Shiny applications)

    Na področju analize velike količine podatkov je na voljo veliko pristopov, kjer bi bilo potrebno opraviti temeljit pregled pristopov, primernih za poslovno poročanje.

    Big Data

  • Lokacijsko igranje za izobraževalne namene

    (gMission, Geocaching, Pokemon Go)

    Predlog arhitekture oz. prototipa lokacijskega igranja za izobraževalne namene. Npr. pri učenju programiranja morajo študenti rešiti različne programerskime izzive, kjer si lahko problem olajšajšajo tako, da na določenih geografskih lokacijah pridobijo namige, ki jih lahko uporabijo pri reševanju realnega problema.

    GeocachingPokemon Go

  • Uporaba razpoznave obraza pri spletnem preverjanju znanja

    (OpenFace, Moodle Quiz activity)

    Uporabite odprtokodno implementacijo OpenFace za podporo preverjanju prisotnosti ustrezne osebe pri spletnem preverjanju znanja v okviru Moodle aktivnosti kviza. Implementacija naj bo na voljo v obliki JavaScript knjižnice, ki jo je mogoče vključiti v Moodle kviz in s pomočjo REST klicev dostopa do strežnika, kjer je nameščena rešitev OpenFace, kjer bodo na voljo slike vseh oseb, ki jim je opravljanje spletnega preverjanja znanja dovoljeno. Osnovna ideja je, da ima oseba, ki rešuje spletno preverjanje znanje, ves čas aktivno spletno kamero in na ta način se preverja ali je za računalnikom, med pisanjem preverjanja znanja, res prisotna ustrezna oseba.

    OpenFace

  • Odkrivanje anomalij pri reševanju spletnih preverjanj znanj

    (Podpora izvajanju spletnih kvizov in preverjanj znanj, Metode za pomoč pri zaznavi plagiatorstva)

    V zadnjem času je vedno bolj priljubljeno oddaljeno izobraževanje in tudi preverjanje znanja. Na voljo imamo številne rešitve (npr. Coursera, Moodle ipd.). Vedno pa obstaja težava, kako preverjati ali si uporabnik pomaga s kakšnimi nedovoljenimi pristopi. V okviru že opravljenih diplomskih nalog je bila implementirana podpora izvajanju spletnih kvizov in preverjanj znanj, ki deluje s sistemom Moodle in zbira vse nepravilnosti, ki jih je uporabnik izvajal med samim reševanjem kviza. V okviru diplomske naloge bi moral študent te podatke iz različnih preverjanj znanj analizirati in predlagati metodo, ki bi odkrila anomalije (t.j. možično prepisovanje, vzorce nedovoljenega prepisovanja (npr. soseda v računalniški učilnici) ipd.). Pri odkrivanju teh anomalij bi si lahko pomagali tudi s podatki iz družabnih omrežij (npr. aktivna prijatelja na Facebooku z večkratnimi medsebojnimi objavami itd.), kot je bilo že implementirano v eni izmed diplomskih nalog metode za pomoč pri zaznavi plagiatorstva, kjer s pomočjo teh podatkov poskušamo izboljšati kakovost odkrivanja plagiatov.

    Odkrivanje prepisovanja

    Že izdelane diplomske naloge:

  • Odločitveni model za izbiro primerne podatkovne baze

    (DB-Engines ranking, odločitveni model za izbiro relacijske podatkovne baze, priporočila za izbiro NoSQL podatkovne baze, NewSQL podatkovne baze)

    Trenutno stanje na področju podatkovnih baz je zelo dinamično, saj lahko izbiramo med več 300 različnimi podatkovnimi bazami (relacijske, NoSQL, NewSQL idr.). Kljub temu odločitev ni enostavna, saj so si med seboj podatkovne baze zelo različne in nekatere primerne za zelo specifična okolja in scenarije. V okviru diplomske naloge bi bilo potrebno pregledati različne klasifikacije podatkovnih baz in njihove lastnosti ter na podlagi tega pripraviti odločitveni model. Namen odločitvenega sistema, na podlagi tega modela, bi bil, da lahko potencialni uporabnik vnese svoje želje (npr. zelo velika frekvenca pisanj na področju IoT, kjer je pomembna tudi analiza podatkov v realnem času). Odločitveni sistem bi uporabniku nato prikazal ustrezne podatkovne baze v rangiranem vrstnem redu. Za opredelitev odločitvenega modela bi bilo potrebno najprej poiskati ustrezne parametre (npr. tip podatkovne baze, ACID vs. BASE pristop, podpora transakcijam, možnost horizontalnega skaliranja itd.) in nato vsaj najbolj priljubljene podatkovne baze vnesti v sistem ter pripraviti prototip orodja, ki bi ga lahko uporabniki uporabljali.

    Primerjava klasičnih relacijskih podatkovnih baz, NoSQL in NewSQL

  • Razvoj enostavnega bota, ki odgovarja na vprašanja povezana s snovjo pri predmetu

    (Building your bot's brain with Node.js and spaCy, spaCy-NLP, Contextual Knowledge Base Graph (CKBG))

    Na podlagi odprtokodne knjižnice spaCy je cilj razviti inteligentnega pomočnika oz. bota s pomočjo AIVA, ki je sposoben odgovarjati na vprašanja, povezana s snovjo pri predmetu Osnove informacijskih sistemov (OIS), kjer so podatki shranjeni v podatkovni bazi neo4j.

    spaCy

  • Izvedba, vizualizacija in optimizacija povezanih porazdeljenih poizvedb

    (SPARQL 1.1 Federated Query, Improving the Recall of Live Linked Data Querying through Reasoning)

    Tradicionalni pristopi pri poizvedovanju po Linked Data temeljijo na lokalnih kopijah oddaljenih podatkovnih virov in izvajanju SPARQL poizvedb nad temi lokalnimi kopijami. Trenutno so na voljo različne rešitve (FactForge, Virtuoso OpenLink LOD cache, Sindice Semantic Web Index), ki to omogočajo. Ključni cilj omenjenih rešitev je (1) pokriti širok spekter področja Web of Data, (2) vsebovati ažurne podatke in (3) imeti hitre odzivne čase. To lahko sicer dosežemo z uporabo določenih pristopov porazdeljevanja, replikacije, optimizacije indeksov, tehnik stiskanja podatkov, sinhronizacije podatkov idr. Vendar je dolgoročno vzdrževanje ažurnih in optimiziranih lokalnih indeksov vseh teh podatkov Sizifovo delo. Pristop povezanih porazdeljenih poizvedb pa po drugi strani izkuriščajo vedno večje število neodvisnih dostopnih točk, razdeljevanje in kreiranje odvisnih poizvedb za posamezne neodvisne točke. V okviru diplomske naloge bi bilo potrebno raziskati možnosti poenostavljenega uporabniškega vmesnika, ki bi omogočal izvajanje in vizualizacijo povezanih porazdeljenih SPARQL poizvedb. Eden izmed vidikov je tudi optimizacija omenjenih poizvedb.

    LOD cloud

  • Inteligentni pomočnik za luščenje spletnih podatkov

    (Visual Web Ripper, iRobotSoft, Selenium, Sahi, Fake)

    Pri iskanju podatkov na svetovnem spletu moramo pogosto obiskati več spletni strani, da lahko poiščemo odgovor na želeno vprašanje, saj vseh podatkov ne najdemo na enem spletnem mestu. Primer je npr. načrtovanje potovanja, kjer moramo najprej kupiti letalsko karto, urediti prenočišče, vnaprej rezervirati lokalni prevoz z avtobusom ipd. Če so takšna opravila ponavljajoča bi nam zelo pomagalo orodje, kjer bi na izbranih spletnih straneh označili podatke, ki nas zanimajo oz. proces iskanja (korake) posneli in bi nam sistem nato kasneje omogočal samodejno pridobivanje podatkov iz več različnih spletnih strani. V okviru diplomske naloge naj študent pripravi prototip takšnega orodja (npr. po vzoru Visual Web Ripper), ki v celoti deluje v brskalniku s pomočjo spletnih tehnologij (JavaScript na odjemalcu in Java oz. Python na strežniku).

    Luščenje podatkov

  • Prototipiranje zalednega sistema informacijske rešitve

    (CodeOrbits, PhantomJS)

    Prototipiranje je pri razvoju programske opreme pogosto zelo pomembno. Po eni strani lahko na ta način poslovnemu uporabniku že v fazi zajema zahtev ali analize pokažemo, kako si razvijalci predstavljamo funkcionalnosti sistema. Večina pristopov je tako osredotočena na prototipiranje uporabniškega vmesnika, vendar če želimo doseči vsaj določeno mero interaktivnosti, je potrebno izvesti tudi prototipiranje na zalednem, strežniškem, delu. V okviru diplomskega dela naj študent razišče možnosti prototipiranja pri razvoju rešitev v programskem jeziku JavaScript in z uporabo Node.js. Pri tem naj razišče rešitev PhantomJS in z njegovo uporabo prikaže prednost omenjenega pristopa na realnem primeru. Pr prikazu funkcionalnosti naj demonstrira tudi ostale funkcionalnosti, ki jih PhantomJS omogoča in sicer testiranje spletnih strani, zajem zaslona, avtomatizacija strani idr.

    PhantomJS

  • Obogatitev podatkov v relacijski podatkovni bazi z Linked Data slovarji

    (R2RML: RDB to RDF Mapping Language, R2RML Implementations, LOD (september, 2011), CKAN, DBpedia, GeoNames)

    V relacijski podatkovni bazi so podatki ponavadi izolirani v okviru podjetja in namenjena za uporabo v poslovni aplikaciji. Na spletu pa najdemo številne strukturirane podatke, ki bi jih lahko neposredno uporabili v naši podatkovni bazi in na ta način podatke obogatili. V okviru diplomske naloge bi bilo potrebno pripraviti intuitiven uporabniški vmesnik za objavo relacijskih podatkov v RDF obliki in čim večjo mero avtomatizacije pri uporabi obstoječih slovarjev.

    Open data

  • Inovativen brskalnik po novicah

    (Data-Driven Documents, Linked Data)

    Pri pregledovanju novic smo pogosto omejeni na prikaz v obliki seznama, ki je pri večini novičarskih portalov razdeljen v vsebinske kategorije (npr. šport, Slovenija, kultura, svet ipd.) in urejen po padajočem časovnem vrstnem redu. V okviru diplomske naloge bi implementirali inovativen brskalnik, ki bi omogočal sprehajanje po novicah in povezanih podatkih (npr. komentarji, novinarji, lokacija, kategorije ipd.) v stilu asociativnih mrež. Uporabili bi podatke novic, objavljenih v slovenskem okolju, ki so že na voljo v strukturirani obliki, vizualizacija pa bi temeljila na Data-Driven Documents HTML5 knjižnici.

    Inovativen brskalnik po novicah

  • Pregled ogrodij za hiter razvoj podatkovno usmerjenih aplikacij

    (FORWARD, Google Docs, ProgrammableWeb, YQL)

    Na svetovnem spletu obstajajo številni med seboj nepovezani podatkovni viri, ki bi z inteligentnim pristopom povezavanja lahko prinesli veliko dodano vrednost. V okviru diplomske naloge bi pregledali različna ogrodja, ki omogočajo hiter razvoj podatkovno usmerjenih aplikacij in izdelavo t.i. mash-up aplikacij.

    Forward rapid development framework

  • Trgovalne strategije na virtualni denarni valuti Bitcoin in napovedovanje volatilnosti

    (trgovalne strategije na Investopedia, trgovalne strategije na StockCharts, napovedovanje cen Bitcoin valute)

    Pri aktivnem trgovanju na klasičnih borznih trgih si številni uporabniki pomagajo s tehnično analizo. Omenjen pristop temelji na preprostem dejstvu, da se zgodovina pogosto ponavlja in če opredelimo vzorce, nam le-ti lahko pomagajo pri napovedovanju gibanja cene (rast, padec, stagnacija) v prihodnje. Obstajajo številne strategije in pristopi, ki so primerni za določene panoge in načine vlaganja. V zadnjem času javnost zelo veliko pozornosti namenja virtualni denarni valuti Bitcoin. Nekateri verjamo, da je to denarna valuta prihodnosti, spet drugi pa so mnenja, da gre zgolj za balon, ki bo kmalu počil. To dejstvo potrjuje tudi zelo velika volatilnost njegove vrednosti, ki med potencialne vlagatelja vnaša strah in nezaupanje. V okviru diplomske naloge bi študent moral pripraviti prototip, kjer bi preizkusil različne trgovalne strategije in predlagal najbolj učinkovite za napovedovanje gibanja vrednosti valute Bitcoin v prihodnosti.

    Trgovanje

  • Družbeni GPS

    (Google Latitude, Google Maps, Waze)

    Ko se odpravljamo na pot, si pogosto pomagamo z GPS sistemom, ki nas vodi od začetne do končne točke in nam olajša načrtovanje poti. V okviru diplomske naloge pa bi raziskali možnosti, kako to izkušnjo načrtovanja poti še izboljšati z ostalimi podatki, ki jih imamo na voljo. Predvsem se želimo osredotočiti na gnečo oz. predvidevanje in izogibanje le te. Enostavno bi si lahko pomagali s podatki o dnevu (delavnik, vikend, praznik), trenutnih vremenskih razmerah, trenutnih razmerah na cesta (TMC) in zgodovinskih podatkov o vožnjah uporabnika (Google Latitude) iz katerih lahko sklepamo dodatne trende. Rezultat diplomske naloge bi bil prototip, ki bi uporabniku pomagal s priporočili. Če uporabnik želi iz Celja v Koper v petek popoldne, bi ga sistem opozoril, da mogoče to ni najboljši čas, saj se za vikend veliko ljudi odpravi tja. Poleg tega je na ciljni destinaciji napovedano zelo lepo vreme in tudi zadnji termin obiska uporabnika je bil v tem času in je pot trajala nadpovprečno dolgo.

    WazeWaze

  • Napredno iskanje nepremičnin

    (GoHome.si, Nepremičnine.net, AutNo, Lifehacker članek)

    Pri iskanju nepremičnin, bodisi za nakup ali najem, nam obstoječe informacijske rešitve ponujajo že znane načine iskanja - omejevanje po lokaciji, mikrolokaciji, ceni, velikosti, številu sob, opremi ipd. Manjkajo predvsem podatki iz drugih virov, ki bi jih lahko smiselno vključili in na ta način izboljšali iskalno izkušnjo. Eden izmed zanimivih pristopov je AutNo, kjer sistem upošteva tudi čas, potreben za prevoz v službo. Pri iskanju primerne nepremičnine vam namreč upošteva še možnost prevoza do službe oz. bližina le tega. V okviru diplomske naloge bi predlagali prototip naprednega iskalnika nepremični v slovenskem okolje. Uporabite lahko obstoječe iskalnike v Sloveniji (npr. GoHome.si, Nepremičnine.net itd.), ki jih povežete z drugimi znimivi viri (npr. LPP, Slovenske železnice ipd.)

    Inteligentno iskanje nepremičnin

  • Inteligentni mobilni pomočnik

    (Mobitel Monitor, Simobil Stanje)

    Večina ponudnikov mobilne telefonije v Sloveniji in v tujini svojim strankam ponuja paketno ponudbo mesečne naročnine, ki že vključuje določene količine posameznih storitev. Primer takšnih storitev so klici v domače omrežje Mobitel (npr. 503 min), klici v druga mobilna in stacionarna omrežja (npr. 503 min), sporočila SMS in MMS (npr. 503 sporočil), prenos podatkov (npr. 503 MB) itd. Večina ponudnikov strankam omogoča tudi pregled nad porabo te zakupljene količine.
    Študent bi se v okviru diplomske naloge ukvarjal z napovedovanjem porabe na podlagi preteklih trendov in na ta način pomagal uporabniku z nasveti kot so:

    • do konca meseca je še 1 teden in ti imaš na voljo še kar 90% zakupljene količine prenosa podatkov, zato lahko brezskrbno brskaš po spletu,
    • glede na porabo preteklih 3 mesecev, ko si izkoristil zgolj 23% zakupljenih količin klicev predlagam, da zamenjša paket,
    • v prejšnjem letu si kar 5 potoval v tujino in tam uporabljal klice v domovino, zato bi bilo smiselno pregledati ponudbo zakupljenih klicev iz tujine.

    V okviru diplomske naloge bi bilo potrebno razvit prototip aplikacije (mobilne ali spletne), ki bi spremljala porabo uporabnika in bi ga na podlagi trendov usmerjala.

  • Virtualne denarne valute

    (Bitcoin, We use coins, zlonamerni napadi na Bitcoin)

    V današnjem času se pojavlja vedno več virtualnih denarnih valut, ki se uporabljajo predvsem na družabnih omrežjih in pri spletnih igrah. Zanimiv pa je tudi pristop Bitcoin, kjer gre za virtualno valuto, ki omogoča plačevanju komurkoli in kjerkoli na svetu. Temelji na P2P tehnologiji in ne uporablja centralne točke nadzora - obvladovanje transakcij in denarja se izvede porazdeljeno po omrežju. V okviru diplomske naloge bi bilo potrebno podrobno predstaviti omenjeni pristop in pregledati širše področje omenjene problematike.

    Bitcoins

  • Različni mobilni odjemalci za platformo Occapi

    (Inteligoo, PhoneGap, MooSync)

    Platforma Inteligoo omogoča mobilnim napravam dostop preko API-ja in sicer storitve prijave uporabnika, pridobivanje podatkov o izjemnih dogodkih, pridobivanje podatkov o izjemnih dogodkih opremljene z geolokacijskimi podatki, pridobivanje podatkov za prikaz grafov itd. V okviru diplomske naloge bi razvili različne mobilne odjemalce za platformo Inteligoo in sicer s pomočjo ogrodij za razvoj aplikacij, ki temeljijo na tehnologiji HTML5.

  • P2P javni prevoz

    (ZipCar, GoCarShare, ShareACar, Share a car, risk your insurance, Prevoz.org)

    V današnjem času postaja število avtomobilov na prebivalca in s tem povečano onesnaževanje okolja velik problem. Obstjajo pa številne rešitve, ki se lotevajo omenjenega problema. Ena izmed njih je souporaba osebnega avtomobila. Predstavljajte si javna parkirišča ob izvozih z avtoceste, kjer bi lahko proti minimalnemu plačilu parkirali avtomobil in izbrali potencialen avtomobil, ki se približuje in še ima prosta mesta. Omenjeno izbiro bi npr. zahtevali preko interaktivne table na parkirišču ali preko mobilne aplikacije, medtem ko bi bil avtomobil, ki ponuja storitev prevoza, obveščen in bi se ustavil na parkirišču in vas sproti zapeljal do želene destinacije. Omenjeno storitev bi bilo mogoče plačevati z virtualno valuto (npr. Bitcoin), ki jo lahko potem uporabimo za različne storitve (npr. če ponujamo prevoz, pridobimo sredstva, če ga koristimo, sredstva porabimo). V okviru diplomske naloge bi študent predlagal takšen sistem in implementiral prototip informacijske podpore takšni rešitvi, ki temelji na najnovejših tehnologijah HTML5, Google Latitude ipd.

    P2P javni prevoz

  • Poizvedovalni jezik SPARQL

    (Wikipedija, W3C standard, Learning SPARQL)

    RDF jezik je jezik za zajem usmerjenih in označenih podatkov v obliki grafa, ki se uporablja predvsem za predstavitev podatkov na svetovnem spletu. Poizvedovalni jezik SPARQL se uporablja za poizvedovanje RDF in je praktično aplikabilen za izvajanje poizvedb nad različnimi in heterogenimi podatkovnimi viri, kjer so podatki posredno ali neposredno shranjeni v RDF obliki. SPARQL podpira poizvedovanje po zahtevanih in opcijskih vzorcih grafov kot tudi njihovo konjunkcijo in disjunkcijo. Prav tako ima zelo dobro podpro za testiranje vrednosti in omejitev poizvedb glede na vir RDF grafa. V okviru diplomske naloge bi študent na izbrani množici virov prikazal napredne gradnika SPARQL v referenci z ostalimi poizvedovalnimi jeziki (npr. SQL, XQuery ipd.).

  • Preslikava podatkov iz relacijskih podatkovnih baz v RDF obliko

    (W3C blog, neposredno preslikovanje, R2RML)

    Organizacija W3C je na področju preslikave podatkov iz relacijskih podatkovnih baz v RDF obliko pripravila več priporočil, ki čakajo predvsem na praktične implementacije. S pomočje omenjene preslikave se nam odprejo številne možnosti semantične integracije podatkov z ostalimi spletnimi viri in na takšen način obogatitev vsebine lokalnega repozitorija. V okviru diplomske naloge bi študent pripravil prototip in praktično uporabo konceptov, ki jih predlaga W3C v okviru R2RML. Potrebno bi bilo predstaviti obe smeri preslikave in prednosti, ki jih pridobimo. To pomeni predvsem možnost uporabe jezika SQL pri samodejni preslikavi SPARQL poizvedb v relacijskih svet itd.

    Že izdelane diplomske naloge:

  • Sledenje uporabnikom mobilnih telefonov

    (ITWorld, Wall Street Journal)

    Z velikim porastom mobilne tehnologije in pametnih telefonov je vedno večja težava tudi zasebnost uporabnikov. Številna nakupovalna središča in trgovine namreč "izrabljajo" nepazljivost uporabnikov, ki imajo stalno vklopljeno WiFi povezavo, za njihovo sledenje. Mobilni telefon z vklopljenim WiFi oddaja MAC naslov, katerega si shranjujejo in lahko identificirajo pot kupca po trgovini, pogostost obiskov ipd. V okviru diplomske naloge bi bilo potrebno pripraviti pregled omenjenega problema in predstaviti prototip uporabe ter opozoriti na težave, povezane s tem problemom.

    Sledenje mobilnim telefonom

    Že izdelane diplomske naloge:

  • Analiza in pregled razvoja lokacijsko odvisnih aplikacij

    (Geoloqi, Google Latitude, Find my friends, We're in, Foursqaure)

    V razmahu uporabe družbenih omrežij se je močno povečala tudi uporaba lokacijsko odvisnih aplikacij. Scenarijev in primerov uporabe na tem področju je veliko. V okviru diplomske naloge bi bilo potrebno izvesti pregled področja in se osredotočiti ter predstaviti predvsem različne pristope k razvoju lokacijsko odvisnih aplikacij.

    Že izdelane diplomske naloge:

  • Pregled stanja na področju Crowdsourcinga

    (pregledni članek)

    Crowdsourcinge oz. izvajanja storitev s strani zunanjih izvajalcev je v poslovnih okoljih postala že stalnica predvsem z vidika zniževanja stroškov. Poznamo več različnih načinov in sicer:

    V okviru diplomske naloge bi bilo potrebno pripraviti pregled obstoječih pristopov in izvesti kritično primerjavo z izbranim primerom.

    Že izdelane diplomske naloge:

  • Obvladovanje dejanskih povez med ljudmi

    (Naprej od LinkedIn @ Forbes)

    V zadnjem času je vedno bolj priljubljena analiza povezav na družabnih omrežjih. Kaj pa obvladovanje dejanskih povezav med ljudmi v realnem življenju? Kakšne so razlike med "virtualnimi" in "dejanskimi" povezavami? Ena izmed idej govori o združevanju CRM pristopa z družabnimi omrežji. V podjetju so takšne povezave (predvsem realne) izjemno pomembne, saj pogosto pride na podlagi omenjenih povezav do sklepanja novih poslov. Predstavljajte si sposobnost vodilnega kadra v podjetju, da pred vstopom v pogajanja o novem poslu pridobi vse povezave svojih zaposlenih s podjetjem, s katerim bi želelo skleniti posel in te povezave potem uporabi v prid sklepanja posla. Podoben pristop so implementirali pri DataHug. V okviru diplomske naloge bi bilo potrebno pripraviti prototip rešitve, ki poleg podatkov iz družabnih omrežij, uporabi še ostale podatke, ki so na voljo ter na ta način poskuša prikazati bolj realno sliko družabnih povezav sodelavcev v podjetju med sabo in predvsem s poslovnimi partnerji.

    Povezave med ljudmi

    Že izdelane diplomske naloge:

  • Podpora izvajanju spletnih kvizov in preverjanj znanj

    V zadnjem času je vedno bolj priljubljeno oddaljeno izobraževanje in tudi preverjanje znanja. Na voljo imamo številne rešitve (npr. Coursera, Moodle ipd.) Vedno pa obstaja težava, kako preverjati ali si uporabnik pomaga s kakšnimi nedovoljenimi pristopi. V okviru diplomske naloge bi bilo potrebno pripraviti prototip sistema, ki na odjemalčevi strani s pomočjo JavaScript jezika preverja regularnosti na strani odjemalca in anomalije preko REST načina sporoča na strežniški del, kjer se izvaja analiza (npr. uporabnik je v zadnji minuti večkrat izgubil fokus nad osnovnim oknom brskalnika, poskušal je kopirati vsebino okna, lokacija miške se ves čas giblje daleč stran od vnosnih polj ipd.).

    Odkrivanje prepisovanja

    Že izdelane diplomske naloge:

  • Analiza in vizualizacija karierne poti diplomantov FRI

    (ePrints, LinkedIn)

    V okviru diplomske naloge bi študent z integracijo podatkov o iz digitalne knjižnice ePrints.FRI in podatki iz profesionalnega družabnega omrežja LinkedIn izvedel analizo karierne poti diplomantov FRI in njihove vpetosti v slovenski gospodarski prostor. Podatki iz vira ePrints vključujejo podatke o raziskovalnih nalogah, diplomskih nalogah, magistrskih delih in doktorskih disertacijah. Na voljo so podatki o vsebini, ključnih besedah, avtorju, mentorju in področju. Po drugi strani pa so na omrežju LinkedIn na voljo podatki o karierni poti uporabnika - njegove delovne izkušnje, projektno delo in trenutni status. V okviru diplomske naloge bi bilo tako potrebno pregledati kako uspešni so diplomanti FRI po svojem zaključku študija in kakšno vlogo imajo v podjetjih. Odpirajo se tudi številne druge možnosti analize - pregled po mentorjih, pregled po vsebinskih področjih diplomskih del, povprečen čas po diplomiranju za dosego napredovanja ipd.

    Karierna pot

    Že izdelane diplomske naloge:

  • Določitev priporočene cene na spletni tržnici

    (eBay selling, eBay selling tricks)

    V času finančne krize uporabniki pogosto uporabljajo spletne tržnice (npr. Bolha, eBay ipd.), kjer se srečujejo kupci in prodajalci z namenom izmenjave izdelkov in storitev. Omenjene tržnice ponujajo številne storitve, a je nabor za navadnega uporabnika, ki bi želel brezplačno objavo oglasa, zelo omejen. Uporabnik lahko ponavadi le zapiše naziv in opis oglasa, skupaj s slikovnim gradivom, ter možnost opredelitve cene. Zanimiva funkcionalnost, ki jo uporabniki pogrešajo pa je priporočena cena. Uporabnik bi npr. želel čim prej prodati 3 leta star iPad in ne želi zapravljati časa z raziskovanjem, kolikšna je vrednost tega izdelka, ampak bi želel priporočilo sistema, ki bi upošteval ceno novega izdelka in ceno iz oglasov primerljivih izdelkov. V okviru diplomske naloge bi študent pripravil prototip takšnega priporočilnega sistema, ki bi z razičnimi strategijami in različnimi viri uporabniku predlagal priporočeno ceno izdelka, ki ga želi prodati.

    Določitev priporočene cene

    Že izdelane diplomske naloge:

  • Statistična analiza slovenskih besedil

    Za angleški jezik je bilo izdelanih mnogo analiz glede pojavljanja besed, n-gramov, besednih zvez, črk, ipd. Ena izmed zanimivih analiz se nahaja na tej spletni strani. Kandidat bi v okviru diplomske naloge zbral kar se da veliko množico slovenskih besedil različnih izvorov. Nato bi nad temi besedili izvedel podobno analizo, kot je prikazana na zgornji spletni strani. Svoje ugotovitve bi grafično predstavil in primerjal z ostalimi jeziki.

    Že izdelane diplomske naloge:

  • Odkrivanje mnenja uporabnikov, ki komentirajo novice

    (LingPipe, Linked Data)

    V času porasta vsebine na družabnih omrežjih, dnevniki in portalih z novicami je vedno bolj zanimivo področje odkrivanja mnenja (sentiment analysis oz. opinion mining). V okviru diplomske naloge bi preverili obstoječe pristope za odkrivanje mnenje in jih uporabili na novicah, objavljenih v slovenskem okolju, ki so že na voljo v strukturirani obliki.

    Sentiment analysis

    Že izdelane diplomske naloge:

  • Pregled pristopov luščenja delno strukturiranih podatkov iz spletnih strani

    (Virtuoso Sponger, Semantic Fire, Apache any23, SMILA, Apache Stanbol, DEiXTO, Stuff 2 RDF, SIMILE RDFizers)

    Podatki na spletnih straneh so predstavljeni in pripravljeni predvsem za uporabo s strani človeških uporabnikov. Glavna težava pri tem je predstavitev podatkov, ki je neformalna in nedvoumna, kar pogosto pripelje do težav pri samodejni obdelavi podatkov. Namen diplomske naloge bi bil pregledati obstoječe pristope in jih kritično predstaviti na manjši množici testnih primerov.

    Že izdelane diplomske naloge:

  • Pregled in primerjava XML podatkovnih baz

    (XML podatkovne baze, primerjava XML pristopov, BaseX, eXist)

    Poleg relacijskih in NoSQL podatkovnih baz so na trgu na voljo tudi XML podatkovne baze, ki podpirajo XPath in XQuery procesiranje podatkov. Poleg omenjenih funkcionalnosti poizvedovanja pa podpirajo tudi številne druge, kot je npr. podpora delovnim tokovom ipd. V okviru diplomske naloge bi bilo potrebno pregledati področje in kritično primerjati obstoječe odprtokodne in komercialne rešitve.

    Že izdelane diplomske naloge:

  • Pregled pristopov luščenja delno strukturiranih podatkov iz spletnih strani

    (Virtuoso Sponger, Semantic Fire, Apache any23, SMILA, Apache Stanbol, DEiXTO, Stuff 2 RDF, SIMILE RDFizers)

    Podatki na spletnih straneh so predstavljeni in pripravljeni predvsem za uporabo s strani človeških uporabnikov. Glavna težava pri tem je predstavitev podatkov, ki je neformalna in nedvoumna, kar pogosto pripelje do težav pri samodejni obdelavi podatkov. Namen diplomske naloge bi bil pregledati obstoječe pristope in jih kritično predstaviti na manjši množici testnih primerov.

    Že izdelane diplomske naloge:

  • Ogrodje za luščenje strukturiranih podatkov iz delno strukturiranih virov podatkov

    (Apache Any23)

    Podatki, ki jih najdete na svetovnem spletu so večinoma objavljeni z namenom prikaza končnemu uporabniku, kjer je poudarek na predstavitveni ravni. Zato je vsebina, ki jo želimo prikazati na spletni strani prepletena z obliko (HTML, CSS) in imamo pri samodejni računalniški obdelavi podatkov s spletne strani težave, saj ne poznamo pomena podatkov, ki se npr. nahaja znotraj element <div id="56kh1z">...</div>. V okviru diplomske naloge bi bilo potrebno pripraviti ogrodje za luščenje strukturiranih podatkov iz delno strukturiranih virov, ki bi HTML stran pretvorilo v jezik RDF, ki se uporablja za predstavitev podatkov na semantičnem spletu. Pri pripravi prototipa lahko uporabite ogrodje Apache Any23, ki omogoča luščenje strukturiranih podatkov iz različnih spletnih dokumentov v RDF format.

    Že izdelane diplomske naloge:

  • Sistemi za zagotavljanje spletne anonimnosti uporabnika

    (VPN, TOR)

    Na svetovnem spletu je vedno bolj cenjena in iskana lastnost anonimnost uporabnikov, s katero so povezani številni izzivi in težave - blokiranje storitev glede na lokacijo uporabnika (npr. Facebook na Kitajskem, nekatere Google storitve na ZDA ipd.), sledenje uporabnikom na javnih dostopnih točkah ipd. V okviru diplomske naloge bi bilo potrebno raziskati različne možnosti, ki so na voljo uporabniku pri zagotavljanju anonimnosti na spletu. Uporabite lahko različne vire, kjer rangirajo VPN storitve, se osredotočajo na dejansko zagotavljanje anonimnosti ali temeljijo na odprtokodnih P2P pristopih.

    Online privacyAnonymous

    Že izdelane diplomske naloge:

  • Delno samodejna izdelava ovojnic za spletne vire

    (XPath helper, YQL, Simile Piggy Bank, Simile Solvent, regularni izrazi, ontologije, screen scrapping)

    Spletne strani večinoma dajejo poudarek vizualizaciji podatkov in ne strukturiranosti podatkov in sintaksi zapisa. Če želimo iz spletne strani ročno pridobiti strukturirane informacije, moramo zanjo pripraviti ovojnico. Ovojnica dejansko predstavlja meta podatke (kot npr. relacijska shema v relacijskih podatkovnih bazah) s pomočjo katerih lahko lažje strukturirano dostopamo do podatkov. Namen seminarske naloge bi bil izdelati dodatek za spletni brskalnik Chrome, s pomočjo katerega bi lahko uporabnik brez potrebnega tehničnega znanja označil dele strani in jih poimenoval ter na ta način pripravil ontologijo vira. Pokazati bi bilo potrebno, kako lahko pripravimo ovojnice za več različnih spletnih strani in potem poenoteno poizvedujemo z jezikom SPARQL po izbranih integriranih virih.

    Že izdelane diplomske naloge:

  • Inovativna integracija podatkov iz heterogenih virov in senzorjev

    (mobilni telefoni, Internet of Things, RFID, semantični splet, socialna omrežja)

    Na spletu najdemo številne zanimive vire podatkov, ki bi jih lahko s smiselno integracijo vključili v inovativno inteligentno aplikacijo. Poleg teh podatkov imajo današnji pametni telefoni številne senzorje, ki jih lahko v takšnem pristopu tudi uporabimo. Namen diplomske naloge bi bil razvoj enega prototipa, ki bi demonstriral inovativno integracijo podatkov. Uporabite lahko npr. lokacijsko storitev Google Latitude, ki izkorišča GPS v pametnem telefonu, podatke iz socialnih omrežji in napovedi družbenih dogodkov ter na takšen način zgradite sistem priporočil. Primer uporabe bi lahko bil naslednji: iz Google Latitude storitve ugotovimo, da je oseba A že 4h v službi, oseba B, ki pa je njegov Facebook prijatelj pa se je ravnkoar pripeljala (vir Google Latitude) v radij 5km od njegove službe. Glede na vremenske podatke (vir ARSO) je vreme sončno, zato sistem predlaga, da se osebi A in B dobita na kosilu, saj sta stara prijatelja (Facebook) in že dolgo nista komunicirala (Twitter).

    Že izdelane diplomske naloge:

  • Predstavitev in uporaba podatkov o ljudeh v strukturirani in računalniku razumljivi obliki

    (semantični splet, ontologije, socialna omrežja, Web of Data, Linking Open Data, LOD, Web of Identitises)

    Socialna omrežja so pridobila na priljubljenosti predvsem s širšo populizacijo koncepta Web 2.0. Na spletu je namreč na voljo vedno več podatkov o ljudeh, ki se nahajajo na različnih in heterogenih virih. Problem, ki se pojavlja je, kako te podatke zbrati, integrirati in uporabiti v okviru aplikacij semantičnega spleta. V okviru tega se pojavljajo številne paradigme, od Web of Data, Linking Open Data, Web of Identities, Social Relevancy Rank idr. V okviru diplomske naloge bi bilo potrebno podrobneje raziskati omenjeno področje in pripraviti prototip sistema, ki bi prikazal enega izmed scenarijev uporabe.

    Že izdelane diplomske naloge:

  • Internet of Things in sodobna programska opreme

    (Internet of Things, RFID, Arduino, Nabaztag)

    Pri Internet of Things gre za omrežje med seboj povezanih elementov, skupaj s spletnimi storitvami, kjer vse skupaj povezuje in zaokrožuje svetovni splet. Tehnologije, ki omogočajo Internet of Things so RFID, senzorji, pametni telefoni idr. V okviru diplomske naloge bi bilo potrebno pregledati omenjeno področje in pripraviti prototip, ki bi prikazal način uporabe omenjenega koncepta pri razvoju sodobne programske opreme. V pomoč so lahko številni projekti, ki imajo implementirane že številne lastnosti in funkcionalnosti. Več si lahko preberete na naslednji spletni strani.

    Že izdelane diplomske naloge:

  • Pregled in primerjava "graph-based" NoSQL podatkovnih baz

    (Apache Jena TDB, Sesame, Virtuoso itd.)

    Na semantičnem spletu je ena ključnih nalog prihajajočih tehnologij semantična integracija podatkov. Za ta namen se uporabljajo predvsem NoSQL podatkovne baze tip "grah-based" oz. t.i. triplestores. V okviru diplomske naloge bi bilo potrebno pregledati področje odprtokodnih in komercialnih rešitev ter jih kritično medsebojno primerjati.

    Že izdelane diplomske naloge:

  • Izdelava ORM nad Cassandro v Python Django (v sodelovanju z Zemanto)

    (Apache Cassandra, Python Dyngo, Object-relational mapping (ORM))

    V okviru diplomske naloge bi bilo potrebno raziskati ali je lahko NoSQL podatkovna baza Cassandra realen nadomestek relacijske podatkovne baze v vlogi zalednega sistema za Django ORM. Raziskave na tem področju so šele v začetni fazi, nekaj napredka pa je opaznega na enem izmed projektov Django Cassandra backend. Ena izmed večjih težav, s katero se v praksi srečujejo načrtovalci in razvijalci je visoka stopnja zahtevnosti migracije shem, kar onemogoča iterativen razvoj aplikacij. V okviru diplomske naloge bi študent preveril (1) ali NoSQL podatkovne baze omogočajo enako hiter razvoj standardnih spletnih aplikacij v primerjavi z relacijskimi podatkovnimi bazami, pod predpostavko, da je podatkov malo (migracije shem se izvedejo hitro) in (2) ali NoSQL podatkovne baze omogočajo hitrejši razvoj standardnih spletnih aplikacij v primerjavi z relacijskimi podatkovnimi bazami, ko imamo veliko podatkov (migracije shem so počasne in problematične).

    Že izdelane diplomske naloge:

  • Inteligentni avtomobilski pomočnik

    (Torque, OBD 2)

    V okviru diplomske naloge bi pripravili prototip inteligentnega avtomobilskega pomočnika, ki uporablja podatke iz avtomobilskega računalnika preko OBD II vmesnika in jih poveže z ostalimi podatki iz različnih virov: GPS lokacija, vremenske razmere, prometne razmere na cestah ipd. Prototip bi bil izdelan za operacijski sistem Android (glej primer zanimive aplikacije Torque, ki izkorišča podatke iz avtomobilskega računalnika).

    Android TorqueBluetooth OBD 2 avtomobilski vmesnik

    Že izdelane diplomske naloge:

  • Različni pristopi obvladovanja avtorizacije pri spletnih in namiznih aplikacijah, mobilnih telefonih ter ostalih napravah

    (OAuth 2.0, OAuth 2.0 Playground)

    V okviru diplomske naloge bi bilo potrebno raziskati različne načine omogočanja dostopa do virov, brez prenašanja uporabniških gesel. Na tem področju obstajajo številni pristopi (OAuth 1.0, OAuth 2.0 ipd.). Naloga bi zajemala predstavitev najbolj uporabljanih pristopov in razvoj prototipa, ki prikaže prednosti in slabosti posameznih pristopov.

    Že izdelane diplomske naloge:

  • Performančna primerjava relacijskih in NoSQL podatkovnih baz

    (NoSQL podatkovne baze, relacijske podatkovne baze, Hadoop, Cassandra, ClouData, MongoDB)

    V zadnjem času postajajo vse bolj razširjenje NOSQL podatkovne baze, ki naslavljajo in odpravljajo predvsem pomanjkljivosti relacijskih podatkovnih baz. V okviru diplomske naloge bi bilo potrebno pregledati in podrobno predstaviti področje NOSQL podatkovnih baz ter na podlagi izbranega scenarija uporabe pokazati prednosti in slabosti v primerjavi z relacijskimi podatkovnimi bazami. Pri performančni analizi bi se osredotočili predvsem na najvidnejše predstavnike posameznih kategorij NOSQL podatkovnih baz, kot so Apache Hadoop HBase, Apache Cassandra, Google BigTable in ClouData, MongoDB itd.

    Že izdelane diplomske naloge:

  • Odkrivanje zakonitosti na družabnih omrežjih

    (Twitter, LinkedIn, Facebook)

    Priljubljenost svetovnega splet bolj zaznamujejo družabni dejavniki kot tehnični. V podatkih, ki jih najdemo na družabnih omrežjih lahko najdemo številne zanimive povezave in dejstva. V okviru diplomske naloge bi s pomočjo literature Mining the Social Web poskušali odgovoriti na kakšno izmed naslednjih vprašanj:

    • Kdo pozna koga in kakšni so skupni prijatelji?
    • Kako pogosto določeni ljudje komunicirajo drug z drugim?
    • Kakšna je simetričnost komunikacije med uporabniki?
    • Kateri so najbolj glasni oz. tihi uporabniki v omrežju?
    • Kateri uporabniki v omrežju so najbolj vplivni oz. popularni?
    • O čem se ljudje pogovarjajo (kaj je zanimivo)?

    Odgovori na zgornja vprašanja povezujejo več uporabnikov skupaj in označujejo kontekst, zakaj povezava sploh obstaja.

    SNA

    Že izdelane diplomske naloge:

  • Performance aplikacij semantičnega spleta

    (semantični splet, ontologije, sklepanje)

    Semantični splet, ontologije in aplikacije, ki uporabljajo napredne in najnovejše tehnologije so v zadnjem času v porastu. Kljub temu njihova sprejetost ni na željeni ravni. Eden od razlogov so zagotovo performančni razlogi, saj v tem pogledu omenjene aplikacije zaostajajo za aplikacijami, razvitimi s standardnimi in preizkušenimi tehnologijami. V okviru diplomske naloge bi bilo potrebno na izbranem scenariju uporabe preveriti kakšne se lastnosti aplikacije semantičnega spleta. Ugotoviti bi bilo potrebno ali je cena modularnosti in razširljivosti, ki je odlika aplikacij semantičnega spleta, prevelika v primerjavi s performančnimi zmogljivostmi. Pri implementaciji prototipa bi temeljili na odprtokodnih rešitvah, ki so na voljo na področju urejevalnikov ontologij in strojev za sklepanje, kjer bi se aplikacije semantičnega spleta izvajale.

    Že izdelane diplomske naloge:

Kontaktni podatki

Gradivo za študente

Splošne teme

©2010 Dejan Lavbič

SLO  ENG