Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

URI (Uniform Resource Identifier) – Jednotný referencovateľný identifikátor je reťazec znakov používaných na identifikáciu entity v sémantickom webe v tvare httphttps://... Na rozdiel od URL (Uniform Resource Locator) neslúži na navigáciu na stránku kvôli jej zobrazeniu, ale slúži na identifikáciu predmetnej entity.

...

Nasledovný príklad prezentuje použitie URI na identifikáciu troch RDF zdrojov: konkrétnej osoby, vlastnosti priezvisko a identifikáciu triedy fyzická osoba.

...

Code Block
<https://data.gov.sk/id/president/andrej-

...

kiska>
<https://data.gov.sk/def/ontology/physical-person/

...

familyName>
<https://data.gov.sk/def/ontology/physical-person/

...

PhysicalPerson> 

Indivíduum je objekt reálneho sveta, v sémantickom webe reprezentované ako URI. V predchádzajúcom príklade je len prvé URI indivíduom.

...

Nasledovné príklady prezentujú dva triplety. Prvý definuje zamestnanie Andreja Kisku a tu je použitá objektová vlastnosť. Druhý triplet definuje priezvisko nášho prezidenta a tu je použitá dátová vlastnosť. 

...

Code Block
<https://data.gov.sk/id/president/andrej-kiska> 

...

<https://data.gov.sk/def/ontology/physical-person/occupation-type>

...

 <https://data.gov.sk/def/occupation-type/

...

1111001> .

...

 

...


<https://data.gov.sk/id/president/andrej-kiska> 

...

<https://data.gov.sk/def/ontology/physical-person/familyName>

...

 "Kiska"^^xsd:string .

Odvodený tripletje triplet, ktorý vznikol strojovým odvodeným odvodením z existujúcich tripletov v znalostnej báze na základe iných tripletovdefinovaného pravidla.

Vyššie uvedený triplet definoval, že nejaký RDF zdroj má priezvisko Kiska. Keďže platí, že dátová vlastnosť priezvisko je definovaná medzi Osobou a reťazcom (tj. doména relácie je Osoba a rozsah je reťazec), teda

...

 

Code Block
<https://data.gov.sk/def/ontology/physical-person/givenName> 

...

rdfs:

...

domain <https://data.gov.sk/def/ontology/physical-person/

...

PhysicalPerson> .

 

potom je možné odvodiť, že predmetný RDF zdroj reprezentuje fyzickú osobu, tj.

...

 

Code Block
<https://data.gov.sk/id/president/andrej-kiska> 

...

rdf:

...

type <https://data.gov.sk/def/ontology/physical-person/

...

PhysicalPerson> .

Odvodzovanie – Strojové odvodzovanie (machine reasoning) je disciplína umelej inteligencie, ktorá sa zaoberá odvodzovaním nových znalostí (tripletov) z existujúcich. Inými slovami, stroj sa snaží odvodiť, aké nové triplety vie odvodiť z existujúcich.

Predstavme si situáciu, že v systéme je uložený triplet: Lukáško má brata Slávka. Klasický relačný systém vie odpovedať správne iba na otázku, kto je brat Lukáška? Slávko. Ale ak sa spýtam, kto je brat Slávka, tak mi správne odpovie len sémantický systém, pretože ten si z tripletu: Lukáško má brata Slávka odvodí inverzný triplet: Slávko má brata Lukáška, nakoľko vlastnosť „má brata“ je symetrická.

Význam odvodzovania je nie len vo vyhľadávaní, ale najmä pri celkovej integrácii rôznorodých informačných systémov, pri overovaní logických faktov a podobne. Reálne sa odvodzovanie vykonáva prostredníctvom odvodzovača (reasonera), čo býva štandardný komponent sémantickej  databázy (triplestore). Existujú dva základné princípy odvodzovania – dopredné zreťazenie a spätné zreťazenie. Prvé sa deje hneď pri vkladaní tripletov do databázy, čiže spomínaný inverzný triplet by sa vytvoril okamžite, kým druhý typ odvodzovania sa deje až pri dopyte, tj. až keď sa spýtam Kto je bratom Slávka. Až vtedy sa odvodí, resp. pokúsi odvodiť inverzný triplet . Pre kľúčovú požiadavku rýchlosti sa v komerčných aplikáciach preferuje prvý prípad. Pri vložení sa okamžite odvodia nové triplety aby odpovede na databázu boli už vypočítané.

...

Ontológiaje množina tripletov ktorá opisuje vybranú doménu. V súčasnosti samozrejme existuje obrovské množstvo ontológií, aj a to aj v zmysle ich strojovo spracovateľnej formy (OWL, RDF). Napr. ontológia osoby, organizácie, ontológia rastlín, ontológia odvetví sektora XY a podobne. Takmer každá dôležitá klasifikácia niečoho existuje vo forme strojovo-spracovateľnej ontológie, ako napr. ontológia geografických prvkov, ontológia medzinárodnej klasifikácie chorôb, ontológia nomenklatúry územných entít a podobne.

 Vo všeobecnosti, ontológia v prvom rade definuje triedy a ich vzájomné vzťahy, pričom medzi základné vzťahy patria ich hierarchické relácie ako rdfs:subClassOf (podtrieda, resp. dedenie). V tomto kontexte je dôležité povedať, že ontológia je všeobecnejší pojem ako model, pretože model (napr. UML model) je vlastne slabá ontológia. Nie je možné použiť také silne odvodzovanie ako v prípade OWL, tj. sémantickej ontológie.

Asset - verzionovateľná entita

Datasetsprístupnená publikovanáverzionovateľná množina údajov, v sémantickom webe tripletov. Hlavné typy datasetu sú číselník alebo hierarchia. Kým číselník sa zameriava na výčet entít z ich základnými vlastnosťami, hierarchia obohacuje číselníky o hierarchické relácie, ako napr. skos:broader a skos:narrower (všeobecnejší a presnejší). definovaných v A.4.5.3 Pravidlá pre publikáciu katalógu, datasetu a distribúcie.  

Distribúciaje verzia (najčastejšie časová) katalógu / reprezentácia datasetu.

Katalóg -  množina datasetov.

...

5★Open DataTim Berness-Lee, tvorca webu a iniciátor sémantického webu odporučil tzv. 5 hviezdičkovú klasifikáciu otvorených dát. Platí, čím viac hviezdičiek, tým sú otvorené dáta lepšie otvorené. Je zrejmé, že kvôli výhodám sémantiky sú takto anotované dáta vyhodnotené ako najlepšie.

4 vs 5 dáta
Rozdiel medzi 4 a 5 hviezdičkovými dátami :

4 hviezdičky

  • použitie referencovateľných identifikátorov na identifikáciu entít
  • použitie vlastných ontológií na dátový model
  • nutnosť mapovania ontológií v najväčšej možnej miere na 5 hviezdičiek na zachovanie čo najväčšej interoperability
  • dereferenciácia referencovateľných identifikátorov je voliteľná
  • zverejnenie vlastných ontológií je odporúčané
  • zaregistrovanie šablón referencovateľných identifikátorov na MetaIS je voliteľné
  • pri registrácii je nutné vždy požiadať Centrálnu dátovú kanceláriu na UPPVII o zaradenie dát medzi 5 hviedičkové. Len v prípade odmietnutia sa stávajú 4 hviezdičkové.
  • negarantujú dátovú interoperabilitu medzi systémami nakoľko nie sú súčasťou centrálneho modelu údajov
  • referencovateľné identifikátory musia byť tvorené metodikou, ktorá je súčasťou Sémantické dátové štandardy ISVS

5 hviezdičiek

Všetko zo 4 hviezdičiek, ale :

  • reprezentujú centrálny model verejnej správy prostredníctvom ontológií
  • sú používané jednotné referencovateľné identifikátorom
  • model údajov je pod prísnou správou pracovnej skupíny PS1 a zaručuje úplnú interoperabilitu údajov v prostredí verejnej správy
  • doména všetkých URI je https://data.gov.sk
  • dereferenciácia je zabezpečená integráciou MetaIS a portálu data.gov.sk


Dôležitým elementom je, že každá entita musí mať ambicíu stať sa 5 hviezdičkovou entitou. Pracovná skupina PS1 bude dozerať a schvalovať žiadosti o priradenie entity do centrálneho modelu údajov.

Jednotný referencovateľný identifikátor - vyjadruje URI identifikátor, ktorý unikátne identifikuje entitu v prostredí ISVS a ktorý je záväzné používať pre každú entitu, ktorá takýto identifikátor má pridelený.

data.gov.sk-semanticwebje metodika sémantických štandardov (5 OpenData) pre údaje ISVS. Jej základom je rozšíriteľný URI systém, umožňujúci popísať (katalogizovať) údaje verejnej správy do komplexného RDF grafu.

...

Unknown macro: {add-label}