5. Sémantický web: technologie sémantického webu, metadata, RDF, RDFS, OWL, dotazování se na sémantický web (význam, jazyky), sémantický web a odvozování (význam, jazyky), aplikace sémantického webu.

Metadata: klíčový aspekt sémantického webu
Obsah sémantického webu = data + metadata
  • Smysl: obohacení dat na webu o významově bohaté popisy (výroky) pro dosažení automatizovaného zpracování webových dokumentů webovými agenty
  • Přechod od webu informačního k webu znalostnímu

5.1. Typy metadat

Příklad metadat: knihovní katalog

  • Obsahově nezávislá metadata
  • Katalogový knihovní záznam publikace (standardní záznam)
  • Příklady: Poslední datum uložení dokumentu, místo uložení, přístup typu uživatele k dokumentu, ...
  • Obsahově závislá metadata
  • Příklady: Velikost dokumentu, barva obrázků, autor, počet stran, jazyk dokumentu, ...
  • Strukturovaná metadata: metadata spojená se strukturováním dokumentu (kapitoly a odstavce knihy, položky objednávky, ...)
  • Doménově specifická metadata: metadata související s aplikační doménou
  • Intra-doménově specifická: zachycují vztahy mezi daty týkající se stejné domény (např. pacient a alergie)
  • Inter-doménově specifická: zachycují vztahy mezi daty různých domén (např. ontologie * filosofie i informatika)

5.2. Metadatový framework

Sestává z množiny specifikací, které jsou zaměřeny např. na reprezentaci, manipulaci, uložení, údržbu a dotazování se na data a metadata

5.2.1. Komponenty

  • Datový model: soubor datových typů a funkcí, pomocí kterých se tvoří abstraktní pohled na webový dokument s možností přístupu k hodnotám uložených v proměnných datových typů
  • Serializační formát: poskytuje meta-jazyk a syntaktické konstrukce pro kódování metadat
  • příklad: RDF i OWL mají různé datové modely, přičemž jsou serializovány (zapsány) s použitím XML syntaxe
  • Dotazovací jazyk: existence různých přístupů pro dotazování (např. RDF * SPARQL, OWL * SQWRL)
  • Specifikace RDF založená na XML (RDF/XML)
  • Specifikace RDF Schématu: tvorba hierarchií
  • Specifikace SPARQL: protokol a dotazovací jazyk pro zpřístupnění RDF dat
  • XSL specifikace s XSLT (transformace XML dokumentu do formy HTML stránky zobrazitelné na webu)
  • XLink, XPointer: reprezentace hypertextových odkazů
  • Specifikace Xquery a Xpath: extrakce XML informací z webových dokumentů
  • Specifikace XML Schématu: definice struktury XML dokumentů pro rozšíření jejich sémantiky
  • Specifikace RDF založená na XML (RDF/XML)
  • Specifikace RDF Schématu: tvorba hierarchií
  • Specifikace SPARQL: protokol a
  • Jeden z nejstarších vyvinut s cílem oddělení obsahu od
  • Primárně určen pro reprezentaci metadat způsobu prezentace webového obsahu přidělených různým webovým zdrojům

5.3. RDF

5.3.1. Vlastnosti

  • Lze tvořit jen jednoduchá tvrzení tvaru podmět-přísudek-předmět
  • Nelze vyjádřit co podmět, přísudek a předmět znamenají, ani jaké jsou mezi nimi vztahy
  • Krkonoše jsou pohoří, Sněžka je hora, každá hora má výšku, ...
  • Pro tvorbu komplexních ontologií se nehodí,

vhodnější je OWL * Explicitně nemá zabudován koncept reprezentace tříd, implicitně ano ve formě rdf:type a rdf:property => v RDF lze reprezentovat, že něco“ je třídou nebo vlastností * S RDF ale nelze reprezentovat, že třída A je podtřídou třídy B => hierarchii tříd a vztahy mezi třídami

5.3.2. Schéma

  • RDF Schema, The RDF Vocabulary Description language
  • Nadstavba jazyka RDF pro tvorbu ontologií, která vznikla rozšířením
  • a sémantiky RDF
  • Určeno pro tvorbu struktury RDF tvrzení, resp. pro tvorbu tříd
  • a tříd vlastností pro reprezentaci vztahů mezi třídami
  • Zdroje tak mohou být kategorizovány a vnímány jako instance tříd
  • Třídy zdrojů jsou seskupovány do hierarchie
  • Třídy jsou vnímány jako rozšíření popisu zdrojů, více je konkretizují
  • Hierarchie RDF tříd je chápána jako RDF slovník obsahující množinu
  • RDF tvrzení se specifickým významem
  • Jedná se také o RDF graf, jako v případě RDF
  • Jmenný prostor má následující tvar:
  • ://www.w3.org/2000/01/rdf-schema# (rdfs prefix)

5.3.3. Síla RDF

  • tvorba jednoduchých ontologií, resp. vztahů mezi třídami
  • Nízká výpočetní složitost
  • S RDF schématem lze vyjádřit:

    • explicitně třídu,
    • datové typy,
    • def. obor, obor hodnot,
    • podtřídu,
    • „pod-vlastnost“, a další

5.3.4. Slabé stránky RDFS

  • ekvivalenci tříd
  • inverzní vlastnosti
  • funkcionalitu vlastnosti nebo její tranzitivitu
  • omezení kardinality vlastností
  • negaci tvrzení
  • disjunktnost tříd, ale pouze vztah je podtřídou
  • třídu použitím logických operátorů AND (průnik), OR (sjednocení), NOT (negace) na třídy

5.3.5. Metadatový framework založený na OWL (W3C)

  • OWL jazyk nabízí konstrukce, které umožňují vyjádřit různé typy omezení a axiomů na úrovni schémat a dat

5.3.6. Shrnutí funkcí metadat

  • Shrnutí (popisná funkce): sumarizace obsahu
  • Vyhledávání: prohledávání metadat s cílem vyšší přesnosti výsledků
  • Doporučení: umožňuje uživateli určit, která data potřebuje
  • Vybírání: pomoc při rozhodování, který zdroj informací načíst
  • Přístup: zajištění přístupu k datům (např. uvedením přesné lokace)
  • Interpretace: instrukce, jak se má s daty zacházet (např. formát, kódování, jazyk, šifrování, ...)
  • Specifikace: informace ovlivňující užití dat (např. právní podmínky, velikost, stáří, přístup. práva, ...)
  • Historie: popis historie nebo původu dat
  • Správa dat: specifikace pro správu objektu (např. datum poslední modifikace, datum vytvoření, ...)
  • Propojování a vztahy mezi daty: specifikace vztahů mezi objekty (např. mezi článkem a časopisem, mezi překladem a originálem, ...)

5.3.7. Budoucnost metadat

  • Některé standardy se stanou vůdčími
  • Důležitost vícejazyčnosti při tvorbě metadat (již zakomponováno v RDF)
  • Nutné počítat se širokým spektrem zdrojů (obrázky, videa, dynamicky generované objekty, ...)
  • Způsoby hodnocení efektivnosti metadat (metriky)
  • Teoretické základy pro tvorbu metadat (formální modely, metodologie, úvaha nad právními otázkami)
  • přednášky ZT2 na https://github.com/michaelkuty/ssz-ai-hk-3/tree/gh-pages/source/prednasky/zt2/