Title (srp)

Multimedijalne baze podataka u upravljanju nematerijalnim kulturnim nasleđem: doktorska disertacija

Author

Tanasijеvić, Ivana D., 1983-, 70402569

Contributor

Pavlović-Lažetić, Gordana, 1955-, 12443239
Mitić, Nenad, 1959-, 12528743
Tomašević, Jelena, 1979-, 12939623
Sikimić, Biljana, 1956-, 9079143

Description (srp)

Motivacija za izradu ove doktorske disertacije je multimedijalna kolekcija koja je rezultat vi²egodi²njih terenskih istraºivanja istraºiva£a iz Balkanolo²kog instituta Srpske akademije nauka i umetnosti. Kolekcija se sastoji od materijala u vidu snimljenih intervjua, snimljenih raznih obi£aja, pridruºenih tekstualnih opisa (protokola) i brojnih drugih dokumenata. Predmet istraºivanja ove disertacije je prou£avanje mogu¢nosti i razvoj novih metoda kojima bi se zapo£elo re²avanje problema upravljanja nematerijalnim kulturnim nasleem Balkana. Podzadaci koji se tom prilikom otvaraju su razvoj adekvatnog dizajna i implementacije multimedijalne baze podataka nematerijalnog kulturnog naslea koja bi odgovarala potrebama razli£itih vrsta korisnika, automatska semanti£ka anotacija protokola uz pomo¢ metoda obrade prirodnih jezika, kao osnova za polu-automatsku anotaciju multimedijalne kolekcije i uspe²nu pretragu po metapodacima koji su u skladu sa CIDOC CRM standardom, istraºivanje dodatnih mogu¢nosti pretrage ove kolekcije u cilju dobijanja novih znanja, kao i razvoj izabranih metoda. Glavni problem sa dostupnim metodama je u tome ²to jo² uvek nema dovoljno razvijene infrastrukture u kontekstu obrade teksta na prirodnom jeziku, organizacije i upravljanja u domenu kulturnog naslea na prostoru Balkana i posebno za slu£aj srpskog jezika, koja bi se mogla efektivno koristiti za re²avanje postavljenog problema. Stoga, postoji izraºena potreba za razvojem metoda kojima bi se do²lo do odgovaraju¢eg re²enja. Za polu-automatsku anotaciju multimedijalnih materijala kori²¢ena je automatska semanti£ka anotacija protokola koji su pridruºeni materijalima. Ona je sprovedena metodama ekstrakcije informacija, prepoznavanja imenovanih entiteta i ekstrakcije tema, tehnikama zasnovanim na pravilima uz pomo¢ dodatnih resursa poput elektronskih re£nika, tezaurusa i re£nika re£i iz speci£nog domena. Za klasikaciju tekstualnih protokola u odnosu na tematiku, izvedeno je istraºivanje o metodama koje se mogu primeniti za re²avanje problema klasikacije tekstova na srpskom jeziku, i ponuena je metoda koja je prilagoena speci£nom domenu koji se obrauje (nematerijalno kulturno naslee), speci£nim problemima koji se re²avaju (klasikacija protokola u odnosu na tematiku) i srpskom jeziku, kao jednom od morfolo²ki bogatih jezika...

Description (srp)

computer science - multimedia databases, natural language processing / računarstvo -multimedijalne baze podataka, obrada prirodnog jezika Datum odbrane: 02.02.2021.

Description (eng)

The motivation for writing this doctoral dissertation is a multimedia collection that is the result of many years of eld research conducted by researchers from the Institute for Balkan studies of the Serbian Academy of Sciences and Arts. The collection consists of materials in the form of recorded interviews, various recorded customs, associated textual descriptions (protocols) and numerous other documents. The subject of research of this dissertation is the study of possibilities and the development of new methods that could be used as a starting point in solving the problem of managing the intangible cultural heritage of the Balkans. The subtasks that emerge in this endeavor are the development of adequate design and implementation of a multimedia database of intangible cultural heritage that would meet the needs of dierent types of users, automatic semantic annotation of protocols using natural language processing methods, as a basis for semi-automatic annotation of the multimedia collection, and successful search by metadata which comply with the CIDOC CRM standard, study of additional search possibilities of this collection in order to gain new knowledge, as well as development of selected methods. The main problem with the available methods is that there is still not enough developed infrastructure in the context of natural language processing, organization and management in the eld of cultural heritage in the Balkans and especially for the Serbian language, which could be eectively used to solve the proposed problem. There is thus a strong need to develop methods to reach an appropriate solution. For the semi-automatic annotation of multimedia materials, automatic semantic annotation of the protocols associated with the materials was used. It was carried out by methods of information extraction, recognition of named entities and topic extraction, using rule-based techniques with the help of additional resources such as electronic dictionaries, thesauri and vocabularies from a specic domain. To classify textual protocols in relation to the topic, research was conducted on methods that can be used to solve the problem of classifying texts in the Serbian language, and a method was oered that is adapted to the specic domain being processed (intangible cultural heritage), to the specic problems being solved (classi cation of protocols in relation to the topic) and to the Serbian language, as one of the morphologically rich languages...

Object languages

Serbian

Date

2020

Rights

Creative Commons License
This work is licensed under a
CC BY-NC-ND 2.0 AT - Creative Commons Attribution - Non-Commercial - No Derivative Works 2.0 Austria License.

CC BY-NC-ND 2.0 AT

http://creativecommons.org/licenses/by-nc-nd/2.0/at/

Subject

multimedia databases, spatial databases, natural language processing,machine learning, information extraction, text classication, automatic semanticannotation, information retrieval, managing of intangible cultural heritage

OSNO - Opšta sistematizacija nau?nih oblasti -- Matematika (19) -- Semiotika. Matemati?ka lingvistika (1921)

OSNO - Opšta sistematizacija nau?nih oblasti -- Informatika (20) -- Ra?unarska tehnika. Informaciona tehnologija (2005) -- Podaci. Sistemi za upravljanje bazama podataka (200509)

Identifiers