Recognition of names on images of medical reports in Serbian to protect personal data
Prepoznavanje imena na slikama lekarskih izveštaja na srpskom jeziku u cilju zaštite ličnih podataka
ABSTRACT The modern way of life inevitably includes the use of ICT in all its segments, even in healthcare. In addition to e-health, whose development is growing, especially since the world faced the coronary virus pandemic, most people are also looking for health advice on social networks. On that occasion, they upload pictures that contain their health results, with their personal data. This paper presents a method for recognition of personal names in images of medical reports written in Serbian to de-identify them. This method is based on optical character recognition, natural language processing methods and rules and has wide application, as de-identification of electronic medical reports is a necessary step for their further analysis.
Sažetak: Savremeni način života neizostavno uključuje upotrebu računara i mobilnih telefona u svim svojim segmentima, pa i kada je u pitanju zdravstvo. Pored elektronskog zdravstva koje se sve više razvija, pogotovo od kada se svet suočio sa pandemijom korona virusa, sve više ljudi traži i savete o zdravlju na društvenim mrežama. Tom prilikom dodaju slike koje sadrže njihove zdravstvene rezultate, ne mareći o tome da na taj način ostavljaju i svoje lične podatke. U ovom radu data je metoda za prepoznavanje imena na slikama medicinskih izveštajima napisanih na srpskom jeziku u cilju njihove deidentifikacije. Ova metoda bazirana je na optičkom prepoznavanju karaktera, metodama obrade prirodnog jezika i pravilima i ima široku upotrebu, jer je de-identifikacija elektronskih medicinskih izveštaja neophodan korak za njihovu bilo kakvu dalju analizu.
srpski
2022
© All rights reserved
Ključne reči— de-identifikacija, elektronski medicinski izveštaji, prepoznavanje imenovanih entiteta, obrada prirodnog jezika, optičko prepoznavanje karaktera, zaštita privatnosti, srpski jezik.