Odpri menu

Moderna arhivistika 2023, 6 (1), str./pp. 30-44

Jan COTIČ, Ivančica SABADIN
Pokrajinski arhiv Koper, Slovenija / Regional Archives Koper, Slovenia

Cel članek / Full text article
Operativna uporabnost orodij za prepoznavanje z roko napisanega besedila na podlagi analize razpoznanih vsebin
Operational Usefullness of Handwritten Text Recognition Tools
(Moderna arhivistika 2023, 6 (1), str./pp. 30–44)

https://doi.org/10.54356/MA/2023/JXVT8129


Izvleček:
Prepoznavanje z roko napisanega besedila oz. rokopisa (angl. handwritten text recognition) je tehnologija, ki bi olajšala problematiko prepoznavanja vsebine tovrstnih dokumentov. Cilj uporabe orodja za prepoznavanje z roko napisanega besedila je ustvaritev besedila, ki bi omogočilo hitrejše razumevanje, večjo dostopnost in lažjo uporabo specifičnega gradiva ter omogočil prosto iskanje po celotnem besedilu (angl. full-text search). Avtorja sta čez analizo treh dostopnih orodij za prepoznavanje z roko napisanega besedila predstavila postopek in dobljene rezultate na digitaliziranem gradivu Pokrajinskega arhiva Koper. Rezultati so pokazali, da je povprečna napaka za vsa tri orodja 57 %, kar pomeni, da so orodja zaznala narobe več kot polovico besed.

Ključne besede:
prepoznavanje z roko napisanega besedila, Transkribus, Microsoft Azure's Computer Vision, Google Cloud Vision AI, umetna inteligenca

Abstract:
Operational Usefullness of Handwritten Text Recognition Tools
Handwritten Text Recognition (HTR) is a technology that would ease the problem of recognising the content of written documents. The aim of using handwritten text recognition technology is to create a text that makes certain material more understandable, accessible and easy to use. It also allows for full-text searching. The authors present the procedure and the results obtained on the digitised material of the Regional Archives Koper through an analysis of three available tools for handwritten text recognition. The results showed that the average error for all three tools was 57%, which means that the tools recognised more than half of the words incorrectly.

Key words:
Handwritten Text Recognition, Transkribus, Microsoft Azure's Computer Vision, Google Cloud Vision AI, Artificial Intelligence