Descripción
Обучението ще представи на участниците процеса на дигитализация на ценни културно-исторически източници от фонда на Народна библиотека "Иван Вазов" - Пловдив.
Обучението ще включва техники за множествено (batch) обработване на файлове, оптическо разпознаване на символи (OCR) със софтуерен продукт ABBYY FineReader на исторически и съвременни текстове. Чрез OCR текстът от изображение, което само човек може визуално да чете, се превръща в такъв, който се разбира от компютъра. Съответно възможностите за взаимодействие с текста се увеличават – може да се търси по ключова дума, да се копира, да се използва в науката за генериране на текстови корпуси и за компютърната обработка на естествен език (NLP), което е предпоставка за развитие на технологиите, свързани с изкуствения интелект. Ще се направи и демонстрация на използваните в Дигиталния център скенери. Ще бъде показана административната част на софтуерната платформа на Дигиталната библиотека, нейните характеристики и предимства. Ще бъде засегната и темата за стандартите METAMORFOZE и FADGI за качество на генерираните изображения, основни параметри като резолюция, точки на кв. инч (ppi и dpi), баланс на бялото, фокус, острота и др.
Участниците в обучението ще получат знания в областта на дигитализацията на исторически и архивни материали, които могат да приложат в широк спектър от дейности, свързани с боравене с дигитални изображения, обработка на текст.