✨ Прва фаза — проширење SrpELTeC+

Дигитализација српског књижевног наслеђа ијекавског изговора (1840–1920)

Пројекат има за циљ прикупљање и дигитализацију репрезентативних књижевних дела српског језика ијекавског изговора, као допуну постојећих корпуса и уравнотежено проучавање екавског и ијекавског изговора.

46 публикација
39 приповиједака
5 путописа 2 романа

Планирано проширење: књижевна критика, кратка проза и други жанрови.

О пројекту

Зашто ијекавица у дигиталном окружењу?

Ијекавски изговор је равноправан екавском, али је недовољно заступљен у постојећим дигиталним корпусима и ресурсима, што ограничава истраживања и видљивост културног наслеђа. Ова иницијатива систематски попуњава ту празнину у оквиру временског распона 1840–1920.

  • Циљ: формирање корпуса ијекавског изговора као допуне SrpELTeC+.
  • Носилац пројекта: Центар за дигиталну хуманистику, Филозофски факултет Пале.
  • Финансирање: Министарство за научнотехнолошки развој и високо образовање у Влади Републике Српске.

Погледај и колекцију srpELTeC!

Опсег и избор

У првој фази одабрани су жанрови: роман, приповијетка, путопис — и канонска и мање позната дела, уз тежиште на репрезентативности и доступности штампаних и дигиталних извора.

Период: 1840–1920 · Ћирилица · српски ијекавски

  • Руководилац: проф. др Јелена Марковић
  • Сарадници: Сарадници: доц. др Срђан Шућур, проф. др Радославка Сударушић, проф. др Мирјана Лукић, др Борјан Митровић, мср Душан Пејић
  • Спољни сарадници:проф. др Цветана Крстев, проф. др Ранка Станковић
Садржај корпуса

Аутори и дела (избор)

Приповијетке

Петар Кочић; Светозар Ћоровић; Васо Кондић; Марко Поповић; Милан Трифуновић; Јоаникије Памучина; Михајло Милановић; Никола Видаковић; Радован Тунгуз-Перовић; Лука Грђић-Бјелокосић; Ђорђе Чокорило; Милка Алексић Гргурова; Љубица Поповић; Олга Ракић; Јелица Беловићева…

Путописи

Константин Хаџиристић; Јово Бесаровић; Сава Косановић; Ристо Бесаровић; Сава Пјешчић; Марко Цар.

Романи

Светозар Ћоровић; Радован Тунгуз-Перовић.

Комплетан списак публикација, метаподаци и статус обраде доступни у репозиторијуму (data/, metadata/).

Методологија

Дигитализација, OCR, анотација

Радионице и техничка подршка

Друштво за језичке ресурсе и технологије ЈеРТех

  • Радионица 1 (Дигитализација: од слике до дигиталног текста)
  • Радионица 2 (Обрада дигиталних текстова)
  • Радионица 3 (Аутоматска анотација текстова)
  • Радионица 4 (Читање, читање изблиза (корпуси, конкорданце) читање из далека (статистичка обрада))
  • Радионица 5 (Текстометријска анализа текста коришћењем алата TXM)

Поступак

  • OCR: Tesseract (texase.jerteh.rs); припрема страница, спајање серијала, чишћење заглавља/фуснота.
  • Корекција: Notepad++ + ELTeC језици; нормализација пасуса, исправке графема/интерпункције.
  • TEI: основна структура (<div>, <head>, <pb>, <title>, <foreign>, <hi>, <quote>/<l>, фусноте, <trailer> за напомене „Наставиће се“, „Свршетак“…).
Партнерске институције

Библиотеке и фондови

  • Народна и универзитетска библиотека РС — 19
  • Народна библиотека Србије — 8
  • Библиотека ФФ Пале — 3
  • Универзитетска библиотека „Св. Марковић“ — 3
  • НБ „Радислав Никчевић“ Јагодина — 3
  • Библиотека Сарајева — 3
  • Google Books — 3
  • НУБ БиХ — 2
  • Библиотека Матице српске — 1
  • НБ „Филип Вишњић“ Бијељина — 1
  • Укупно публикација — 46

Захваљујемо тимовима библиотека на подршци у претрази, скенирању и уступању копија.

Подаци

Преузимање и структура репозиторијума

Корпус (верзија 1.0):

  • level1/ — TEI P5 датотеке (валидиране) level1 анотације (Центар ДХ ФФУИС)
  • level1jerteh/ — TEI P5 датотеке (валидиране) level1 анотације (ЈеРТех)
  • html/ — HTML облик дела
  • metadata/ — CSV/JSON метаподаци (аутор, година, извор, жанр, опсег)
  • level0/ — дигитализована дела која нису level1

Лиценца: CC BY-SA 4.0

Како цитирати

Срђан Шућур, Јелена Марковић, (2025) Дигитализација српског књижевног наслеђа ијекавског изговора (1840–1920) при Центру за дигиталну хуманистику Филозофског факултета Пале (прва фаза), Proceedings of the International Conference South Slavic Languages in the Digital Environment JuDig, стране 209-226.

Контакт

Пишите нам

📧 dhc@ff.ues.rs.ba · 🔗 Центар за дигиталну хуманистику Филозофског факултета Универзитета у Источном Сарајеву