Резултати

Корпус

  • Укупно: 33.408.866 речи
  • Укупно обрађених бројева/докумената на платформи: 375

Обрађене колекције (бројеви / странице)

  • Дело: 71 број, 34.416 једностубичних мањих страна
  • Отаџбина: 33 броја, 21.159 једноколонских мањих страна
  • Жена: 91 број, 4.453 једноколонске мање стране
  • Зора: 58 бројева, 2.400 двоколонских већих страна
  • Нова искра: 123 броја, 3.950 великих страна (двоколонски)

Функционалности (језичке технологије)

  • OCR + корекција, затим конверзија у TEI XML
  • Структурно обележавање: секције/пасуси/реченице, странице (<pb>)
  • Препознавање ентитета (PERS/LOC/ORG/ROLE) и линковање ка Wikidata
  • Моделирање тема и повезивање тема са метаподацима/фасетама
  • SPARQL упити за визуелизације над повезаним подацима