Skip to main content Резултати
Корпус
- Укупно: 33.408.866 речи
- Укупно обрађених бројева/докумената на платформи: 375
Обрађене колекције (бројеви / странице)
- Дело: 71 број, 34.416 једностубичних мањих страна
- Отаџбина: 33 броја, 21.159 једноколонских мањих страна
- Жена: 91 број, 4.453 једноколонске мање стране
- Зора: 58 бројева, 2.400 двоколонских већих страна
- Нова искра: 123 броја, 3.950 великих страна (двоколонски)
Функционалности (језичке технологије)
- OCR + корекција, затим конверзија у TEI XML
- Структурно обележавање: секције/пасуси/реченице, странице (
<pb>) - Препознавање ентитета (PERS/LOC/ORG/ROLE) и линковање ка Wikidata
- Моделирање тема и повезивање тема са метаподацима/фасетама
- SPARQL упити за визуелизације над повезаним подацима