Содержание последнего номера
DOI: https://doi.org/10.29025/2079-6021-2022-2-153-165
Цифровые филологические практики: проект «Chekhov Digital»
Резюме:
В статье рассматривается роль «цифровых практик» в формировании междисциплинарности гуманитарного знания, особенности разработки цифровых гуманитарных проектов в области филологии. Рассмотрена модель разработки цифрового проекта в области подготовки семантической разметки литературных изданий Chekhov Digital, который представляет собой цифровую публикацию академического Полного собрания сочинений и писем А. П. Чехова. Цель проекта – разработка машиночитаемой (семантической) разметки текстов писателя с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI). В рамках проекта уточняются стандарты для подготовки цифровых русскоязычных изданий, формулируются концептуальные и технические условия реализации, разрабатывается инфраструктура и новые методы исследования. Разработана структура машиночитаемой аннотации документов, позволяющая разметить смысловые сущности в чеховских текстах, примечаниях и комментариях для организации семантического поиска по корпусу текстов писателя. Для уточнения разметки смысловых сущностей в произведениях А. П. Чехова использованы методы автоматической обработки текстов, включая тематическое моделирование и семантические векторные модели для изучения важнейших авторских концептов; корпусные методы исследования непосредственных контекстов употребления вербальных репрезентаций концептов. Концептуальный анализ позволил провести реконструкцию авторских концептов в контексте разметки смысловых сущностей. Для разметки имен и названий реально существовавших людей и объектов создана специализированная база данных, основанная на указателях к письмам. В рамках проекта реализован принцип открытых исследовательских данных (Open Data), одной из целей которого является создание научных сообществ вокруг данных. Работа над проектом привела к развитию научного сотрудничества Центров цифровых гуманитарных исследований НИУ ВШЭ и ЮФУ.
Ключевые слова: цифровые гуманитарные науки; междициплинарность; цифровые издания; Text Encoding Initiative; семантическая разметка; цифровая филология; цифровой проект; Chekhov Digital.
Благодарности: Статья подготовлена в рамках соглашения о научном сотрудничестве № 6.13.1-02/250821-1 по проекту «Конвергенция языковых пластов русского языка в зеркале цифровых решений» между Южным федеральным университетом (ЮФУ) и Национальным исследовательским университетом «Высшая школа экономики» (НИУ ВШЭ) («Зеркальные лаборатории НИУ ВШЭ»).
Для цитирования: Северина Е.М., Бонч-Осмоловская А.А., Кудин А.М. Цифровые филологические практики: проект «Chekhov Digital». Актуальные проблемы филологии и педагогической лингвистики. 2022. № 2. С. 153–165.
Язык: русский
ISBN 2619-029X (Online)