Программа для формирования мультимодальных педагогических датасетов «EduMultimodal Dataset Builder»

Программа для формирования мультимодальных педагогических датасетов «EduMultimodal Dataset Builder»

Дата выдачи

15.12.2025

Номер

2025695865

COM_RID_AUTORS

Абрамов В.И., Босенко Т.М., Зацепин Н.А., Сулейманов Р.С.

Подразделение

Институт цифрового образования

Программа предназначена для автоматизированного формирования и выгрузки структурированных мультимодальных датасетов, используемых при обучении интеллектуальных систем. Область применения – обработка данных педагогических наблюдений и аналитика образовательного процесса. Функциональные возможности включают загрузку видеофайлов с целевой платформы или локального носителя, импорт и валидацию файлов экспертной разметки в формате JSON, обработку пространственных координат выделенных областей кадра для визуальной идентификации субъекта педагогического действия, автоматическое формирование компонентов датасета (нарезка видеофрагментов и аудиоотрезков, транскрибация речи, извлечение кадров) на основе временных меток, объединение медиаданных с атрибутами педагогических категорий, контекста и описаний, а также последующую выгрузку готового датасета в репозиторий Hugging Face или иную совместимую целевую систему.