Программа для формирования мультимодальных педагогических датасетов «EduMultimodal Dataset Builder»

Программа для формирования мультимодальных педагогических датасетов «EduMultimodal Dataset Builder»

Дата выдачи

15.12.2025

Номер

2025695865

Авторы

Абрамов В.И., Босенко Т.М., Зацепин Н.А., Сулейманов Р.С.

Подразделение

Институт цифрового образования

Программа предназначена для автоматизированного формирования и выгрузки структурированных мультимодальных датасетов, используемых при обучении интеллектуальных систем. Область применения – обработка данных педагогических наблюдений и аналитика образовательного процесса. Функциональные возможности включают загрузку видеофайлов с целевой платформы или локального носителя, импорт и валидацию файлов экспертной разметки в формате JSON, обработку пространственных координат выделенных областей кадра для визуальной идентификации субъекта педагогического действия, автоматическое формирование компонентов датасета (нарезка видеофрагментов и аудиоотрезков, транскрибация речи, извлечение кадров) на основе временных меток, объединение медиаданных с атрибутами педагогических категорий, контекста и описаний, а также последующую выгрузку готового датасета в репозиторий Hugging Face или иную совместимую целевую систему.