09.06.2023
2023662642
Куприянов Р.Б.
Управление информационных технологий
Программный модуль предназначен для нахождения похожих учебных дисциплин на основе их текстового содержания. Программный модуль содержит необходимые шаги предобработки текстовых данных учебных дисциплин (удаление символов пунктуации, удаление стоп-слов, лемматизация слов и т.д.). В основе программного модуля лежит принцип векторизации текстового содержания с помощью соответствующих алгоритмов для последующего определения наиболее близких векторов. Результатом работы программного модуля будет перечень учебных дисциплин с указанием степени вероятности для наиболее близких между собой учебных дисциплин.