Север и рынок. 2025, № 4.
СЕВЕР И РЫНОК: формирование экономического порядка. 2025. № 4. С. 57-73. Sever i rynok: formirovanie ekonomicheskogo poryadka [The North and the Market: Forming the Economic Order], 2025, no. 4, pp. 57-73. ПРОБЛЕМЫ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО РАЗВИТИЯ И РЫНОК ТРУДА РЕГИОНОВ РОССИЙСКОГО СЕВЕРА И АРКТИКИ Методы и материалы Для сбора и обработки данных использовался язык программирования Python. В частности, для обработки текстов вакансий и резюме применялись такие инструменты обработки естественного языка (NLP), как Natasha1 (языковая модель — "paraphrase- multilingual-M iniLM-L12-v2")2, предобученная нейросеть для восстановления пунктуации для последующей сегментации предложений3, предобученная нейросеть для определения названий вакансий по навыкам/описаниям4. Сегментация на предложения проводилась с использованием библиотеки Razdel. Производилось дообучение нейронной сети RuBert с использованием обучающей выборки для задачи классификации текста вакансий на требования, условия и обязанности. Информационная база исследования опирается на данные Росстата и совместный цифровой ресурс Минцифры России и Росстата «Единая межведомственная информационно-статистическая система»5. Кроме того, использовались данные выборочного обследования рабочей силы, выполненного Росстатом6. Для альтернативной статистическому анализу оценки состояния рынка труда были использованы данные с платформы онлайн-рекрутинга HeadHunter7 (далее — «HH»). Для сбора текстов вакансий и резюме был использован функционал ресурса HeadHunter API, позволяющий напрямую получать информацию о соискателях и вакансиях компаний8. Всего было собрано порядка 7,5 тыс. описаний вакансий и 21,6 описаний резюме на период июня- июля 2024 г. В запрос для сбора резюме были включены условия, ограничивающие статус поиска соискателя, а именно отбирались те резюме, где было указано: «Активно ищет работу» или «Рассматривает предложения». Также были выведены только те резюме, которые актуализировались за последний месяц. Собранные вакансии и резюме были обработаны инструментами NLP: удалены спецсимволы, отформатированы наименования и ключевые слова на основе нейросетевой модели и т. д. Далее на основе результатов семантического анализа были проведены классификация заголовков и содержания вакансий и формирование названий кластеров — профессий/групп профессий, компетенций, что дало возможность формализовать и классифицировать данные. Отнесение вакансий и резюме соискателей к нефтегазодобывающему сектору проводилось по нескольким критериям. Для вакансий — это отрасль компании, которая определятся работодателем при размещении вакансии, а также заголовок вакансии. Для резюме — это опыт работы соискателя и наименование позиции, на которую он претендует. Ограничение исследования В исследовании используются данные о вакансиях и резюме соискателей рабочих мест с кадровых порталов, позволяющие качественно оценить состояние спроса и предложения регионального рынка труда. Поскольку данные о вакансиях и резюме представлены определенным временным срезом (на июнь-июль 2024 г.), они отражают актуальное состояние рынка труда региона лишь на момент проведения исследования. В то же время они позволяют раскрыть качественную сторону спроса и предложения (компетенции и требования к работникам с одной стороны и предложения соискателей с другой стороны). Отметим, что информация о вакансиях и резюме даже с тщательной обработкой и структуризацией не лишена недостатков. По опыту исследований А. Д. Волгина и В. Е. Гемпельсона, «структура вакансий, как правило, смещена в пользу более квалифицированных работников, что может искажать общую картину спроса на труд» [32]. Этот недостаток необходимо принять во внимание. Однако в данном исследовании акцент делается не только на особенности спроса и предложения, но и на компетенции работников, имеющих соответствующее профессиональное образование, то есть на те самые квалифицированные кадры. Несмотря на все имеющиеся ограничения, данные о содержании вакансий дают ценную информацию, которая не может быть восполнена из других источников. 1Проект Natasha — набор Python-библиотек для обработки текстов на естественном русском языке [Электронный ресурс]. URL: https://natasha.github.io/ (дата обращения: 15.08.2024). 2 Reimers, Nils, и Iryna Gurevych Iryna. «Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks». arXiv, 27 Aug 2019. https://doi.org/10.48550/arXiv.1908.1008. 3 SbertPuncCase [Электронный ресурс]. URL: https://huggingface.co/kontur-ai/sbert_punc_case_ru (дата обращения: 15.08.2024). 4 basil-77/rut5-base-absum-hh [Электронный ресурс]. URL: https://huggingface.co/basil-77/rut5-base-absum-hh (дата обращения: 15.08.2024). 5 Единая межведомственная информационно-статистическая система [Электронный ресурс]. URL: http://www.fedstat.ru (дата обращения: 27.02.2025). 6 Итоги выборочного обследования рабочей силы [Электронный ресурс]. URL: https://rosstat.gov.ru/compendium/document/13265 (дата обращения: 27.02.2025). 7Платформа онлайн-рекрутинга HeadHunter [Электронный ресурс]. URL: https://hh.ru/ (дата обращения: 15.08.2024). 8 HeadHunter API [Электронный ресурс]. URL: https://dev.hh.ru/ (дата обращения: 15.08.2024). © Прокопьев А. В., Пучкова Н. В., Тимофеева Н. В., Симакова А. В., Аверьянов А. О., 2025 62
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz