«Начальный» специалист по проверке документов: аудит должностных инструкций с помощью Textstat
В этой статье показано, как использовать бесплатные инструменты с открытым исходным кодом, такие как Python и его библиотека Textstat, для создания скрипта, автоматизирующего процесс выявления «контрольной лексики» в описаниях вакансий перед их публикацией.

# Введение
Вам когда-нибудь попадались описания вакансий «начального уровня», в которых требования к кандидатам включали такие непонятные аспекты, как «использование межфункциональных подходов для оптимизации синергетических результатов», или даже хуже? Когда кадровые документы переполнены сложным жаргоном или деловыми терминами, они не только сбивают с толку читателей, но и отпугивают талантливых и способных соискателей. Поскольку первым шагом к инклюзивности является доступность, почему бы не обеспечить доступность ваших описаний вакансий с помощью аудита?
В этой статье показано, как использовать бесплатные инструменты с открытым исходным кодом, такие как Python и его библиотека обработки естественного языка Textstat , для создания скрипта, который автоматизирует процесс выявления «языка, ограничивающего доступ» к информации в описаниях вакансий перед их публикацией.
# Ключевой ингредиент: Индекс тумана Ганнинга
Индекс Ганнинга-Фога — доступный в Textstat по адресу textstat.gunning_fog — это отличный способ проверки текста, особенно объявлений о вакансиях для начинающих специалистов. По сути, этот индекс можно использовать для оценки количества лет формального образования, необходимых человеку для понимания текста с первого прочтения.
Его расчет основан на наблюдении двух основных факторов: средней длины предложения и процента сложных терминов — как правило, слов, состоящих из трех и более слогов. Следует отметить, что в деловом жаргоне часто используются многосложные модные слова, такие как «операционализация», «методологии» и так далее. Поэтому индекс Ганнинга-Фога очень близок к нашей цели — проверке описаний вакансий на предмет их не чрезмерной сложности для целевой аудитории. Другими словами, он помогает обеспечить ясность и доступность языка. Более низкое значение этого индекса означает большую ясность и доступность.
# Проверка примера с помощью Textstat
Первым важным шагом является установка библиотеки Textstat для Python, если вы еще этого не сделали:
pip install textstat
Основная логика нашего скрипта будет сосредоточена в многократно используемой функции, предназначенной для проверки входного текста — например, описания вакансии начального уровня:
import textstat def audit_job_description(job_text): # Расчет индекса Ганнинга fog_score = textstat.gunning_fog(job_text) # Определение оценки инклюзивности на основе оценки if fog_score < 10: verdict = "Доступно и инклюзивно. Идеально для начинающих." elif 10
Источник: www.kdnuggets.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.