Брудні дані дешеві як бруд: упередженість в історичних даних

Брудні дані дешеві як бруд: упередженість в історичних даних

Найбільші проблеми, з якими стикаються багато HR-фахівців, - це пошук талантів з навичками, необхідними їхньому бізнесу, та утримання співробітників з критично важливими навичками. Звіт Society for Human Resource Management (SHRM) за 2023 рік показав, що 80% опитаних HR фахівців зіткнулися з нестачею робочої сили, а утримання талантів посідає третє місце за пріоритетністю для HR.

Деякі провайдери (наприклад, Eightfold, Gloat) пропонують використовувати штучний інтелект, щоб допомогти компаніям, які зазнають труднощів, визначити найкращі таланти серед своєї поточної робочої сили або пасивних кандидатів на ринку. Заявляючи про розкриття можливостей даних про таланти та створення ринку талантів, ці постачальники малюють гарну картину використання історичних даних про таланти.
Ці постачальники використовують історичні HR дані, щоб визначити типи кандидатів, які досягли успіху в минулому, або співробітників, які отримали внутрішнє підвищення, щоб запропонувати інших, схожих на них.

Звучить як магія, але є щось, про що ці компанії можуть вам не говорити. В історичних даних часто прихована упередженість, і використання цих даних для навчання систем штучного інтелекту ще більше погіршує погану ситуацію. Це той випадок, коли за ціною бруду можна отримати брудні дані.

Розуміння упередженості в історичних даних

Деякі упередження можуть початися ще до того, як кандидати подадуть заявки на посади. Чоловіки на 20% частіше отримують оголошення про роботу в Інтернеті, ніж жінки, оскільки реклама для жінок коштує дорожче, тому рекламні алгоритми, розроблені для максимізації переглядів, віддадуть перевагу показу оголошень чоловікам. Деякі кандидати можуть навіть не бачити оголошених вакансій, і ситуація для кандидатів не стає легшою, коли їм вдається подати заявку на вакансії.

Згідно з масштабним метааналізом реальних історичних даних про управління персоналом у Сполучених Штатах за 25-річний період з 55 842 претендентами на 26 326 посад, білі кандидати отримали на 36% більше зворотних дзвінків, ніж афроамериканці, і на 24% більше зворотних дзвінків, ніж латиноамериканці. Що ще гірше, з часом ситуація не покращилася, і кандидати від меншин сьогодні відчувають таку ж упередженість, як і в 90-х роках.

"Упередженість часто прихована в історичних даних, і використання цих даних для навчання систем штучного інтелекту ще більше погіршить погану ситуацію."

Аналіз упередженості у шести західних країнах Північної Америки та Європи у 2023 році за участю 174 079 претендентів показав, що упередженість в історичних даних HR є світовою проблемою. Дослідження виявило високий рівень упередженості щодо всіх меншин, зі зростанням дискримінації щодо мусульманських та північноафриканських заявників після 2000 року.

Якщо всі ці брудні дані залишають у вас кислий присмак, ви не самотні. Опитування, проведене The Guardian у Великій Британії, показало, що люди з меншин майже вдвічі частіше стикалися з тим, що їх не помічали на посаді чи просуванні по службі, що вважалося несправедливим протягом останніх 12 місяців.

Незалежно від того, як ви на це подивитеся, історичні дані та дані, витягнуті з інтернету, будуть пронизані несвідомими упередженнями, і будь-яка система штучного інтелекту, навчена на цих даних, засвоїть ті самі упередження. Для компаній, зацікавлених у використанні можливостей штучного інтелекту, щоб допомогти знайти найкращі таланти, уникаючи при цьому поширення упередженості та несправедливої дискримінації кандидатів з меншин, дуже важливо використовувати датаорієнтований підхід.

Боротьба з упередженістю даних за допомогою правильного підходу

Датаорієнтований підхід до штучного інтелекту наголошує на важливості відбору високоякісних джерел даних, які були ретельно перевірені на предмет упередженості. Ключова відмінність між датаорієнтованим підходом і використанням зручних вибірок історичних даних полягає в тому, що дані ретельно збираються з явною метою навчання системи штучного інтелекту та перевіряються, щоб переконатися, що вони мінімально упереджені.

Датаорієнтований підхід до штучного інтелекту був вперше запропонований Ендрю Нг (Andrew Ng), засновником дослідницької лабораторії Google Brain, і ця ідея отримує масову підтримку спільноти штучного інтелекту в цілому.

У SHL ми застосували датаорієнтований підхід до штучного інтелекту, з надійним аудитом упередженості, вбудованим у наш процес збору даних. Цей підхід спрямований на підвищення точності та об'єктивності даних, які ми використовуємо для навчання систем штучного інтелекту, і відповідає суворим стандартам якості, встановленим професійними галузевими органами стандартизації, такими як Британське психологічне товариство та Комісія з рівних можливостей у працевлаштуванні.

"Ключова відмінність між датацентричним підходом і використанням зручних вибірок історичних даних полягає в тому, що дані ретельно збираються з явною метою навчання системи штучного інтелекту та перевіряються, щоб переконатися, що вони мінімально упереджені."

Якщо вам цікаво дізнатися більше про те, як використовувати можливості штучного інтелекту, не потрапляючи в пастки історичної упередженості, SHL створила рекомендацію з найкращої практики використання штучного інтелекту в оцінці талантів і вебінар про етичне та ефективне використання штучного інтелекту.

Щоб дізнатися більше про наші оцінювання, відвідайте нашу сторінку оцінювання.

Автор: Кем Бізлі (Cam Beazley)

Інноваційний та орієнтований на результат фахівець, який має великий технічний досвід у проєктування, розробці, перевірці та впровадженні систем оцінки, які максимізують бізнес-результати. Забезпечуючи широке розуміння строгих психометричних принципів і технологій нового покоління, наукові концепції вміло вплітаються з перевіреними технологіями в дієві та валідні рішення для клієнтів.

Оригінал статті доступний на сайті shl.com

Слiдкуйте за новинами та подiями HR-спiлноти!