profpr: (Default)
2018-03-22 04:25 pm

Data mining

Послушал доклад команды, анализировавшей корпоративную электронную почту. Игрались они с двумя наборами. Первый, в 6 миллионов отправлений, они получили после слияния двух крупных компаний - почта описывала 7 месяцев до и 6 месяцев после слияния. Второй был куплен после банкротства стартапа, и описывал всю его жизнь, т.е. несколько лет.

Из забавного:
- Руководство на верхнем уровне понятия не имеет, что происходит внизу. Информация слабо проникает между уровнями иерархии. Интерес к майнингу коммуникаций, в частности, может помочь руководству узнать настроения внизу трофической цепи.
- Модель, предсказывающая будущее увольнение сотрудника по языку его почты, тренированная на первом наборе, обладает предсказательной силой на втором наборе.

Сразу возникло две идеи:
- программа, предсказывающая руководству вероятность увольнения сотрудника, для принятия решения об увольнениях при сокращении;
- программа, автоматически редактирующая язык электронной почты сотрудников - для уменьшения вероятности его увольнения.
Маркетинг проводить одновременно.