Data mining
Mar. 22nd, 2018 04:25 pmПослушал доклад команды, анализировавшей корпоративную электронную почту. Игрались они с двумя наборами. Первый, в 6 миллионов отправлений, они получили после слияния двух крупных компаний - почта описывала 7 месяцев до и 6 месяцев после слияния. Второй был куплен после банкротства стартапа, и описывал всю его жизнь, т.е. несколько лет.
Из забавного:
- Руководство на верхнем уровне понятия не имеет, что происходит внизу. Информация слабо проникает между уровнями иерархии. Интерес к майнингу коммуникаций, в частности, может помочь руководству узнать настроения внизу трофической цепи.
- Модель, предсказывающая будущее увольнение сотрудника по языку его почты, тренированная на первом наборе, обладает предсказательной силой на втором наборе.
Сразу возникло две идеи:
- программа, предсказывающая руководству вероятность увольнения сотрудника, для принятия решения об увольнениях при сокращении;
- программа, автоматически редактирующая язык электронной почты сотрудников - для уменьшения вероятности его увольнения.
Маркетинг проводить одновременно.
Из забавного:
- Руководство на верхнем уровне понятия не имеет, что происходит внизу. Информация слабо проникает между уровнями иерархии. Интерес к майнингу коммуникаций, в частности, может помочь руководству узнать настроения внизу трофической цепи.
- Модель, предсказывающая будущее увольнение сотрудника по языку его почты, тренированная на первом наборе, обладает предсказательной силой на втором наборе.
Сразу возникло две идеи:
- программа, предсказывающая руководству вероятность увольнения сотрудника, для принятия решения об увольнениях при сокращении;
- программа, автоматически редактирующая язык электронной почты сотрудников - для уменьшения вероятности его увольнения.
Маркетинг проводить одновременно.