profpr: (Default)
profpr ([personal profile] profpr) wrote2019-05-15 07:56 am

О чем я пишу

Sel-kie написала приложение для текстового анализа блога в ЖЖ. Приложение выдает самые часто встречающиеся слова последних 25 записей. У меня получилось вот что.

Разнообразие текста: 8.3%
Средняя длина поста: 110 слов
Часто встречающиеся слова:
ВОЙНА
ПРЕЗИДЕНТ
ШТАТ
ЕВРОПА
СССР
КЛИНТОН
ЕЛЬЦИН
ТРАМП
ПЕНСИОННЫЙ
РОССИЯ

Шокировало. Я-то думал, что в открытом доступе пишу про науку и немножко про свою жизнь, а получилось - про российскую политику?! И откуда тут Ельцин? Неужели я настолько забросил журнал, что 25 верхних записей покрывают времена Ельцина?

Полез смотреть. Оказалось, в прошлом году я написал про только что открытый архив чaстных разговоров Ельцина и Клинтона. И еще - что Путин рассказал, как усилия России по внедрению суверенной экономики по борьбе с выбросами парниковых газов затормозили потепление климата как минимум на год.

Ну, отлегло. В целом, результаты демонстрируют ущербность частотного подхода к описанию содержания текстов в целом и word cloud в частности.

Post a comment in response:

This account has disabled anonymous posting.
(will be screened if not on Access List)
(will be screened if not on Access List)
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting