profpr: (Default)
[personal profile] profpr
Статья относится к модному сейчас исследованию big data.
Авторы использовали google trends для того, чтобы найти число запросов, содержащих года с 2007-го по 2013-й и затем посчитали "индекс будущего" (ИБ) для 45 стран. Для каждого года i, ИБ равен числу запросов, содержащих номер следующего года i+1, к числу запросов, содержащих номер предыдущего года i-1. Tаким образом, ИБ измеряет большую заинтересованность населения страны в прошлых или в будущих событиях.

Как оказалось, ИБ сильно коррелирует с GDP per cap. На картинке - ИБ vs. GDP/cap для 2010-го года (r=0.78, p<0.001)

FireShot Pro Screen Capture


via [livejournal.com profile] jnuk

Date: 2013-02-12 09:21 am (UTC)
From: [identity profile] misha-b.livejournal.com
Но ведь отношение частоты разных терминов в поиске не должно сильно зависить от "market share" поисковика? Возможно, какой-то "bias" тут есть, т.к. разные группы используют разные посиковики, но общий эффект это не объясняет, по-моему.

Date: 2013-02-12 10:22 am (UTC)
From: [identity profile] jnuk.livejournal.com
Интуитивно кажется, что действительно отношение частот не должно зависеть от поисковика, но данных подтверждающих это я не нашел пока.
Результаты исследования наводят на мысль о зависимости между частотой пользования Google и распространенностью английского языка среди населения страны.

Date: 2013-02-12 01:05 pm (UTC)
From: [identity profile] misha-b.livejournal.com
Было бы полезно иметь аналоги Google trends для других поисковиков. Вот тогда можно было бы копать :)

Date: 2013-02-12 02:54 pm (UTC)
From: [identity profile] profpr.livejournal.com
http://profpr.livejournal.com/361754.html?thread=2756378#t2756378

March 2024

S M T W T F S
     12
3456789
10111213141516
171819202122 23
24252627282930
31      

Most Popular Tags

Expand Cut Tags

No cut tags