19 февраля, 12:24

День святого Валентина на Last.fm

К прошедшему Дню святого Валентина команда Last.fm подготовила инфографику по музыкальным пристрастиям пользователям. В этот раз под прицел исследователей попало соотношение ключевых слов «Sexy» и «Romantic» в музыке, которую пользователи Last.fm слушали в разных городах. Калифорнийский Фресно оказался самым падки до «sexy», а мичинагский город Энн-Арбор показал наличие 85% доминирования ключевого слова «romantic». Отметился и российской город — Воронеж с соотношением романтичной музыки к сексуальной, как 24% к 76%.

День святого Валентина на Last.fm

Как и в случае с музыкальными итогами года, разработчики Last.fm рассказали и историю. Временная шкала повествует об общении двух пользователей lowlytootle и jontytron. Девушка из США и парень из Великобритании начали общение в 2008 году, а 8 января 2012 года сыграли свадьбу.

День святого Валентина на Last.fm
Да, инфографика Last.fm опять же выполнена в темных тонах, даже праздник любви не особенно повлиял на цветовые предпочтения дизайнеров. Отмечается повторяемость — опять ни к селу, ни к лесу вставили Девида Хэссельхоффа (американский актер и писатель, сериалы «Рыцарь дорог» и «Спасатели Малибу). И все же, Last.fm думают об инфографике, о единении пользователей, за что им спасибо.

Valentine’s 2012 | Пользователь Last.fm с шестилетним стажем Алексей Мельников http://vizualdata.ru/pictures/twitter.png

13 февраля, 23:27

Кружки кофе и качество сна

5 января 2012 года соорганизатор группы San Diego Quantified Self Эрнесто Рамирез поделился с читателями Quantified Self ссылкой на интересную заметку о частном исследовании. Автор исследования — Майкл Аллен Смит очень любит кофе и ведет блог I Need Coffee. В течение года Майкл учитывал количество и время потребления кофе. Также Смит оценивал по пятибалльной шкале качество своего сна. Имея под рукой Fitbit Ultra и питая слабость к кофе, я также не удержался от проведения подобного эксперимента.
Кофе и сон
Как и Майкла Аллена Смита меня интересует влияние кофе на сон. Я не хочу потреблять много кофе, так как согласно расхожему мнению кофеин влияет на качество сна. Но кофе такое вкусное, что иногда удержаться очень сложно. Нужно ли ограничивать себя и в какой степени? На эти два вопроса я хочу получить ответ.

В ходе эксперимента учитывается количество выпитых кружек кофе до обеда и после обеда. Данные по каждому дню заносятся в GoogleDocs Spreadshit (параметр tCoffee), а затем туда же добавляется информация об эффективности ночного сна (Efficiency), времени на засыпание (Fall — time to fall asleep), количество пробуждений (Awoke — times awakened). Майкл Смит проводит оценку сна по пятибалльной шкале. В моих же отчетах по сну учитываются данные Fitbit Ultra.

Заметка Аллена Смита о влиянии кофе на сон | Проникшийся энтузиазмом Алексей Мельников http://vizualdata.ru/pictures/twitter.png

25 января, 6:06

Я тявкать умею, умею рычать, умею Asym от R0 отличать

Когда-то, почти 2500 лет тому назад, известный атлет, многократный победитель олимпийских и пифийских игр Милон Кратонский достиг таких выдающихся результатов с помощью очень простого упражнения. Он взвалил себе на плечи новорожденного бычка и прошелся таким образом несколько сотен метров. И это упражнение он повторял каждый день, при этом бычок рос и становился все тяжелее и тяжелее, но Милон не прерывал своих тренировок. В результате через некоторое время он носил на плечах уже взрослого быка. Что-то похожее по воле необходимости пришлось делать нашему современнику с ником Stephan когда он завел собаку. Что было дальше и какое отношение к R имеет вся эта история вы узнаете, прочитав представленный ниже перевод статьи самого Stephan’а.

Мая
«Я тявкать умею,
Умею рычать
Умею своих
От чужих отличать»
(детское стихотворение «Сторож»)
Собаку, изображенную слева, зовут Майя. Она лабрадор ретривер, весит 18 килограмм и в настоящее время ее возраст составляет восемь месяцев. Моя девушка и я заносим собаку несколько раз в день на четвертый этаж. Мы узнали, что это необходимо делать в первый год жизни с собаками этой породы. Итак, мы ее носим на руках на четвертый этаж, но насколько килограммов в месяц увеличивается вес Майи? Я подумал — это отличный вопрос, попытка дать ответ на который позволит мне улучшить мои навыки в нелинейном регрессном анализе.

Мы регулярно взвешивали нашу Майю на весах Withings WiFi Body Scale. Собранные данные :

mydog <- read.csv("http://holtmeier.de/public/maya.csv")
mydog$DATE <- as.Date(mydog$DATE, "%Y/%m/%d")
mydog$AGE <- as.numeric(mydog$DATE - as.Date("2011-05-04"))


В третьей строке я вычислил количество дней, прошедших после рождения Майи потому, что мой метод не работает с датами. По крайней мере, я не знаю, как задействовать использование дат. На самом деле, я мало что знаю о моделях роста собак. Поэтому я подхожу к вопросу довольно наивно. Я сделал два допущения:

1. Рост нелинеен. Эта показательная кривая с замедляющимся ростом, как это показано в этом примере.
2. Вес асимптотически приближается к некоторому максимальному значению, предопределенному генетически.

Я нашел функцию SSasymp и статистически пакет для R под названием «stats». Описание гласит:
«Это самозапускающаяся модель для расчета асимптотической функции регрессии и ее крутизны. Она имеет инициирующий атрибут, который вычисляет начальные значения параметров Asym, R0 и lrc для определенного набора данных.»
Это как раз то, что мне было нужно.

require(stats)
fm <- nls(WEIGHT ~ SSasymp(AGE, Asym, R0, lrc), data = mydog)
summary(fm)


В результате использования кода мы получаем следующие данные:

Мая

22.92878 — это числовой параметр представляющий горизонтальную асимптоту (в качестве возраста подставляется «очень большое» число). Таким образом, это оценка максимального веса нашей собаки (линия 6, зеленая прямая).

В завершение я захотел визуализировать свои данные, включая кривую регрессии. Я использовал ggplot2, как обычно. В добавление к смоделированной кривой (линия 5, красная кривая) я нарисовал сплайн (линия 4, синяя кривая). Сплайн-функции не предполагает наличие функциональной связи между временем ростом (см. подробнее Kahm, M. et al. al., 2010).

Мая

require(ggplot2)
ggplot(data=mydog, aes(x=AGE, y=WEIGHT)) +
geom_point() +
geom_smooth(color="Blue", se=F) +
geom_smooth(method="nls", formula=y~SSasymp(x, Asym, R0, lrc), color="red", se=F, fullrange=T) +
geom_hline(color="green", yintercept=22.92878) +
scale_x_continuous(limits=c(50,400)) +
xlab("Age (in days)") + ylab("Weight (in kg)")


Как я уже говорил, я еще учусь. Существуют ли лучшие способы прогнозирования веса моей собаки? Или другие модели (например, функция Гомперца)? Я предвкушаю новые улучшенные результаты!

How big is my dog going to get? A regression analysis with R | Любящий собак Алексей Золотарев http://vizualdata.ru/pictures/twitter.png

19 января, 21:10

Не самая лучшая неделя, но самая учтённая

Обнаружил у своего давнейшего интернет-приятеля интересный статус.
За прошедшую неделю было учтено почти 168 часов времени (т. е. почти всё). Из них 38 часов на сон, 16 часов на учёбу, 39 часов на страдание фигнёй, 10 часов на переезды на работу и домой. RescueTime говорит что продуктивность моя составила 51% (за ~94 часа на компе и мобе). Из них на контактик было убито 12 часов, 9 часов на асечку.

Вот такая статистика. Чтож не самая лучшая неделя, но самая учтённая :) Учитывал с помощью RescueTime, ManicTime и Yast. Лёхе Мельникову на заметку ;)
Mr.Hant http://vizualdata.ru/pictures/twitter.png

14 января, 14:21

Итоги 2011 года от Last.fm

Команда Last.fm сообщила о подведении итогов 2011 года и представила Last.fm Best of 2011 — уникальный чарт, построенный на музыке которую ты слушал(а) в течение последнего года.
Чарт включает разную музыку, в том числе музыку самых популярных исполнителей 2011 года и новых групп, которые ты открыл(а) для себя, а также статистику и сведения о самых значимых событиях года.

Чарт этого года составлен на основе результатов скробблинга альбомов, выпущенных с 1 января по 31 декабря 2011 г. Чарт лучших исполнителей составлен по количеству воспроизведений определенного исполнителя, в чарте «Новые открытия» представлены только исполнители, которые не были заскробблены тобой до 2011 года.

Мы исключили концертные альбомы, сборники хитов, мини-альбомы и синглы и добавили фильтры, позволяющие составлять чарты по географическому положению или по некоторым тегам. Last.fm о Best of 2011
Самыми популярными исполнителями 2011 года Last.fm стали: Adele, Lady Gaga, Foster The People, Britney Spears, Natalia Kills, J. Cole, The Strokes, Foo Fighters, Radiohead и Avril Lavigne.

Чарты есть и для России. Наш список хотя и отличается от мирового, но все же пестрит иностранцами:
1. Radiohead — 19 112 слушателей
2. Adele — 18 510 слушателей
3. Limp Bizkit — 13 972 слушателя
4. Lady Gaga — 13 884 слушателя
5. Ляпис Трубецкой — 11 560 слушателей
6. Red Hot Chili Peppers — 11 376 слушателей
7. C oldplay — 11 330 слушателей
8. Britney Spears — 11 249 слушателей
9. Nero — 10 822 слушателя
10. The Strokes — 10 541 слушатель

Итоги 2011 года от Last.fm

Кроме чартов парни из Last.fm в этом году также порадовали своих пользователей интересной инфографикой с цифрами общего количества засробленных композиций в 2011 году, суммарном времени прослушивания пользователями творчества своих любимых исполнителей и 12 музыкальными событиями года. The Whitestripes, PJ Harvey, Bob Dylan и ушедший от нас 05 октября 2011 года Стивен Пол Джобс. Обо всех этих событиях команда Last.fm рассказывает, сочетая цифры, линейные графики и расшифровки по ключевым моментам изменения числа прослушиваний.

Итоги 2011 года от Last.fm

Для желающих поиграться с цифрами в статистических пакетах разработчики предоставляют данные, на основе которых были составлены чарты Best Of 2011. Базовые данные доступны в формате TSV (Tab Separated Value) и формате XML. В каждом из файлов содержится по 1000 лучших исполнителей и 1000 исполнителей «открытий» 2011 года с указанием таких параметров, как «artist plays» и «artist reach».

Итоги 2011 года от Last.fm

Best of 2011 | Пользователь Last.fm с шестилетним стажем Алексей Мельников http://vizualdata.ru/pictures/twitter.png
Заметки     ←  следующие     Ctrl     предыдущие  →