25 января, 6:06

Я тявкать умею, умею рычать, умею Asym от R0 отличать

Когда-то, почти 2500 лет тому назад, известный атлет, многократный победитель олимпийских и пифийских игр Милон Кратонский достиг таких выдающихся результатов с помощью очень простого упражнения. Он взвалил себе на плечи новорожденного бычка и прошелся таким образом несколько сотен метров. И это упражнение он повторял каждый день, при этом бычок рос и становился все тяжелее и тяжелее, но Милон не прерывал своих тренировок. В результате через некоторое время он носил на плечах уже взрослого быка. Что-то похожее по воле необходимости пришлось делать нашему современнику с ником Stephan когда он завел собаку. Что было дальше и какое отношение к R имеет вся эта история вы узнаете, прочитав представленный ниже перевод статьи самого Stephan’а.

Мая
«Я тявкать умею,
Умею рычать
Умею своих
От чужих отличать»
(детское стихотворение «Сторож»)
Собаку, изображенную слева, зовут Майя. Она лабрадор ретривер, весит 18 килограмм и в настоящее время ее возраст составляет восемь месяцев. Моя девушка и я заносим собаку несколько раз в день на четвертый этаж. Мы узнали, что это необходимо делать в первый год жизни с собаками этой породы. Итак, мы ее носим на руках на четвертый этаж, но насколько килограммов в месяц увеличивается вес Майи? Я подумал — это отличный вопрос, попытка дать ответ на который позволит мне улучшить мои навыки в нелинейном регрессном анализе.

Мы регулярно взвешивали нашу Майю на весах Withings WiFi Body Scale. Собранные данные :

mydog <- read.csv("http://holtmeier.de/public/maya.csv")
mydog$DATE <- as.Date(mydog$DATE, "%Y/%m/%d")
mydog$AGE <- as.numeric(mydog$DATE - as.Date("2011-05-04"))


В третьей строке я вычислил количество дней, прошедших после рождения Майи потому, что мой метод не работает с датами. По крайней мере, я не знаю, как задействовать использование дат. На самом деле, я мало что знаю о моделях роста собак. Поэтому я подхожу к вопросу довольно наивно. Я сделал два допущения:

1. Рост нелинеен. Эта показательная кривая с замедляющимся ростом, как это показано в этом примере.
2. Вес асимптотически приближается к некоторому максимальному значению, предопределенному генетически.

Я нашел функцию SSasymp и статистически пакет для R под названием «stats». Описание гласит:
«Это самозапускающаяся модель для расчета асимптотической функции регрессии и ее крутизны. Она имеет инициирующий атрибут, который вычисляет начальные значения параметров Asym, R0 и lrc для определенного набора данных.»
Это как раз то, что мне было нужно.

require(stats)
fm <- nls(WEIGHT ~ SSasymp(AGE, Asym, R0, lrc), data = mydog)
summary(fm)


В результате использования кода мы получаем следующие данные:

Мая

22.92878 — это числовой параметр представляющий горизонтальную асимптоту (в качестве возраста подставляется «очень большое» число). Таким образом, это оценка максимального веса нашей собаки (линия 6, зеленая прямая).

В завершение я захотел визуализировать свои данные, включая кривую регрессии. Я использовал ggplot2, как обычно. В добавление к смоделированной кривой (линия 5, красная кривая) я нарисовал сплайн (линия 4, синяя кривая). Сплайн-функции не предполагает наличие функциональной связи между временем ростом (см. подробнее Kahm, M. et al. al., 2010).

Мая

require(ggplot2)
ggplot(data=mydog, aes(x=AGE, y=WEIGHT)) +
geom_point() +
geom_smooth(color="Blue", se=F) +
geom_smooth(method="nls", formula=y~SSasymp(x, Asym, R0, lrc), color="red", se=F, fullrange=T) +
geom_hline(color="green", yintercept=22.92878) +
scale_x_continuous(limits=c(50,400)) +
xlab("Age (in days)") + ylab("Weight (in kg)")


Как я уже говорил, я еще учусь. Существуют ли лучшие способы прогнозирования веса моей собаки? Или другие модели (например, функция Гомперца)? Я предвкушаю новые улучшенные результаты!

How big is my dog going to get? A regression analysis with R | Любящий собак Алексей Золотарев http://vizualdata.ru/pictures/twitter.png

19 января, 21:10

Не самая лучшая неделя, но самая учтённая

Обнаружил у своего давнейшего интернет-приятеля интересный статус.
За прошедшую неделю было учтено почти 168 часов времени (т. е. почти всё). Из них 38 часов на сон, 16 часов на учёбу, 39 часов на страдание фигнёй, 10 часов на переезды на работу и домой. RescueTime говорит что продуктивность моя составила 51% (за ~94 часа на компе и мобе). Из них на контактик было убито 12 часов, 9 часов на асечку.

Вот такая статистика. Чтож не самая лучшая неделя, но самая учтённая :) Учитывал с помощью RescueTime, ManicTime и Yast. Лёхе Мельникову на заметку ;)
Mr.Hant http://vizualdata.ru/pictures/twitter.png

14 января, 14:21

Итоги 2011 года от Last.fm

Команда Last.fm сообщила о подведении итогов 2011 года и представила Last.fm Best of 2011 — уникальный чарт, построенный на музыке которую ты слушал(а) в течение последнего года.
Чарт включает разную музыку, в том числе музыку самых популярных исполнителей 2011 года и новых групп, которые ты открыл(а) для себя, а также статистику и сведения о самых значимых событиях года.

Чарт этого года составлен на основе результатов скробблинга альбомов, выпущенных с 1 января по 31 декабря 2011 г. Чарт лучших исполнителей составлен по количеству воспроизведений определенного исполнителя, в чарте «Новые открытия» представлены только исполнители, которые не были заскробблены тобой до 2011 года.

Мы исключили концертные альбомы, сборники хитов, мини-альбомы и синглы и добавили фильтры, позволяющие составлять чарты по географическому положению или по некоторым тегам. Last.fm о Best of 2011
Самыми популярными исполнителями 2011 года Last.fm стали: Adele, Lady Gaga, Foster The People, Britney Spears, Natalia Kills, J. Cole, The Strokes, Foo Fighters, Radiohead и Avril Lavigne.

Чарты есть и для России. Наш список хотя и отличается от мирового, но все же пестрит иностранцами:
1. Radiohead — 19 112 слушателей
2. Adele — 18 510 слушателей
3. Limp Bizkit — 13 972 слушателя
4. Lady Gaga — 13 884 слушателя
5. Ляпис Трубецкой — 11 560 слушателей
6. Red Hot Chili Peppers — 11 376 слушателей
7. C oldplay — 11 330 слушателей
8. Britney Spears — 11 249 слушателей
9. Nero — 10 822 слушателя
10. The Strokes — 10 541 слушатель

Итоги 2011 года от Last.fm

Кроме чартов парни из Last.fm в этом году также порадовали своих пользователей интересной инфографикой с цифрами общего количества засробленных композиций в 2011 году, суммарном времени прослушивания пользователями творчества своих любимых исполнителей и 12 музыкальными событиями года. The Whitestripes, PJ Harvey, Bob Dylan и ушедший от нас 05 октября 2011 года Стивен Пол Джобс. Обо всех этих событиях команда Last.fm рассказывает, сочетая цифры, линейные графики и расшифровки по ключевым моментам изменения числа прослушиваний.

Итоги 2011 года от Last.fm

Для желающих поиграться с цифрами в статистических пакетах разработчики предоставляют данные, на основе которых были составлены чарты Best Of 2011. Базовые данные доступны в формате TSV (Tab Separated Value) и формате XML. В каждом из файлов содержится по 1000 лучших исполнителей и 1000 исполнителей «открытий» 2011 года с указанием таких параметров, как «artist plays» и «artist reach».

Итоги 2011 года от Last.fm

Best of 2011 | Пользователь Last.fm с шестилетним стажем Алексей Мельников http://vizualdata.ru/pictures/twitter.png

12 января, 22:37

Fitbit aria: весы с wi-fi и не только

Пару дней назад Fitbit Inc. разослали всем подписчикам своего сервиса с информацией о новом устройстве для самонаблюдения за своим весом — Fitbit aria wi-fi smart scale. По заверениям разработчиков устройство позволит вести тщательный надзор за такими важными показателями, как масса тела, процент жира. Fitbit aria сначала передает собранную информацию по wi-fi на компьютер, а затем в ваш профиль на Fitbit.com. Как и полагается, строятся графики, высчитывается индекс массы тела (ИМТ, англ. body mass index (BMI), раздаются мотивирующие значки (бейджики) и автоматически вычисляются рейтинги вашей массы и массы ваших друзей в Fitbit.

Fitbit aria wi-fi smart scale
Индекс массы тела — ИМТ (англ. body mass index -BMI) — величина, позволяющая оценить степень соответствия массы человека и его роста и, тем самым, косвенно оценить, является ли масса недостаточной, нормальной или избыточной (ожирение). Важен при определении показаний для необходимости лечения, в том числе применения препаратов для лечения ожирения.

Показатель индекса массы тела разработан бельгийским социологом и статистиком Адольфом Кетеле (Adolphe Quetelet) в 1869 году. В соответствии с рекомендациями ВОЗ разработана следующая интерпретация показателей ИМТ: 16 и менее — выраженный дефицит массы; 16—18 — недостаточная (дефицит) масса тела; 18—25 — норма; 25—30 — избыточная масса тела (предожирение); 30—35 — ожирение первой степени; 35—40 — ожирение второй степени; 40 и более — ожирение третьей степени (морбидное). Wikipedia
Fitbit aria wi-fi smart scale

Из интересного — Fitbit Inc. обещают наличие на стеклянной поверхности своих весов наличие электродов, периодически посылающие небольшие, безопасные электрические разряды для измерения сопротивления тела. Так ребята надеются вычислить количество жира, мышечной массы вашего тела и членов вашей семьи — устройство распознает до восьми человек и хранит информацию о каждом.

Fitbit aria wi-fi smart scale

И в завершение о самом интересном. Цена. Стоимость Fitbit aria составляет... $129.95!!! И бесплатная доставка. Вам интересно такое предложение?

Оф.страница Fitbit aria | Разочаровавшийся в Fitbit Inc. Алексей Мельников http://vizualdata.ru/pictures/twitter.png

7 января, 17:59

Когда встречаются Fitbit Ultra, Adidas miCoach и Яндекс.Карты

Зимним теплым утром с двухдневным опозданием выпал новогодний снег. Немного устелил мягким ковром асфальт, землю и бетонные дорожки для пешеходов. Это удовольствие мы имели возможность наблюдать с собакой во время утренней прогулки. Зверь резвился, то и дело тыча носом в снег, фыркая, радостно перебегаю к следующему участку, где взятие пробы и фырк повторялись снова. Радостное настроение собаки передалось и мне. Между тем, на поясе как всегда висел Fitbit Ultra (смотрите обзор VizualData.ru), а на iPhone был установлен Adidas miCoach. Как не начать пробежку с хорошим настроением и двумя системами наблюдения (трекинга, самоконтроля — tracking/self-tracking)?

Когда встречаются Fitbit Ultra, Adidas miCoach и Яндекс.карты

Вместе с желанием устроить маленькую пробежку, в голове оформилась мысль сравнить показатели Fitbit и программы iPhone. Мистический механизм работы Fitbit Ultra, GPS-трекинг от iPhone, анализ и визуализация данных от Adidas. Хороший набор для эксперимента? И мы с псом приступили к пробежке рысцой на полтора километра.

Когда встречаются Fitbit Ultra, Adidas miCoach и Яндекс.карты

Десять минут бега, стоп Adidas miCoach, стоп Fitbit Ultra. Домой, отправлять данные на веб-сервисы и синхронизировать программы. Adidas, десятиминутная тренировка преимущественно в синей и зеленой зонах нагрузок (начальная и слабая нагрузки по версии Adidas miCoach), полтора километра, 127 калорий. Но, Fitbit Ultra! Поразительно! Fitbit говорит о 2.5 километрах за 12 минут и средней скорости бега 16 км/ч. Проверяю километраж по Яндекс.Картам. Все верно, в районе 1.5 км. Откуда у Fitbit так разительно отличающиеся цифры? Почему среди прочего он засчитал в сожженные калории 214 единиц в отличие от 127 единиц по версии Adidas miCoach?

Когда встречаются Fitbit Ultra, Adidas miCoach и Яндекс.карты

Возможно Fitbit, зная мой рост и вес, использует некую формулу подсчета километража. И возможно эта формула дала сбоя при моей интенсивной, но семенящей пробежке (с собакой хотел, но не мог разогнаться). А может быть я слишком поздно включил Fitbit? Нет, в 10:13, а miCoach в 10:14. Все равно за две минуты я не мог преодолеть лишний километр. Может я неправильно читаю графики и диаграммы? В любом случае, собранные данные не могут ни о чем свидетельствовать точно. Эти расхождения в цифрах лишь бросают легкую тень подозрения на Fitbit Ultra и стимулируют к новым пробежкам с замерами.

Сайт Fitbit Ultra | Любитель и энтузиаст в области self-tracking Алексей Мельников http://vizualdata.ru/pictures/twitter.png
Заметки     ←  следующие     Ctrl     предыдущие  →