Из статьи на Хабре
"Анализ данных мира Facebook"
имеются такие данные:
То есть чем выше возраст, тем шире разброс возрастов друзей.
Дополнено
Получается, что каждому возрасту соответствует определённая гистограмма распределения возрастов.
Взяв любую из гистограмм, можно увидеть что амплитуды нормализованы относительно амплитуды с пиковой амплитудой.
То есть каждому возрасту соответствует своя картина (кривая из пиков амплитуд). Тогда, рассчитав гистограмму для искомого пользователя, при помощи аппроксимации высчитываем, сравнивая с имеющимися гистограммами.
Другие входные данные для анализа
Помимо полученных гистограмм возрастов дополнительными параметрами могут служить:
- облако категорий интересов пользователя: книги, фильмы, дискотека
- облако категорий групп пользователя: общество панков, частный бизнес, служу отчизне и т.д.
- облако категорий посещаемых мероприятий пользователя: музеи, стадионы, учебные заведения, развлекательные учреждения