Из статьи на Хабре
"Анализ данных мира Facebook"
имеются такие данные:
![98cddfb8d738c3217b78a5f43fff5f0f.png](https://hsto.org/getpro/habr/post_images/98c/ddf/b8d/98cddfb8d738c3217b78a5f43fff5f0f.png)
То есть чем выше возраст, тем шире разброс возрастов друзей.
Дополнено
Получается, что каждому возрасту соответствует определённая гистограмма распределения возрастов.
Взяв любую из гистограмм, можно увидеть что амплитуды нормализованы относительно амплитуды с пиковой амплитудой.
То есть каждому возрасту соответствует своя картина (кривая из пиков амплитуд). Тогда, рассчитав гистограмму для искомого пользователя, при помощи аппроксимации высчитываем, сравнивая с имеющимися гистограммами.
Другие входные данные для анализа
Помимо полученных гистограмм возрастов дополнительными параметрами могут служить:
- облако категорий интересов пользователя: книги, фильмы, дискотека
- облако категорий групп пользователя: общество панков, частный бизнес, служу отчизне и т.д.
- облако категорий посещаемых мероприятий пользователя: музеи, стадионы, учебные заведения, развлекательные учреждения