Где можно найти реальные тестовые данные на 10М+ записей?

День добрый.
Не подскажете где можно найти freeware реальные (связанные, например, с экономикой, географией, биологией, астрономией и т.п.) связанные данные :
1) Желательно сильно больше 1 миллиона записей (10М+)
2) Лучше бы в формате с разделителями (но можно и в других, если описание формата найти не трудно)
3) Несколько однотипных показателей (разных валют, разных акций ...).

Как примеры:
- Рост/смертность населения в нескольких близлежащих странах/областях/городах за промежуток времени.
- Курсы (если есть у них снимались значения в течении одного дня) валют/акций (желательно в одной области) за промежуток времени
- Значения влажности воздуха, давления, температуры и т.п. в зависимости от географических координат
и т.п.
Главное чтобы объем записей был достаточно большой (желательно ~10M).
Случайно сгенерированные или реально апроксимированные не годятся :-)
Можно сделать такой набор на "искусственных" объектах, например как частоты наличия частей речи (длины предложений, и т.п.) в литературных произведениях за период времени и в разных географических координатах, но таки хочется более натуральные данные.

Спасибо.
  • Вопрос задан
  • 1452 просмотра
Пригласить эксперта
Ответы на вопрос 6
bavaria
@bavaria
Студент, Python, Ruby
  • 1.6M reviews and 500K tips by 366K users for 61K businesses
  • 481K business attributes, e.g., hours, parking availability, ambience.
  • Social network of 366K users for a total of 2.9M social edges.
  • Aggregated check-ins over time for each of the 61K businesses
Yelp dataset
Ответ написан
Комментировать
savostin
@savostin
Еще один программист
Ответ написан
Комментировать
MaxDukov
@MaxDukov
впишусь в проект как SRE/DevOps.
лог прокси потянет? могу обезличить и поделиться. 1 день - порядка 4,5-5 млн строк
Ответ написан
rasswet
@rasswet
биржевые котировки минутки или тики.
Ответ написан
Комментировать
BapoHka
@BapoHka
К примеру, данные по гос.закупкам в штате Оклахома за апрель2015. Данные в любом удобном формате можно вытащить, там же по каталогу вытащить данные либо за другие периоды, либо других организаций чтоб подтянуть более 1млн записей
catalog.data.gov/dataset/revolving-funds-april-201...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы