{
"db" : "coll",
"collections" : 11,
"views" : 0,
"objects" : 2564657,
"avgObjSize" : 1183.5082352142997,
"dataSize" : 3035292680,
"storageSize" : 1206362112,
"numExtents" : 0,
"indexes" : 48,
"indexSize" : 172339200,
"fsUsedSize" : 9729626112,
"fsTotalSize" : 40263905280,
"ok" : 1
}
{
"db" : "coll",
"collections" : 11,
"views" : 0,
"objects" : 2013462,
"avgObjSize" : 1320.375909254806,
"dataSize" : 2658526719,
"storageSize" : 1044905984,
"numExtents" : 0,
"indexes" : 53,
"indexSize" : 789168128,
"fsUsedSize" : 10345451520,
"fsTotalSize" : 40263905280,
"ok" : 1
}
I CONTROL [main] Automatically disabling TLS 1.0, to force-enable TLS 1.0 specify --sslDisabledProtocols 'none'
MongoDB shell version v4.0.0
connecting to: mongodb://127.0.0.1:27017/photos
MongoDB server version: 4.0.0
Server has startup warnings:
2018-07-25T09:03:34.582+0300 I STORAGE [initandlisten]
2018-07-25T09:03:34.582+0300 I STORAGE [initandlisten] ** WARNING: Using the XFS filesystem is strongly recommended with the WiredTiger storage engine
2018-07-25T09:03:34.582+0300 I STORAGE [initandlisten] ** See http://dochub.mongodb.org/core/prodnotes-filesystem
2018-07-25T09:03:35.799+0300 I CONTROL [initandlisten]
2018-07-25T09:03:35.799+0300 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for the database.
2018-07-25T09:03:35.799+0300 I CONTROL [initandlisten] ** Read and write access to data and configuration is unrestricted.
2018-07-25T09:03:35.799+0300 I CONTROL [initandlisten]
-- Logs begin at Tue 2018-07-24 12:52:05 MSK, end at Wed 2018-07-25 01:05:42 MSK. --
Jul 24 12:52:08 Name systemd[1]: Started MongoDB Database Server.
Jul 24 12:52:09 Name mongod[816]: 2018-07-24T12:52:09.641+0300 I CONTROL [main] Automatically disabling TLS 1.0, to force-enable TLS 1.0
Т.е. фотографии все разные, модель да одна и та же, но ее фото разные, а вот теги одинаковые и по этим тегам формируется сам title. Если перейти на саму страницу фотографии, в низу под фото будет висеть еще 10 фоток с ее фейсом, только в разных позах. На них тоже получается одинаковые title и description, которые я и хочу изменить.
Я не понимаю к чему мне прицепиться чтобы сделать это более быстро и относительно качественно.
В админке придумал инструмент с правкой тегов, т.е. если добавить какое то слово то это уже будет не дубликат в моем понимании. Так же сделал возможность добавления заголовка страницы, где и я и пользователи могут вкратце написать что там на картинке (в 3-7 словах) и это идет в title.
Но все это пустое если брать объем дубликатов в размере более 100к записей, тут надо целую роту китайцев нанимать чтобы сидели и правили все. Поэтому хочу программно уйти от дублей и чтобы страницы вошли в индекс, потому что они разные, а вот теги у них одинаковые.