На ваш выбор:
1. Заполнять самым частым
2. Прогнозировать отсутствующее значение на основе других признаков
3. Сделать "Отсутствует" отдельным значением признака
Вот нужно вам понизить размерность входных данных. Почему CNN? Почему не PCA, t-SNE, автоэнкодеры?
Понижать размерность ради понижения размерности - сомнительная затея, вы ведь наверняка это используете для подготовки данных к решению какой-то задачи. Вот по качеству решения этой задачи и подбирайте параметры сетки
from pymongo import MongoClient, ASCENDING, DESCENDING
con = MongoClient('localhost:27017')
for x in con.db.collection.find( {'field' : 'value'} ).sort([('student_id', ASCENDING)]):
print x