1. "Память народа" содержит огромное количество рукописного текста, просто громадное.
2. Любые сканы содержат строки. С технической стороны нет никакой разницы между текстом, содержащем поименные списки (или строки), и текстом, содержащем летопись народов. И там и там набор символов.
3. Документы Второй мировой войны, загруженные в эти проекты, пусть и современные, но, повторюсь, содержат рукописный текст, в том числе и на немецком языке. Смею предположить, что книги 17 века будут отличаться лишь набором символов, а по читабельности будут многократно превосходить любой современный рукописный текст.
4. Как я понимаю, полнотекстовой поиск в современных СУБД построен вокруг тэгирования.