Многоязычный сайт… не блог… как?

Question

Сергей Еремин @Sergei_Erjemin

Улыбайся, будь самураем...

Многоязычный сайт… не блог… как?

Как сделать структуру БД многоязычного сайта? (1) Предполагается много связанных таблиц: тарифы, уровни доступа, названия объектов, классификаторы объектов и пр. (2) И есть общая для всех языков графическая контентная часть (графических картинок-диаграмм), где язык не важен (картинка — есть картинка… какой там язык). (3) И есть немного текстового контента «а ля» блог.

Как делать многоязычным блог более менее понятно. Делаем поле с признак языка, и формирование ленты на нужным языке делаем через этот признак.

Делать многоязычным контентно-графическую часть не нужно.

А как сделать многоязыковыми таблицы связей и признаков? В них заложены признаки состояния объектов, классификаторы, описание классов, уровни доступа, биллинг, состояние аккаунтов и прочее, прочее, прочее?.. Но во всех этих таблицах связей-признаков, есть поля описательного характера (например, название типа аккаунтов, или описание класса объекта). И эти описательные поля тоже надо бы сделать многоязычным. Число языков — произвольное (но конечно).

Первой приходит идея — сделать отдельные поля для каждого языка. Но такая схема не расширяема. Т.е. если появится новый язык, придется создавать новые поля (а языков может появится много). На уровне существующих приложения появление новых полей ничего сильно не изменит. Но зато придется писать новые приложения для каждого языка (впрочем, если поля называть умно, то можно просто на уровне приложения «вычислять» какие поля дергать для какого языка.

Вторая идея — сделать отдельные таблицы с описательными характеристиками для каждой таблицы связей, и связать эту таблицу через многое-к-одному с таблицей языков и собственно связей. Все красиво, но структура БД усложняется и может начать тормозить. Теперь при формировании запросов типа JOIN придется сливать вместе больше таблиц (на две дольше в каждый запрос), общее число запросов увеличится, а это может оказаться чревато.

Третья идея — писать в описательные поля на некотором языке разметки и разбирать эту разметку на уровне приложения. Например, описание типов аккаунта будет "[ru::Золотой][en::Gold][jp::ゴールド]"… Плюсы очевидны, но может начать тормозить приложение. Ведь некоторые описательные поля реально большие (например, описание прав и возможностей доступных обладателям «золотого» аккаунта). К тому же это потребует ВСЕ описательные поля сделать избыточной или плавающей длинны, а это замедляет работу СУБД…

Есть ли еще идеи? Может есть традиционные приемы разрешения многоязычности опробованные на CMS?

Вопрос задан более трёх лет назад
4993 просмотра

3 комментария

Подписаться 4 Оценить 3 комментария

Eddy_Em @Eddy_Em

А чем gettext не нравится?

Написано более трёх лет назад
Сергей Еремин @Sergei_Erjemin Автор вопроса

Не знал… Как-то сложно все это должно быть в случае с таблицам связей…

Написано более трёх лет назад
Eddy_Em @Eddy_Em

Простейший расширяемый способ — это одна БД на каждый язык. Пусть в оригинале у вас хранится фраза «Logout», тогда, скажем, в файле БД для русского языка помещаете запись «Logout» → «Выход».
Для ускорения можно сделать иначе, чем в геттексте: указывать английской фразе некий ключ или хеш, которым и помечать соответствующий перевод в каждом языковом файле.
Помещать все языки в одну БД будет быстрей, но совершенно не расширяемо.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер по тестированию

5 месяцев

Далее
Нетология

Инженер по тестированию

8 месяцев

Далее
Thinknetica

Профессиональная разработка на Ruby on Rails

9 месяцев

Далее

Решения вопроса 1

2 комментария

Сергей Еремин @Sergei_Erjemin Автор вопроса

Хорошее решение. Спасибо. Шаблон еще переделать для нового языка не сложно, но вот вспомнить контекст каждого употребления реально не просто. Ведь есть падежи, спряжения, склонения, герундии… Англоязычное слово может быть одно, а вот русских или венгерских соответствий много.

Кроме того, кажется добавление нового языка будет не человеколюбиво. Вспомнить все контексты употребления слов и сочетаний не просто.

Написано более трёх лет назад
Алексей Сундуков @alekciy

В gettext-е есть возможность задавать числительные через plural forms. Тема с падежами там вроде тоже как была, хотя для русского языка вроде не так все однозначно. Тема с контекстом на самом деле не сильно актуальна и возникает крайне редко. Ведь в gettext храниться кусок текста полностью как есть. Целая фраза или предложение. Я в своей практике не припомню случая, когда переводчику понадобился бы контекст. Поэтому приведенную схему считаю оптимальный и удобной для поддержки в проекте. И ни чего более удобного я пока еще не видел.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

3 комментария

Сергей Еремин @Sergei_Erjemin Автор вопроса

А как? Ведь это таблицы связей?! Допустим у меня есть таблица с URL на картинки… картинкам язык не нужен, они для всех языков одинаковые. И есть таблица с классификатором картинок: Котики. Сиськи, Самодельные взрывные устройства… Не теги, а жестко заданная классификация… при чем для каждого класса есть еще и развернутое описалово. Не то чтобы этим описаловом будут пользоваться, но его надо иметь. Ну чтобы любопытные могли узнать «что есть сиськи и почему рудиментарные мужские молочные железы к таковым не относятся»… Так вот. в вашем случае все связи одно к многим превратятся к много ко многим (ведь к каждой картинке будет несколько связей с записями к разделе классификации (каждая запись на одном языке)… Кроме того. в админке придется все эти связи зафиксировать. Т.е. каждую картинку с котиком атрибутировать как «кот», «cat» и "猫"… учитывая что контент менеджер не знает всех языков… Это избыточно, и не юзабильно со стороны админки.

Я пока склоняюсь к третьему варианту. Там на каждый вариант классификации только один вариант связи.

Написано более трёх лет назад
CAMOKPYT @CAMOKPYT

А что если слово будет состоять из разных языков?

Написано более трёх лет назад
Сергей Еремин @Sergei_Erjemin Автор вопроса

Так это же не слово… это атрибут или описание классификатора… например, если есть атрибут единица измерения, и на всех языках это будет $ (знак доллара) то будет что-то типа [ru:$][en:$][jp:$]… эту же строку обработает фронт энд и из нее добудет нужный символ для конкретного языка… Мало того, можно фронт-энд запрограммить на поведение когда не удалось сделать разбор строки на принадлежность к языку…

Шутка в том, что сами атрибуты довольно жестко заданы. Их не надо часто редактировать, менять и новые создавать. Что-то типа рубрикатора в журнале или классифайд. Классифайд задан жестко, но многоязычен.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 177 просмотров
1

ответ
SQL

Простой
Почему INSERT присваивает только один символ вместо полного значения?
- 2 подписчика
- 29 окт.
- 178 просмотров
2

ответа
SQL

Простой
Правильно ли написан SQL-запрос для вывода клиентов с действующими (непогашенными) кредитами?
- 1 подписчик
- 19 окт.
- 212 просмотров
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 240 просмотров
4

ответа
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт.
- 302 просмотра
1

ответ
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 326 просмотров
1

ответ
SQL

+3 ещё

Средний
IIS/Lansweeper сильно тормозит из-за аномального числа логонов, внутренний DDoS?
- 1 подписчик
- 15 сент.
- 102 просмотра
0

ответов
SQL

+1 ещё

Простой
Как объединить 2 таблицы обращаясь к одному и тому же полю 2 раза?
- 1 подписчик
- 08 сент.
- 209 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 218 просмотров
1

ответ
SQL

+1 ещё

Средний
Как правильно написать запрос в SQL с NOT IN, NOT EXISTS или как-то иначе?
- 1 подписчик
- 28 авг.
- 190 просмотров
0

ответов
Показать ещё Загружается…

Специалист технической поддержки Oracle Database и PostgreSQL

Омега • Москва

от 90 000 до 120 000 ₽

Разработчик баз данных

Greenway Global • Новосибирск

от 150 000 ₽

Backend Engineer

Kotify

от 3 000 до 5 000 €

Не знал… Как-то сложно все это должно быть в случае с таблицам связей…
Простейший расширяемый способ — это одна БД на каждый язык. Пусть в оригинале у вас хранится фраза «Logout», тогда, скажем, в файле БД для русского языка помещаете запись «Logout» → «Выход».
Для ускорения можно сделать иначе, чем в геттексте: указывать английской фразе некий ключ или хеш, которым и помечать соответствующий перевод в каждом языковом файле.
Помещать все языки в одну БД будет быстрей, но совершенно не расширяемо.

Answer 1 · 2013-06-02 14:22:30

Не понимаю, зачем все так усложнять, когда все укладывается в простую схему. Весь контент сайта условно можно разделить на 3 части:
1) редко меняющиеся данные (они обычно зашиты в файла шаблона);
2) часто меняющие данные либо контент генерируемый пользователями/администраторами/модераторами;
3) бинарные данные в духе картинок, прикрепляемых файлов.

Вся статика находится в папке skin/имя_скина/цветовая_схема/язык (например, /skin/modern/red/ru, у меня по умолчанию /skin/default/default/ru), в базе любой текстовой контент требующий перевода имеет столбцы под каждый требуемый целевой язык. Это могут быть столбцы с постфиксом оригинальное_имя_язык (к примеру, topic_content, topic_content_ru) для mysql или же наследование таблиц из postgresql.

Реализация:
1) вся текстовая информация сосредотачивается в файлах шаблона с использованием gettext-а.
2) постфиксные столбцы во всех таблицах.
3) статические картинки связанные со скином распределены по языковым папкам, адреса же до динамически добавляемых картинок хранятся в базе и при запросе согласно п.2 получаем адрес до нужной языковой картинки.

Единственная трудность с которой тут можно столкнуться, это gettext и переводы требующие контекста. Поскольку переводчик на руки получает po файл, то он не знает, на какой странице сайта используется то или иное слово и какой у него контекст. Но это не очень частый случай и просто требует привлечение к работе разработчика.

Answer 2 · 2013-05-31 14:31:01

CAMOKPYT @CAMOKPYT

Вынесите всё связанное в переводом во фронтэнд

Ответ написан более трёх лет назад

1 комментарий

Answer 3 · 2013-05-31 14:27:56

«Первая идея» — вполне себе расширяема, поля добавляются спокойно, выбор грамотного именования позволит все сделать на автомате. Плюс для языков можно сделать отдельную таблицу, что бы не трогать основные (но при этом класть все языки в одну строку).

«Вторая идея» — хороша в плане «сделать таблицы», но можно не усложнять ее «джоинами» (большого усложнения в прямых выборках нет, но тем не менее)… Джоины в основном нужны, когда инфа из джоинящейся таблицы «нужна прямо сейчас». В случае с языками Вам достаточно в течении приложения просто записывать в массив языковые ИД для джоина (вместо джоина языковой таблицы по ним), а потом в конце приложения сделать запрос в таблицу вытаскивая сразу все языковые переменные по ИД из этого массива и подставляя их в шаблон.

Что касается картинок, не будьте так однозначны. Они тоже бывают многоязычные, например та же инфографика или кнопки.

Answer 4 · 2013-05-31 15:08:21

Просто вынесите все «переводимые» вещи в отдельные таблицы с полем языка. Скажем если это будет «блог» и его контент должен быть переводимым, то будет 2 таблицы: Заголовок, Контент. У каждой таблицы будет поле языка (language = en/ru/de/jp). Потом соответственно делайте выборку по ним.

p.s.: Так реализованы мультиязычные контенты в Drupal CMS. Посмотрите детально как они там это сделали.

Многоязычный сайт… не блог… как?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт