Как генерировать случайные имена?

Question

Rrooom @Rrooom

Как генерировать случайные имена?

Для игры хочется предложить генерацию случайных имен (эльфиские и орочьи). Начал смотреть многочисленные сайты - везде банальный рандомный выбор из большого, но не безмерного списка.

Как бы их генерировать? Что-то в голове крутится о марковских цепях... Но...

Вопрос задан более трёх лет назад
12196 просмотров

Комментировать

Подписаться 16 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

3 комментария

Максим Васильев @qmax

НАПРИМЕРЫ
(все словари реверсные)

Топ250 общерусских фамилий (длинна 4):
Богданов Исаков Лаврентьев Сергеев Быков Афанасьев Рожков Воронин Котов Казарев Громанов Агафонов Ников Голубев Елисеев Носков Мясников Федотов Маслов Афанасьев Русаков Гурьев Крылов Харионов
Одионов Корнилов Евсеев Селезнёв Бирюков Туров Казаров Пахомов

Половина фамилий - тупо из исходного словаря.

Топ250 общерусских фамилий (длинна 3):
Братов Саков Калов Мамов Трев Гусамов Нецов Пов Болезнецов Совчин Марёв Михартетьев Темьев Нов Ров Сеев Лаев Беспахачёв Исельшаков Цверентьев Зуев Данов Кузнёв Лубиряевдентин Палогдаврететурогинниколов Бельшакомолаев Белов Мофеев Зимирюконов Куляков Васитнильев Самов

Немного веселее, но много всяких "пов", "ров", "нов" и какой-то херни.

А вот вариант генерации окончания по Топ250 (4), а примерно после трёх букв (какраз характерные окончания фамилий) переключение на словарь по Топ69K русских слов (5):
Лев Бурьянов Один Трещин Голубев Кощеев Однаков Попов Слов Селёв Быстров Свернов Карпов Кольков Цветковалёв Насилов Кощеев Грубостров Бугреев Зуев Сдержанин Любов Состальянов Красов Гастров
Егорбачёв Часов Косынов Зев Пьянов Винтов Шов Пьянов Трамбов Кувшин Бугреев Винтов Кощеев Эконов Барактернов Новалёв Каков Итальянов Ементьев Некрасильев Резкин Сынов Таков

Уже гораздо веселее, но на "еев" получается почемуто только Кощеев и Бугреев. Зато очень хороша получилась этимология "Барактернов".

Для полноты картины, просто слова
Топ69K(5):
провочник рватиться полицейский оказать камена но целый идти так вот чтобы дальной ждать почему по ни из с вот средставиться и прислать написать свое и геморрой поздорож между состоить что стояние воле
Топ69K(3):
и этола тотолчасфакони чали спити былил я имамы ли тоял я чу рамоловкую бог равидобивелад и эточеровнечая казав ним жийстворязал будали и вторикактили раянут что его что не и гроевразыкамительши все ли

Написано более трёх лет назад
Максим Васильев @qmax

https://github.com/qwiglydee/loremator

Написано более трёх лет назад
Tenebrius @Tenebrius

Максим Васильев: тлеет надежда, что алгоритм не потерян навеки. Можете его еще раз выложить?

Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

+4 ещё

Простой
Как хранить публичный медиа-контент сайта?
- 1 подписчик
- 03 июл.
- 166 просмотров
3

ответа
Программирование

+4 ещё

Простой
На сколько плох мой GitHub?
- 1 подписчик
- 03 июл.
- 494 просмотра
2

ответа
Программирование

+2 ещё

Средний
Поможете собрать компьютер для запуска виртуальных машин и коддинга?
- 1 подписчик
- 02 июл.
- 464 просмотра
5

ответов
Программирование

+4 ещё

Сложный
Что делать, на QEMU всё летает, а реальный Celeron D умирает?
- 2 подписчика
- 01 июл.
- 501 просмотр
1

ответ
Веб-разработка

Простой
В какой программе/сайте можно создать и выгрузить html сайт?
- 3 подписчика
- 21 июн.
- 843 просмотра
3

ответа
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 193 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 493 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 475 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 274 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 486 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2014-09-14 01:37:46

Марковские цепи помогут вычислить сочетаемость букв в именах, и выбирать наиболее "благозвучную" букву по контексту (префиксу).
Метод архиэффективный и способен породить бесконечннешее количество слов.
Но только если обучающая выборка достаточно большая.

Мои рекомендации:
Используйте длинну префикса 3-4 буквы (примерно длинна слога).
Боле длинные префиксы будут порождать слова слишком похожие на исходные и их рекомбинации.
Более короткие будут не очень благозвучны.
Обязательно используйте символы начала и конца слова в качестве спец-буквы ('^' и '$'), просто пробела недостаточно, но уже не помню почему.

Для имён имеет смысл генерить их с конца, поскольку окончания у имён специфичные, и рандом может долго не попадать на концевую цепочку, порождая излишне длинные слова. А при генерации с конца можно просто по критической длинне принудительно оборвать слово, или выйти на ближайшей остановке.

Для хранения эффективно использовать префиксное дерево с частотами в качесве значений.
Алгоритм составления словаря довольно простой:

prefix = '^'
for letter in text:
  freqdict[prefix+ letter] += 1 # увеличение счётчика этого сочетания
  if letter ='$':  # конец слова, сброс префикса
    prefix = '^'
  else:
    prefix = prefix[-depdth:] # обрезане префикса до максимальной длинны

После этого нужно нормальизовать значения для каждого префикса, чтобы
для каждого префикса сумма значений всех хвостов была = 1.
При таком раскладе можно "склеить" частоты в единичный отрезок, разделёный на части пропорционально частоте, и рандомом выбирать "взвешенно-равномерно".

Алгоритм генерации:

prefix = '^'
while prefix[-1] != '$':
  tails = freqdict[prefix].items() # под-дерево всех продолжений префикса в виде списка (key, value)
  thresh = random() # точка на единичном отрезке
  i = 0 # текущий элемент
  level = 0 # верхняя граница отрезка текущего элемента
  while thresh > level:
    level += tails[i][1]
    i++
  prefix += tails[i][0]

Код написан по памяти, не принимайте на слово :)
Наверно, мне уже пора выкладывать библиотеку для рыбогенерации...

Answer 2 · 2014-09-18 07:03:13

mpaytishev @mpaytishev

В этой статье есть полезные ссылки на тему:
habrahabr.ru/post/218401

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2014-09-14 00:10:47

Используй генератор случайных чесел, только в именах.
Или цикл фор, вариантов много если честно. Да и зависит от языка, на каком вы писали ?
Это вообще не тот вопрос, на который ответ не найти. 5 минут поиска и все.

Answer 4 · 2014-09-14 20:17:36

да вроде не так давно встречался именно такой сайт именно с генератором ников, правда все какие-то на восточный лад, но тем не менее...

Как генерировать случайные имена?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт