Алгоритм поиска имён в тексте

Question

joger @joger

Алгоритмы

Алгоритм поиска имён в тексте

Есть несколько текстов на пару тысяч слов каждый. есть список(пару сотен) имён (Александр, Иван итд).
Если за именем идут слова с большой буквы, то считаем это именем и фамилией.
Есть ли более эффективный способ нахождения имени и фамилии кроме тупого перебора?

хоть это и не важно, но язык — PHP

Вопрос задан более трёх лет назад
4823 просмотра

Комментировать

Подписаться 4 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Go-разработчик с нуля + нейросети

9 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Стоит ли читать книгу «Грокаем алгоритмы»?
- 1 подписчик
- 27 мая
- 332 просмотра
0

ответов
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 394 просмотра
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 224 просмотра
1

ответ
Алгоритмы

Простой
Какие данные берет функция для генерации случайного числа?
- 1 подписчик
- 18 февр.
- 286 просмотров
4

ответа
C++

+1 ещё

Простой
Почему не решает задачу?
- 1 подписчик
- 05 февр.
- 430 просмотров
1

ответ
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт. 2025
- 409 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт. 2025
- 298 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 257 просмотров
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт. 2025
- 239 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт. 2025
- 393 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2012-03-12 18:57:11

Более эффективные алгоритмы конечно есть, но я бы не стал терять время на оптимизацию, если несколько текстов по паре тысяч слов — это все что надо обработать. Есть большая вероятность что создание оптимальной программы займет больше времени чем работа неоптимальной.

Answer 2 · 2012-03-12 18:40:11

При чём тут фамилии и нужны ли они я так и не понял. PHP я знаю на уровне

<?php echo "Hello world" ?>

.
А вот bash я знаю неплохо. И сделал бы так:

for FILE in *txt ; do
comm -12 <(cat $FILE | sed 's/[!?., ]/\n/g'|sort -u) <(sort FILE_WITH_NAME_LIST)
done

Раз просили алгоритм, то делает оно следующее: превращает файл в последовательность строк, где в каждой строке лишь одно слово. Так же подразумевается, что файл с именами представляет из себя тоже такую же последовательность, ну а потом comm таки перебором ищет совпадения.
Сравнить этот способ с php ни по производительсности ни по трудоёмкости, увы, не могу.

Answer 3 · 2012-03-12 19:26:34

Может я не понял, что хочет именно српашивает автор, но реализовать отбор можно так:
разбиваем строки на куски отдельные (explode), если конечно они разделены, например, только пробелами или каким нибудь символом. Потом аналогично разбиваем отдельно имя на массив символов и проверяем первый символ на заглавную букву.

Answer 4 · 2012-03-12 21:33:51

winolog @winolog

array_uintersect

Ответ написан более трёх лет назад

1 комментарий

Алгоритм поиска имён в тексте

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт