Замена по регулярному выражению с поиском по частям строки?

Question

ertaquo @ertaquo

Замена по регулярному выражению с поиском по частям строки?

Есть строка с запросом:

SELECT * FROM {table} WHERE name=&quot;123 {qwerty} 789&quot; AND id IN (SELECT id FROM {other_table})

Хотелось бы как-то заменять "{table}" на «prefix_table». Однако

preg_replace('/\{([\w\d_]+)\}/', 'prefix_$1', $query);

будет заменять вообще все фигурные скобки, включая "{qwerty}" в строке внутри запроса. Можно ли как-то сделать замену, не касаясь строк? Может, можно сделать проверку на четность или еще как-то?

UPD:

Кому интересно решение, я сделал так:

function ReplaceTableNames($sql)
{
	$prefix = 'prefix_';

	$escape = false;
	$quot = false;
	$table = false;
	for ($i = 0; $i < strlen($sql); $i++)
	{
		switch($sql[$i])
		{
		case '\\':
			if ($quot !== false)
				$escape = !$escape;
			break;
		case '"':
		case '\'':
			if (!$escape)
			{
				if ($quot !== false)
				{
					if ($quot == $sql[$i])
					{
						$quot = false;
					}
				}
				else
				{
					$quot = $sql[$i];
					$table = false;
				}
			}
			else
			{
				$escape = false;
			}
			break;
		case '{':
			if ($quot === false)
			{
				$table = '';
			}
			break;
		case '}':
			if ($table !== false)
			{
				$sql = substr_replace($sql, $prefix.$table, $i - strlen($table) - 1, strlen($table) + 2);
				$i += strlen($prefix) - 1;
				$table = false;
			}
			break;
		default:
			if ($table !== false)
			{
				if (preg_match('|[\w\d_\.]+|i', $sql[$i]))
				{
					$table .= $sql[$i];
				}
				else
				{
					$table = false;
				}
			}
		}
	}

	return $sql;
}

В результате — правильный парсинг строки запроса, с игнорированием экранирования строковых символов и неправильных имен таблиц.

Вопрос задан более трёх лет назад
3162 просмотра

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 5

1 комментарий

6 комментариев

ertaquo @ertaquo Автор вопроса

Да, я хочу их все заменить. Причем ваш вариант не сработает правильно со строкой типа SELECT * FROM table WHERE qwerty="{123}". У меня сейчас стоит такая замена:
$sql = preg_replace('|^([^"\']+)\{([\w\d]+)\}|', '$1`prefix_$2`', $sql);
Она более правильна, но все равно не заменит все подобные плейсхолдеры.

Написано более трёх лет назад
IDMan @IDMan

А если так?

preg_replace('/(FROM|UPDATE|ALTER)\s+{([\w\d_]+)\}/iU', '$1 prefix_$2', $query);

Написано более трёх лет назад
ertaquo @ertaquo Автор вопроса

Пожалуйста! Неправильное поведение будет, если появится подобный запрос:
UPDATE {table} SET `text`="пример запроса: SELECT * FROM {table}"

Написано более трёх лет назад
IDMan @IDMan

И еще будет ошибка при JOIN, вернее при таком варианте:
FROM tbl1, tbl2

JOIN мы, конечно, добавим к FROM|UPDATE|ALTER.

Написано более трёх лет назад
ertaquo @ertaquo Автор вопроса

Так фишка в том, что все равно неправильно =( Уже подумываю сделать многопроходную обработку: убрать сначала строки, потом сделать замены, и под конец вернуть строки на нужные места.

Написано более трёх лет назад
IDMan @IDMan

Да, запросы в текстовых строках путают все карты :). Сложно узнать, отталкиваясь от SQL запроса как центра зрения, кавычки с обеих сторон — это строка, или конец одной, которая перед запросом, и начало второй, которая после.
Когда-то я делал подобное, только с другой предметной области — парсинг файлов. Заменял «неприкасаемые» кавычки на другую последовательность спец. символов, делал что нужно, и потом возвращал назад. Целых три регулярки.
Удачи :).

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 138 просмотров
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 2 подписчика
- 17 июн.
- 225 просмотров
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 484 просмотра
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 259 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 205 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 162 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2488 просмотров
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 354 просмотра
6

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 194 просмотра
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 258 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2011-05-10 01:10:54

А почему именно на регекспах?
Можно сделать на Конечных автоматах чтото типа:

define( 'STATE_QUOTE_OPEN', 1 );
define( 'STATE_QUOTE_CLOSE', 2 );

define( 'STATE_LQUOTE_OPEN', 3 );
define( 'STATE_LQUOTE_CLOSE', 4 );

define( 'STATE_BRACE_OPEN', 5 );
define( 'STATE_BRACE_CLOSE', 6 );

function parse( $str, $repl ){
    $state = 0; // default
    $buf = '';
    $brace_pos_start = 0;
    for( $i = 0; $i < strlen( $str ); $i++ ){
        switch( $str[$i] ){
            case '"':
                $state = $state == STATE_QUOTE_OPEN ? STATE_QUOTE_CLOSE : STATE_QUOTE_OPEN;
            break;
            case "'":
                $state = $state == STATE_LQUOTE_OPEN ? STATE_LQUOTE_CLOSE : STATE_LQUOTE_OPEN;
            break;
            case '{':
                if( $state != STATE_QUOTE_OPEN && $state != STATE_LQUOTE_OPEN ){
                    $state = STATE_BRACE_OPEN;
                    $buf = '';
                    $brace_pos_start = $i;
                }
            break;
            case '}':
                if( $state == STATE_BRACE_OPEN ){
                    $state = STATE_BRACE_CLOSE;
                    $str = substr_replace( $str, $repl[ $buf ], $brace_pos_start, $i - $brace_pos_start + 1 );
                    $i = $brace_pos_start + strlen( $repl[ $buf ] );
                }
            break;
            default:
                if( $state == STATE_BRACE_OPEN ) $buf .= $str[$i];
            break;
        }
    }
    return $str;
}

echo parse( 'SELECT * FROM {table} WHERE name="123 {qwerty} 789" AND id IN (SELECT id FROM {other_table})',
array( 'table' => 'tbl1', 'other_table' => 'tbl2' ) );

вывод:
SELECT * FROM tbl1 WHERE name=«123 {qwerty} 789» AND id IN (SELECT id FROM tbl2)

Сильно не пинайте, писалось на коленке в час ночи :)
Суть следующая, если открыта кавычка, то {...} не учитываем.
После замены сдвигаем курсор.

Answer 2 · 2011-05-10 00:57:07

Вообще очень подозрительный вопрос. Вы точно уверены что оно вам надо? Мне кажется что нет)

Но если даже уверены — сами поглядите. Вам предлагают регулярку /(FROM|UPDATE|ALTER)\s+{([\w\d_]+)\}/iU а вы приводите ломающий ее пример UPDATE {table} SET `text`="пример запроса: SELECT * FROM {table}"… При том, что запросы, включающие в себя данные, уже года 4 как нормальные люди не используют. Есть же плейсхолдеры (в похапе их поддерживает как минимум PDO). Т.е. будете писать UPDATE {table} SET `text`=:text WHERE id IN( SELECT id FROM {other_table}), проводить все ваши замечательные замены и потом уже средствами PDO биндить данные к запросу.

Если такой подход чем-то не устраивает, нужно еще раз хорошенько задуматься. Если не помогло — то тогда делайте какие-то более уникальные метки для выделения имен таблиц в стиле SELECT * FROM {#$table$#}. Ну и крайний случай — пишите полноценный парсер SQL по всяким BNF правилам. Хотя тогда скорее всего просто зря потеряете кучу времени.

Answer 3 · 2011-05-09 19:30:50

adminimus @adminimus

preg_replace('/\FROM\s+{([\w\d_]+)\}/i', 'FROM {prefix_$1}', $query);

чем не устраивает?

Ответ написан более трёх лет назад

1 комментарий

Answer 4 · 2011-05-09 20:42:55

preg_replace('/^(.*)\{([\w\d_]+)\}/iU', '$1 prefix_$2', $query);

Мы заменим только первые скобки. Но я смотрю, у вас в конце запроса есть «other_table». Его вы тоже хотите заменить?

Answer 5 · 2011-05-10 04:43:36

Если вам очень дорог ваш текущий подход, то используйте в запросах `{table}`, а в данных экранируйте символ ` через html-entity (да и остальные кавычки не помешает). А если без извращений, то вам выше подсказали про плейсхолдеры в PDO.

P.S. У меня лично свой велосипед, но там опять же таблицы подставляются вместе с данными, а в самом запросе никакого произвольного текста быть не может, рекомендую вам пересмотреть вашу концепцию в этом направлении.

Answer 6 · 2011-05-10 05:47:56

если нужно просто заменять "{table}" на «prefix_table» то зачем тут регекспы?

$query = str_replace('{table}','`prefix_table`',$query);

Замена по регулярному выражению с поиском по частям строки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт