@mmserebryakov

Регулярное выражения для поиска информации?

Нужно регулярное выражение для поиска определенного номера. Есть поле в таблице, в нем много текста, необходимо выдернуть номер, пример:
текс :/D/сам номер который нужен\r\n: текст
То есть, интересует как написать регулярку, чтобы она нашла определенный символ или группу символов и взяла все, что после этого символа и остановилась, когда встретился следующий символ.
  • Вопрос задан
  • 124 просмотра
Пригласить эксперта
Ответы на вопрос 1
mayton2019
@mayton2019
Bigdata Engineer
В Apache Spark обычно нет таблиц. Дата-инженер оперирует абстракциями
- RDD
- DataFrame
- DataSet (почти тоже самое что датафрейм)


Когда у тебя в одной руке датафрейм - ты можешь уже к нему применить фильтр с регуляркой тип

df.filter(col("name").rlike("(?i)^*rose$")).show()

Если сильно хочется - то поверх датафрейма создается View через

df.createOrReplace......View("view_name")

И с ним работают.

spark.sql("SELECT .... WHERE col RLIKE ..... ").show()


Но это уже такой себе овер-инжинеринг. И если можно решить задачу на уровне датафреймов
то обычно так и решают. SQL и прочее подключают когда есть JOINS или какие-то особые условия
(catalyst optimizer нужен).
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы