@Sweet1488

Редактирование текста. Как из массива ссылок вырезать нужные фрагменты?

Есть количество ссылок на Facebook профили, около 40 000.
Выглядят примерно так
https://www.facebook.com/profile.php?id=100056378844823
https://www.facebook.com/profile.php?id=100036605837335
https://www.facebook.com/profile.php?id=100003312311771
Нужно удалить все только чтоб остался id. Как то так:
100056378844823
100036605837335
100003312311771
И чтоб сохранить в txt или excel.
Как можно реализовать данную процедуру ? excel, python, java ?
Буду весьма благодарен за любую информацию )
  • Вопрос задан
  • 116 просмотров
Решения вопроса 2
goctio
@goctio
Python:

C помощью .split разделяем строку, и получаем необходимый номер.

array = ['https://www.facebook.com/profile.php?id=100003312311771', 'https://www.facebook.com/profile.php?id=100036605837335']

for x in array:
	res = x.split('php?id=')[1]
	print(res)
	with open('some.txt', 'a') as save:
		save.write(res + '\n')
Ответ написан
Комментировать
azerphoenix
@azerphoenix Куратор тега Java
Java Software Engineer
Вам просто нужно выполнить поиск и замену по строке или регулярному выражению.
Можно обойтись и без ЯП используя только редактор текста Sublime Text или Notepad++.
Например, в sublime text нажмите на ctrl + h
в искомое поле введите
https://www.facebook.com/profile.php?id=
поле для замены оставьте пустым и нажмите на Replace All.

Если же цель заключается именно в использовании ЯП, то в Java можно воспользоваться методом replaceAll()
Так как у вас массив строк, то циклом пройдитесь по массиву и для каждого элемента массива выполните:
.replaceAll("https://www.facebook.com/profile.php?id=","");
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
warlinx
@warlinx
import re
inp_str = "https://www.facebook.com/profile.php?id=100003312311771"
print("Original string : " + inp_str)
num = re.findall(r'\d+', inp_str)
print(num)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы