Задать вопрос
@Sandrkll1

Проблема при парсинге ссылок?

Я делаю парсер музыки с сайта: https://sefon.pro, когда я пытаюсь спарсить ссылку на скачивание музыки, то она выводится непонятными символами.
На сайте это ссылка выглядит вот так: https://cdn6.sefon.pro/files/prev/180/The%20Limba%...
А после парсинга вот так: #MmticHMlMjkubXAz1aHR9UaGUlMjBMaW0cHM4MC9maWxlcy9uLnByby9LnNlZm2jZG4Ly9wcmV6LzE50iYSUyMCUyNiUyMEFuZHJvJTIwLSUyMFguTyUyMCU
yODE

Я уже облазил весь гугл и так не нашёл решение этой проблемы.

Вот собственно код которым я делал парсинг:
from bs4 import BeautifulSoup as BS
import urllib.request

def parse_music(name=''):
	if name == "":
		site = requests.get("https://sefon.pro/best/" + str(name))
	else:
		site = requests.get("https://sefon.pro/search/?q=" + str(name))
	html = BS(site.content, 'html.parser')


	music_list = []

	for el in html.select(".mp3"):
		music = el.select(".btns > a")
		print(music)
		for ell in music:

			music_list.append({
		        'track_url' : ell.get("data-url")
		    })
	print(music_list[0])

parse_music()
  • Вопрос задан
  • 471 просмотр
Подписаться 1 Средний Комментировать
Решения вопроса 1
fox_12
@fox_12 Куратор тега Python
Расставляю биты, управляю заряженными частицами
Это похоже на base64
>>> import base64
>>> base64.b64decode('MmticHMlMjkubXAz1aHR9UaGUlMjBMaW0cHM4MC9maWxlcy9uLnByby9LnNlZm2jZG4Ly9wcmV6LzE50iYSUyMCUyNiUyMEFuZHJvJTIwLSUyMFguTyUyMCU')
b'2kbps%29.mp3\xd5\xa1\xd1\xf5F\x86RS#\x04\xc6\x96\xd1\xc1\xcc\xe0\xc0\xbd\x99\xa5\xb1\x95\xcc\xbd\xb8\xb9\xc1\xc9\xbc\xbd.sefm\xa3dn\x0b\xcb\xdc\x1c\x99^\x8b\xccNt\x89\x84\x94\xc8\xc0\x94\xc8\xd8\x94\xc8\xc1\x05\xb9\x91\xc9\xbc\x94\xc8\xc0\xb4\x94\xc8\xc1`\xb9<\x94\xc8\xc0\x94'


Я уже облазил весь гугл и так не нашёл решение этой проблемы.

А разгадка не в гугле - а в самом коде:
5ed2d87a898c3588935048.png
Там действительно base64 только немного "испорченная" по хитрому алгоритму.
Деталей алгоритма приводить не буду - тут не хакерский форум.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@AlexBoss
Я глянул этот сайт, ссылки там действительно зашифрованы и это не base64.
Либо смотри js скрипты и ищи функцию, либо воспользуйся selenium.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы