Если говорить просто то мне необходимо получить информацию, К сожалению я не знаю двигаюсь ли я в правильную сторону. Поэтому вместо того что-бы задавать вопросы как перекодировать это страницу если decode("utf-8) не работают. Лучше я спрошу прямо, как получить данные которые можно парсить с
этой страницы.
Интересует решение на питоне, вот что смог сделать я. Заранее спасибо.
# -*- coding: utf-8 -*- ?
import requests
import json
def GetJSON(word):
url = "https://ru.wiktionary.org//w/api.php?action=query&titles=%s&prop=revisions&rvprop=content&format=json"
url = url%word
answ = requests.get(url).text
data = json.load(answ)
return data
print(GetJSON("кот"))
PS гиперссылка не работает-почему то, просто скопируйте это
https://ru.wiktionary.org/w/api.php?action=query&titles=%D0%BA%D0%BE%D1%82&prop=revisions&rvprop=content&format=json
Решено!
Решение:
# coding: utf-8
import requests
def WikiSearch(word):
req = requests.get('https://ru.wiktionary.org/w/api.php?action=query&titles=%s&prop=revisions&rvprop=content&format=json' % word)
req = req.json()["query"]["pages"]
for key in req:
if key == "-1": return None #404 page not found
req = str(req[key]["revisions"])
a = req.find("слогам")+6
req = req[a:a+req[a:].find("}")]
req = req.replace("\u0301","'")
req = req.replace("|","")
return req
print(WikiSearch(input()))
Программа выводит слово с ударением.