In [11]: string.split('д')
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-11-5d3f329c4a4e> in <module>()
----> 1 string.split('д')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)
In [9]: string
Out[9]: u'\u0434\u0438\u0435\u0442\u0430, \u0434\u0438\u0435\u0442\u0430 \u0434\u043b\u044f \u043f\
u043e\u0445\u0443\u0434\u0435\u043d\u0438\u044f'
In [10]: print(string)
диета, диета для похудения
In [11]: string.split('д')
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-11-5d3f329c4a4e> in <module>()
----> 1 string.split('д')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)
In [3]: string
Out[3]: u'\u0434\u0438\u0435\u0442\u0430, \u0434\u0438\u0435\u0442\u0430 \u0434\u043b\u044f \u043f\
u043e\u0445\u0443\u0434\u0435\u043d\u0438\u044f'
In [4]: a=string.encode('UTF-8').decode('UTF-8').encode('cp1251')
In [5]: a
Out[5]: '\xe4\xe8\xe5\xf2\xe0, \xe4\xe8\xe5\xf2\xe0 \xe4\xeb\xff \xef\xee\xf5\xf3\xe4\xe5\xed\xe8\x
ff'
In [6]: type(string)
Out[6]: unicode
Где посмотреть?
Все, что вижу в коде это вот это -
<meta charset="utf-8">