Ответы пользователя Andrey Dugin по тегу «Python»

Как реализовать алгоритм двойной перестановки?

Andrey Dugin @adugin Куратор тега Python

def decode(text, xkeys, ykeys):
    return ''.join(text[4*(y-1)+(x-1)] for y in ykeys for x in xkeys)

print decode(u'ТЮАЕООГМРЛИПОЬСВ', (4,1,3,2), (3,1,4,2))

Для кодирования - по аналогии.

Ответ написан более трёх лет назад

2 комментария

Python парсер лога, выводит пустые строки в список по регулярному значению? почему?

Andrey Dugin @adugin Куратор тега Python

Если файл не слишком большой - можно прочитать его целиком:

with open(r'z:\test.txt') as f:
    print set(re.findall('\d{19}', f.read()))

Иначе - построчно:

with open(r'z:\test.txt') as f:
    print {item for line in f for item in re.findall('\d{19}', line)}

Ответ написан более трёх лет назад

Комментировать

Как убрать пунктуацию в питоне, но оставить некоторые символы?

Andrey Dugin @adugin Куратор тега Python

>>> text
'blah. ! blah (beeep?) heap :) :) :)'
>>> re.sub(':(?!\))|(?<!:)\)|[^\w\s:)]', '', text)
'blah  blah beeep heap :) :) :)'

Или так:

>>> from functools import partial
>>> smile = ':)'
>>> regex = partial(re.sub, '[^\w\s]', '')
>>> smile.join(map(regex, text.split(smile)))
'blah  blah beeep heap :) :) :)'

Ответ написан более трёх лет назад

Комментировать

Где ошибка в коде Python?

Andrey Dugin @adugin Куратор тега Python

def solve(sequence):
    def select(shift=0):
        for start in range(4):
            selection = sequence[start:][shift:5]
            value = min(selection)
            shift += selection.index(value)
            yield value
    return ''.join(select())

print(solve('13321311')) # 1111
print(solve('12312321')) # 1121
print(solve('33211213')) # 1113
print(solve('12345678')) # 1234
print(solve('21221132')) # 1112

Ответ написан более трёх лет назад

8 комментариев

Существует ли альтернатива методу join?

Andrey Dugin @adugin Куратор тега Python

Решение #1 (для различных типов последовательностей):

from itertools import chain, zip_longest

def mix(sequence, fltr=lambda e: e is not None):
    return filter(fltr, chain(*zip_longest(sequence[1::2], sequence[0::2], fillvalue=None)))

print(''.join(mix('12345678')))  # => '21436587'
print(''.join(map(str, mix([1, 2, 3, 4, 5, 6, 7, 8, 9]))))  # => '214365879'
print(list(mix([1, 2, 3, 4, 5, 6, 7, 8, 9])))  # => [2, 1, 4, 3, 6, 5, 8, 7, 9]

Решение #2:

from operator import itemgetter

def swap(sequence, keyfunc=itemgetter(1)):
    min_value_index, min_value = min(enumerate(sequence), key=keyfunc)
    max_value_index, max_value = max(enumerate(sequence), key=keyfunc)
    sequence[min_value_index], sequence[max_value_index] = max_value, min_value
    return sequence

print(swap([3, 4, 0, 7, 1, 9, 8, 6, 2, 5]))  # => [3, 4, 9, 7, 1, 0, 8, 6, 2, 5]

Решение #3: повторяется первая задача.

Ответ написан более трёх лет назад

Комментировать

Как правильно пропарсить access.log с python?

Andrey Dugin @adugin Куратор тега Python

from collections import Counter, defaultdict
from itertools import imap
import re

codes = ['200', '3xx', '4xx', '5xx']
regex = re.compile('^.+?\[(?P<date>.+?) .+?\].+?(?P<code>\d+) \d+ ".+?" ".+?"$')
stats = defaultdict(Counter)

with open('access.log', 'r') as f:
    for date, code in (match.groups() for match in imap(regex.match, f) if match):
        stats[date].update([code if code == '200' else '{}xx'.format(code[0])])

for date, items in sorted(stats.iteritems()):
    print date, ' '.join(str(items[code]) for code in codes)

# ---------- И ещё вариант ----------

from collections import Counter, defaultdict
from itertools import imap
from operator import methodcaller as mc
import re

codes = ['200', '3xx', '4xx', '5xx']
regex = re.compile('^.+?\[(?P<date>.+?) .+?\].+?(?P<code>\d+) \d+ ".+?" ".+?"$')
stats = defaultdict(Counter)

def fmt(code):
    return code if code == '200' else '%sxx' % code[0],

with open('access.log', 'r') as f:
    reduce(
        lambda _, (date, code): stats[date].update(fmt(code)),
        imap(mc('groups'), imap(regex.match, f)), None
    )

for date, items in sorted(stats.iteritems()):
    print date, ' '.join(imap(str, imap(items.__getitem__, codes)))

</code>

Ответ написан более трёх лет назад

2 комментария

Замена числа. Есть функция?

Andrey Dugin @adugin Куратор тега Python

''.join(random.sample('0123456789', 4))

Ответ написан более трёх лет назад

1 комментарий

Как вывести ошибки python-скрипта в окно браузера?

Andrey Dugin @adugin Куратор тега Python

import cgitb
cgitb.enable()

Как было сказано выше, на боевом сервере так делать не рекомендуется - засветите начинку скрипта пользователю.

Ответ написан более трёх лет назад

Комментировать

Из словаря список списков в Python 3?

Andrey Dugin @adugin Куратор тега Python

zip(*[a.iterkeys()]*2)

Ответ написан более трёх лет назад

3 комментария

Наилучший способ обработать дату без внешних библиотек?

Andrey Dugin @adugin Автор вопроса, куратор тега Python

Я тут тоже наговнокодил. Вроде работает, но кровь из глаз не остановить:

# -*- coding: utf-8 -*-

import re
from datetime import datetime, timedelta

months = u'января февраля марта апреля мая июня июля августа сентября октября ноября декабря'.split()
regexp = u'(?:(?P<yesterday>Вчера)|(?P<today>Сегодня)|(?P<day>\d{1,2})[ ](?P<month>[а-я]+))[ ](?P<hour>\d{2}):(?P<minute>\d{2})'

def postdate(text, posted=None):
    if posted is None:
        posted = datetime.now()
    match = re.match(regexp, text, flags=re.U)
    if match:
        if match.group('today'):
            pass
        elif match.group('yesterday'):
            posted -= timedelta(days=1)
        else:
            posted = posted.replace(
                month = months.index(match.group('month')) + 1,
                day = int(match.group('day'))
            )
        posted = posted.replace(
            hour = int(match.group('hour')),
            minute = int(match.group('minute')),
            second = 0
        )
    return datetime.strftime(posted, "%d/%m/%Y %H:%M:%S")

print postdate(u'9 июля 11:41')
print postdate(u'Вчера 23:13')
print postdate(u'Сегодня 09:43')

Результат:

09/07/2015 11:41:00
06/08/2015 23:13:00
07/08/2015 09:43:00

Ответ написан более трёх лет назад

2 комментария

Как в пайтоне выделить общую часть из двух строк?

Andrey Dugin @adugin Куратор тега Python

Вам сюда:
difflib.SequenceMatcher.find_longest_match()

Пример:

>>> from difflib import SequenceMatcher as SM
>>> s1 = 'A roza upala na lapu Azora'
>>> s2 = 'Dai, Djim, na s4astie lapu mne'
>>> sm = SM(lambda c: c in set(' ,'), s1, s2)
>>> m = sm.find_longest_match(0, len(s1), 0, len(s2))
>>> s1[m.a:m.b]
' lapu '

Ответ написан более трёх лет назад

1 комментарий

Зачем нужны бесконечные массивы Python?

Andrey Dugin @adugin Куратор тега Python

>>> from itertools import islice
>>> s = islice(xrange(100), 27, 40, 3)
>>> s
<itertools.islice object at 0x02618060>
>>> list(s)
[27, 30, 33, 36, 39]

И ещё почитайте про memoization, а также пару ссылок ниже:
https://github.com/brennerm/PyTricks/blob/master/c...
https://github.com/brennerm/PyTricks/blob/master/m...

Ответ написан более трёх лет назад

Комментировать

Почему скрипт работает медленно?

Andrey Dugin @adugin Куратор тега Python

Во-первых, перестать постоянно считать в цикле то, что должно быть посчитано вне цикла; во-вторых, не делать того, что делать не нужно:
1) int(bin_password[-8:] - кроме того, что это должно быть константами вне цикла, зачем слайс? Получайте bin_password не через bin, а через '{:08b}'.format(your_int_number).
2) Не проще ли просто последовательно читать из одного файла и писать в другой, а потом при необходмости удалить первый и переименовать второй?
3) Вместо циклического сдвига попробуйте collections.deque.rotate() - хотя с учётом п.1 это большой погоды не сделает.
4) Весь цикл 'for byte in block' поместите в list comprehension, и тогда append не нужен.
5) Вместо range используйте xrange, если Python 2.x
6) Используйте mmap
7) Разделить вычисления и I/O - вынести запись в файл в отдельный тред, пусть параллельно работают. Это классика.

Ответ написан более трёх лет назад

2 комментария

PYTHON: Как удалить ряд символов из строки?

Andrey Dugin @adugin Куратор тега Python

Этот вопрос здесь уже не раз задавался:
Как удалить запрещенные символы из строки?

Ответ написан более трёх лет назад

Комментировать

Как установить правильную кодировку для ответа с сервера в Python 3?

Andrey Dugin @adugin Куратор тега Python

В Python 2.7 работает и так, и так :)

>>> data = urlopen('http://devcave.ru/json.php').read()
>>> data.decode('utf-8')
u'{"key":"\\u0440\\u0443\\u0441\\u0441\\u043a\\u0438\\u0439 \\u044f\\u0437\\u044b\\u043a"}'
>>> data.decode('cp1251')
u'{"key":"\\u0440\\u0443\\u0441\\u0441\\u043a\\u0438\\u0439 \\u044f\\u0437\\u044b\\u043a"}'

Ответ написан более трёх лет назад

6 комментариев

Python как очистить строку от пробелов и переносов строк?

Andrey Dugin @adugin Куратор тега Python

Python 2.7:

import re
filter(None, re.split('\s', text))

Или так:

[entry.strip() for line in text.splitlines() for entry in line.split()]

Ответ написан более трёх лет назад

6 комментариев

Как распарсить строку с не совсем корректным json'ом?

Andrey Dugin @adugin Куратор тега Python

def tokenize(data):
    cleanup = lambda entry: entry.replace(':', '').strip()
    for entry in data.strip(';').split(';'):
        entry = map(cleanup, entry.rsplit(':',1))
        if len(entry) == 1:
            entry.append(True)
        yield entry

input = 'name1: value1; name2: value2; name3; prefix: name4: value4;'
print dict(tokenize(input))

Результат:

{'prefix name4': 'value4', 'name2': 'value2', 'name3': True, 'name1': 'value1'}

Ещё можно вот в таком направлении поиграться:

>>> dict(re.findall('\s*([\w\s:]+?)\s*(?::\s*([\w\s]*)\s*)?(?=[;$])', input))
{'prefix: name4': 'value4', 'name2': 'value2', 'name3': '', 'name1': 'value1'}

Ответ написан более трёх лет назад

3 комментария

Как упорядочить элементы списка по шаблону?

Andrey Dugin @adugin Куратор тега Python

>>> input = {'RGB': {(10, 20, 30), (11, 21, 31)}, 'GBR': {(22,32,12), (23, 33,13)}}
>>> [map(dict(zip(key, triplet)).get, 'RGB') for key, triplets in input.iteritems() for triplet in triplets]
[[10, 20, 30], [11, 21, 31], [13, 23, 33], [12, 22, 32]]

Ответ написан более трёх лет назад

Комментировать

Как при ошибке подключения к серверу запускать скрипт заново?

Andrey Dugin @adugin Куратор тега Python

Как сделать автоматический рестарт скрипта при ошибках timeout в python?

Ответ написан более трёх лет назад

Комментировать

Как правильно найти подстроку в строке?

Andrey Dugin @adugin Куратор тега Python

Зачем сохранять в файл и потом с него читать? Вот простой пример с регуляркой:

import urllib, re

html = urllib.urlopen('http://www.mail.ru/').read()
pattern = '<span class="weather__temperature">([-+\d]+)</span>',
temperature = re.search(pattern, html).group(1)

print temperature

Ответ написан более трёх лет назад

Комментировать

Войдите на сайт