Необходимо решить задачу для курса и понять в чем ошибка моего кода и мышления?

Question

Treyrem @Treyrem

Python

Необходимо решить задачу для курса и понять в чем ошибка моего кода и мышления?

Понимаю, что различные виды решения этой задачи есть в интернете, но не могу понять почему мой код тупо обрывается на пол пути. И в целом почему мой метод решения не верен и не работает. Изначально хотела написать говно код, который проверяет сначала первый символ на повторение (сравнивает i и i+1) и в случае отсутствия повторения обрывался и продолжал операцию с уже нынешнего i+1 и каким-то образом додумалась до цикла в цикле. В программировании совсем уж новичок, помогите пожалуйста
Мой код:

a=input().lower()

i=-1
j=0
s=len(a)-1

while i<=s:
  i=i+1
  j=j+1
  cnt=1
  while i<s:
    if a[i]==a[j]:
      i+=1
      j+=1
      cnt+=1
    if a[i]==a[s]:
      break
      print(a[i],cnt,sep="",end='')
    if a[i] != a[j]:
      print(a[i],cnt,sep="",end='')
      break

Узнав, что ДНК не является случайной строкой, только что поступившие в Институт биоинформатики студенты группы информатиков предложили использовать алгоритм сжатия, который сжимает повторяющиеся символы в строке.

Кодирование осуществляется следующим образом:
s = 'aaaabbсaa' преобразуется в 'a4b2с1a2', то есть группы одинаковых символов исходной строки заменяются на этот символ и количество его повторений в этой позиции строки.

Напишите программу, которая считывает строку, кодирует её предложенным алгоритмом и выводит закодированную последовательность на стандартный вывод. Кодирование должно учитывать регистр символов.

Sample Input 1:

aaaabbcaa
Sample Output 1:

a4b2c1a2
Sample Input 2:

abc
Sample Output 2:

a1b1c1

Вопрос задан более трёх лет назад
263 просмотра

2 комментария

Подписаться 2 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Александр Нестеров @AlexNest Куратор тега Python

Вариант с юнит-тестом:

from random import randint, choice
import unittest
import typing

_VARIANTS = []  # Сюда попадут все решения, которые нужно тестировать
# А это декоратор, которым нужно пометить все претенденты на решение
solution = lambda f: _VARIANTS.append(f) or f

EXAMPLES = [
    ('', ''),
    ('a', 'a1'),
    ('abc', 'a1b1c1'),
    ('aaaabbca', 'a4b2c1a1'),
]


@solution
def encode_dna(dna:str) -> str:
    if not dna:
        return ''
        
    dna_letters_list = list(dna.lower())
    letters_count = []
    
    letters_count.append([dna_letters_list[0],1])
    dna_letters_list.pop(0)

    for letter in dna_letters_list:
        if letter == letters_count[-1][0]:
            letters_count[-1][1] += 1
        else:
            letters_count.append([letter,1])

    for count in enumerate(letters_count, start=0):
        index,count = count
        string = ''.join(map(str,count))
        letters_count[index] = string


    encoded_dna = ''.join(letters_count)        
 

    return encoded_dna




class Test(unittest.TestCase):
    """Автоматический тест решений.
    Претенденты на решение должны быть помечены декоратором @solution
    Примеры берутся из списка EXAMPLES.
    """

    def closure(func, arg, res):
        """Временная функция, которая делает тест.
        Она формирует каждый раз новую функуию-замыкание, которая будет тестировать
        оережной кейс.
        """
        def test(self):
            f"""Тест функции {func.__name__}({arg!r})"""
            self.assertEqual(func(arg), res, msg=f'Func {func.__name__}({arg!r})')
        return test
    
    # Перебираем все варианты реализаций:
    for f in _VARIANTS:
        # Перебираем все предлженные эталонные римеры:
        for case_num, case in enumerate(EXAMPLES):
            # Создаём новую функуию теста и добавляем ее в класс теста как метод.
            locals()[f'test_{f.__name__}__{case_num}'] = closure(f, *case)

    # Удаляем из контекста класса лишние переменные
    del(closure, f, case_num, case)


if __name__ == '__main__':
    unittest.main(verbosity=3)

Написано более трёх лет назад

5 комментариев

Сергей П @trapwalker Куратор тега Python

Увы, но ваше решение не позволяет буквам повторяться в разных местах строки, а такой пример есть среди предложенных.
Добавьте в ваш пример "dd" в конце и всё сломается.

Написано более трёх лет назад
Andrey @seven5674

Сергей Паньков, согласен, упустил этот момент

Написано более трёх лет назад
Andrey @seven5674

Сергей Паньков, а так ?

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python
О. с регекспом решение тоже довольно элегантное.
А почему вы не пользуетесь форматными строками?
Вот это ваше решение можно записать понятным однострочником:

def encode_by_regexp(s: str) -> str: import re return ''.join( f'{w}{len(l)}' for l, w in re.findall(r"((\w)+?(?!\2))", s) )

А предыдущий вариант тоже можно спати небольшим костыликом. В таком виде работает и выглядит не громоздко, но решение запутанное и мудрёное.
Легко наделать ошибок.

def encode_elegant(s: str) -> str: d = {} g = 1 for c in s: g = d.get((c, g), 0) and g or g + 1 d[c, g] = d.get((c, g), 0) + 1 return ''.join([f'{k[0]}{v}' for k, v in d.items()])

Добавлю ваши варианты в свой ответ, с вашего позволения. Упомяну авторство.
Написано более трёх лет назад
Andrey @seven5674
Сергей Паньков,

А почему вы не пользуетесь форматными строками?

Пользуюсь только вот

понятным однострочником

не всегда есть истина

Я как-то предпочитаю проводить разделение на этапы трансформации данных - мало ли что еще нужно будет с ними сделать и как представить итоговый вариант

В моем случае конечно можно избавиться от промежуточных вариантов как это сделали вы

[('lll', 'l'), ('ddd', 'd'), ('rrr', 'r'), ('wwww', 'w'), ('tttt', 't'), ('gggg', 'g'), ('llll', 'l'), ('eeee', 'e'), ('ddddddddd', 'd')] ['l3', 'd3', 'r3', 'w4', 't4', 'g4', 'l4', 'e4', 'd9']
Написано более трёх лет назад

5 комментариев

Александр Нестеров @AlexNest Куратор тега Python

Ну, алгоритм действительно несколько в отрыве от языка.
Хотя конкретную реализацию (несколько монструозную по сравнению с остальными решениями), сделал на списках.
p.s. Добавил к ответу код.

Написано более трёх лет назад
markus1578 @markus1578

Сергей Паньков , поясните плз как это работает ?
re.findall(r"((\w)+?(?!\2))", s)

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python

markus1578,
О это прикольна ярегулярка.
Для начала, если простыми словами, регулярное выражение - это некий шаблон, записанный специальным синтаксисом. Причем возможности яза шаблоно втаковы, что это, фактически, полный по Тьюрингу язык программирования, но не суть.
Шаблон в регулярке можно раделить на группы круглыми скобочками. Группы нумеруются по номеру открывающей скобки. В регулярном выражении можно ссылаться на текст, который соответствует той или иной группе (по номеру) в текущем состоянии поиска.
В данном примере группы три: первая соответствует тому, что совпало полным регекспом, вторая - это одна буква (первая для группы одинаковых). Потом идёт квантификатор "плюс", который требует, чтобы буква была один или более число раз.
А вот третья группа особенная. Она требует, чтобы впереди был фрагмент, не совпадающе со значением второй группы, но этот фрагмент не будет захвачен регуляркой.
Если русским языком это сказать, то ищутся все последовательности букв, в которых повторяются одинаковые (такие как первая) буквы, пока не встретится отличающаяся.
Фактически выбираются все повторяющиеся наборы одинаковых букв, но на выходе findall выдаются значения групп, соответствующих скобочкам.
То есть на каждый набор одинаковых букв мы получим пару: буква и весь набор.
По длине набора можно понять сколько букв.

Как-то сумбурно объяснил, простите. Но в этом и есть проблема регулярных выражений. Они придуманы чужими для хищников. Их сложно объяснить, их без опыта порой сложно читать, их без опыта и навыка сложно писать, но они чертовски удобо порой заменяют довольно громоздкие алгоритмы.

Написано более трёх лет назад
Andrey @seven5674

Сергей Паньков,

Они придуманы чужими для хищников

:)

markus1578, вот тут в разделе Explain есть ещё один вариант объяснения как это работает

Написано более трёх лет назад
markus1578 @markus1578

Сергей Паньков,

Как-то сумбурно объяснил, простите

Спасибо. Общий принцип теперь я понял но все равно блин пипец какой-то эти регулярки :(

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 146 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 98 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 111 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 373 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 242 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 681 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 556 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 311 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 579 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 231 просмотр
2

ответа
Показать ещё Загружается…

Мой код:

Это не код.
https://qna.habr.com/help/rules, п.3.8.
Код в вопросе надо обернуть тегом code для корректного отображения.

Answer 1 · 2022-05-27 14:49:32

Алгоритм следующий:

В новый список (назовем его letters_count) помещаете список вида [<первая буква>, 1];
Удаляете первую букву из строки;
Далее в цикле по строке сравниваете, совпадает ли текущая буква с буквой в последнем списке letters_count;
Если да - увеличиваете значение числа на единицу;
В противном случае - добавляете новый список по аналогии с первым;
преобразуете letters_count в строку

Безусловно, может быть более элегантное решение, но это тоже вполне рабочее.

from random import randint, choice
def encode_dna(dna:str) -> str:
    if not dna:
        return ''
        
    dna_letters_list = list(dna.lower())
    letters_count = []
    
    letters_count.append([dna_letters_list[0],1])
    dna_letters_list.pop(0)

    for letter in dna_letters_list:
        if letter == letters_count[-1][0]:
            letters_count[-1][1] += 1
        else:
            letters_count.append([letter,1])

    for count in enumerate(letters_count, start=0):
        index,count = count
        string = ''.join(map(str,count))
        letters_count[index] = string


    encoded_dna = ''.join(letters_count)        
 

    return encoded_dna




if __name__ == '__main__':
    alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
    for i in range(10):
        dna = [choice(alphabet) for _ in range(randint(1,10))]
        dna_str = ''.join(dna)
        
        print(dna_str,'->',encode_dna(dna_str))

Вывод:

c -> c1
ffdcfbeg -> f2d1c1f1b1e1g1
fgfbebbcbb -> f1g1f1b1e1b2c1b2
ffefaedac -> f2e1f1a1e1d1a1c1
g -> g1
ecbcddf -> e1c1b1c1d2f1
b -> b1
f -> f1
ec -> e1c1
fgcgcg -> f1g1c1g1c1g1

Answer 2 · 2022-05-27 15:05:11

UPD

import re

s = "llldddrrrwwwwttttgggglllleeeeddddddddd"
f = re.findall(r"((\w)+?(?!\2))", s)
d = [w + "" + str(len(l)) for l, w in f]
print(s)
print(''.join(d))

и...

llldddrrrwwwwttttgggglllleeeeddddddddd
l3d3r3w4t4g4l4e4d9

Плохой вариант

s = "llldddrrrwwwwttttgggg"
d = {}

for i in s:
    d.setdefault(i, 0)
    d[i] += 1

g = [''.join(map(lambda i: str(i), item)) for item in d.items()]

print(s)
print(''.join(g))

и...

llldddrrrwwwwttttgggg
l3d3r3w4t4g4

Answer 3 · 2022-05-27 15:37:26

Александр Нестеров привёл решение на псевдокоде, но вопрос под тегом Питон... Дело в том, что питон не поощряет изменение входных строк в решениях такого рода.
Поэтому приведу своё решение перфекциониста=) Если кто укажет как его улучшить, буду рад=)
Возможно новичку применённые там трюки будут сложны в понимании или даже местами вредны, но точно познавательны.

import unittest
import typing

_VARIANTS = []  # Сюда попадут все решения, которые нужно тестировать
# А это декоратор, которым нужно пометить все претенденты на решение
solution = lambda f: _VARIANTS.append(f) or f

EXAMPLES = [
    ('', ''),
    ('a', 'a1'),
    ('abc', 'a1b1c1'),
    ('aaaabbca', 'a4b2c1a1'),
]


@solution
def encode(inp: str) -> str:
    """Самое простое решение
    Минусы: громоздко и многословно 
    (зато прозрачно и понятно, без магии и выкрутасов)
    """
    if not inp:
        return ''
    count = 1
    current = inp[0]
    res = []
    for c in inp[1:]:
        if c == current:
            count += 1
        else:
            res.append(f'{current}{count}')
            count = 1
            current = c
    
    res.append(f'{current}{count}')
    return ''.join(res)       


def encode_stream(inp: typing.TextIO) -> typing.Iterator:
    """Потоковое решение. 
    С помощью него можно без затрат памяти кодировать файлы любого размера
    Минусы: нет, если вам нужно закодировать гигабайты. 
    Ну или готов поспорить на эту тему, если вы не согласны.=)
    """
    current = inp.read(1)
    count = len(current)
    while current:
        c = inp.read(1)
        if c == current:
            count += 1
        else:
            yield f'{current}{count}'
            current = c
            count = len(current)


@solution
def encode_string_by_stream(inp: str) -> str:
    """Обёртка для использования потокового кодирования из строки"""
    import io
    return ''.join(encode_stream(io.StringIO(inp)))


@solution
def encode_elegant(s: str) -> str:
    """Довольно элегантное решение на словаре от @seven5674.
    К сожалению в оригинальном варианте неверное, но я 
    исправил и отрефакторил.
    Минусы: запутанное и непрозрчное, зато короткое"""
    d = {}
    g = 1
    for c in s:
        g = d.get((c, g), 0) and g or g + 1
        d[c, g] = d.get((c, g), 0) + 1

    return ''.join([f'{k[0]}{v}' for k, v in d.items()])


@solution
def encode_by_regexp(s: str) -> str:
    """Решение на регекспах от @seven5674, 
    я лишь чуть отформатировал и отрефакторил.
    Минусы: регексп поведёт себя довольно непредсказуемо на больших данных,
    к тому же регекспы читать умеют не все. 
    Но автор умеет в регекспы лучше, чем в питон, видимо с js пришел.
    """
    import re
    return ''.join(
        f'{w}{len(l)}' 
        for l, w in 
        re.findall(r"((\w)+?(?!\2))", s)
    )
    

#############################################################################
## Дальше идёт инфраструктура для тестирования решений
    
class Test(unittest.TestCase):
    """Автоматический тест решений.
    Претенденты на решение должны быть помечены декоратором @solution
    Примеры берутся из списка EXAMPLES.
    """

    def closure(func, arg, res):
        """Временная функция, которая делает тест.
        Она формирует каждый раз новую функуию-замыкание, которая будет тестировать
        оережной кейс.
        """
        def test(self):
            f"""Тест функции {func.__name__}({arg!r})"""
            self.assertEqual(func(arg), res, msg=f'Func {func.__name__}({arg!r})')
        return test
    
    # Перебираем все варианты реализаций:
    for f in _VARIANTS:
        # Перебираем все предлженные эталонные римеры:
        for case_num, case in enumerate(EXAMPLES):
            # Создаём новую функуию теста и добавляем ее в класс теста как метод.
            locals()[f'test_{f.__name__}__{case_num}'] = closure(f, *case)

    # Удаляем из контекста класса лишние переменные
    del(closure, f, case_num, case)


if __name__ == '__main__':
    unittest.main(verbosity=3)

UPD: Обновил код, включив туда решения seven5674 и valerr007
Кстати, решение valerr007 проваливает тест с "a" на входе. Возвращает пустую строку. Ну и много претензий к коду.

Answer 4 · 2022-05-27 17:53:28

a = input("Input: ").lower()
def f(a):
    b = []
    count = 1
    for i in range(1,len(a)):

        if i == len(a)-1:
            if a[i]!= a[i-1]:
                b.extend([a[i-1],str(count),a[i],str(1)])
            else:
                count += 1
                b.extend([a[i],str(count)])

        elif a[i-1] == a[i]:
            count += 1
            continue

        elif a[i] != a[i-1]:
            b.extend([a[i-1],str(count)])
            count = 1

    print("".join(b))

f(a)

Необходимо решить задачу для курса и понять в чем ошибка моего кода и мышления?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт