Python парсер лога, выводит пустые строки в список по регулярному значению? почему?

Question

NOONE @Djam36

Python парсер лога, выводит пустые строки в список по регулярному значению? почему?

Привет всем, написал элементарный парсер мне нужно в файле найти 8853738406815367648 вот такие значений, состоящие из 19 символов, только цифры, регулярка простая, но почему-то выводит ещё и пустые значения вида [ ] как от них избавится? и ещё вопрос, как удалить дубликаты значений в списке которые туда попадают после того как лог я распарсил, спасибо за ответы.
Версия питона 2.7

from datetime import datetime
import re
from subprocess import Popen, PIPE
import subprocess
import shutil
Message = []
stroka = []
index= []

for line in open('X:\\fdf\\lol.txt', 'r').readlines():
    index = re.findall('\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d' , line)
    #print index
    stroka.append(index)
    
filter(lambda i: i != '', stroka)
print stroka

Вот пример вывода [], [], [], [], [], [], ['6306436101153673729'], ['1796074986052821275'], [], ['1796074986052821275'],

Вопрос задан более трёх лет назад
994 просмотра

2 комментария

Подписаться 2 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 192 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 487 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 474 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 272 просмотра
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 484 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 207 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 328 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 657 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 342 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2015-12-30 18:03:01

Если файл не слишком большой - можно прочитать его целиком:

with open(r'z:\test.txt') as f:
    print set(re.findall('\d{19}', f.read()))

Иначе - построчно:

with open(r'z:\test.txt') as f:
    print {item for line in f for item in re.findall('\d{19}', line)}

Answer 2 · 2016-04-28 12:38:06

Дам сам ответ на свой вопрос, это связанно из-за того что я читаю файл построчно
Исправление можно сделать следующим образом

for line in open('X:\\fdf\\lol.txt', 'r').readlines():
    index = re.findall('\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d\d' , line)
    #print index
    stroka.append(index)
    
filter(lambda i: i != '', stroka)
if stroka == []
pass
else:
print stroka

Answer 3 · 2015-10-24 20:40:06

Roman K @deliro

1) Жуть, а не регулярка. \d{19} не проще?
2) Множество (set) не может содержать дубликатов.

Ответ написан более трёх лет назад

2 комментария

Python парсер лога, выводит пустые строки в список по регулярному значению? почему?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт