@Yonghwa
121

Простейший парсинг на питоне?

What is up, программач.

Вот, собственно, код:

from urllib import request
goog_url = "http://real-chart.finance.yahoo.com/table.csv?s=GOOGL.BA&d=9&e=15&f=2015&g=d&a=8&b=26&c=2011&ignore=.csv"

def download_csv_file (csv_file):
    response = request.urlopen(csv_file)
    csv = response.read()
    csv_str = str(csv)
    lines = csv_str.split("\\n")
    dest_url = r'goog.csv'
    fx = open(dest_url,'w')

    for line in lines:
        fx.write(line + "\n")
    fx.close()

download_csv_file(goog_url)


-Что означает аргумент у split?не могу найти в документации подобного параметра.
-Что означает символ 'r' в этой строке "dest_url = r'goog.csv' "
  • Вопрос задан
  • 492 просмотра
Решения вопроса 1
valerium
@valerium
Изобретая велосипед
.split() — это метода строкового объекта, разбивает строку по заданному символу или набору символов, возвращает список строк.

Префикс r означает, что внути строки нужно игнорировать экранирование, использовать её «как есть» (сокращение от raw). В данном конкретном случае она ни на что не влияет.
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
@Nerevar_soul
split это строковый метод. Разделяет строку по заданному разделителю.
r - обозначение raw string.
Вообщем надо смотреть документацию по строкам.
Ответ написан
Комментировать
un1t
@un1t
Ответ написан
Комментировать
@lPolar
data scientist
Для парсинга csv лучше всего использовать pandas:
import pandas as pd
goog_url = "http://real-chart.finance.yahoo.com/table.csv?s=GOOGL.BA&d=9&e=15&f=2015&g=d&a=8&b=26&c=2011&ignore=.csv"
data = pd.read_csv(goog_url)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы