Как заполнить таблицу sql, из файла csv используя cursor.execute?

Question

Denis @denislysenko

data engineer

MySQL

Как заполнить таблицу sql, из файла csv используя cursor.execute?

import mysql.connector
from mysql.connector import Error
import re
import csv


def create_connection(host_name, user_name, user_password, db_name):
    connection = None
    try:
        connection = mysql.connector.connect(
            host=host_name,
            user=user_name,
            passwd=user_password,
            database=db_name
        )
        print("Connection to MySQL DB successful")
    except Error as e:
        print(f"The error '{e}' occurred")

    return connection

def create_table(connection, sql_script_path):
    with connection.cursor() as cursor:
        with open(sql_script_path) as file:
            script = file.read()
            cursor.execute(script)
        connection.commit()


def fill_table_with_movies(connection, movies_csv_file, sql_script_path):
        for movie_id, title, genres in  movies_csv_file[1302:]:
            if re.search(r'\(\d{4}\)', title) is not None:
                year = re.search(r'\(\d{4}\)', title)
                a = year.group(0)[1:-1]
                int_year = int(a)
            else:
                int_year = 0

            title = title.replace("'", '`')
            title = title.replace('"', '`')

            with connection.cursor() as cursor:
                with open(sql_script_path) as file:
                    filling_script = file.read()
                    cursor.execute(filling_script.format(int(movie_id), title[:-6], int_year))
                connection.commit()


def read_movies_file():
    data_m = []
    with open('./files/csv/movies.csv', encoding='utf-8') as file:
        reader = csv.reader(file, delimiter=',')
        for row in reader:
            data_m.append(row)
    data_movies = data_m[1:]
    return data_movies


# read ratings.csv
def read_rating_file():
    data_r = []
    with open('./files/csv/ratings.csv', encoding='utf-8') as file:
        reader = csv.reader(file, delimiter=',')
        for row in reader:
            data_r.append(row)
    data_rating = data_r[1:]
    return data_rating







def main():
    #create_connection_and_create_database("localhost", "root", "12345678", './files/sql/CREATE_DATABASE_movies_db.sql')
    connection = create_connection("localhost", "root", "12345678", 'movies_db')
    #create_table(connection, './files/sql/USE_DATABASE_movies_db.sql')
    #create_table(connection, './files/sql/CREATE_TABLE_movies.sql')
    #create_table(connection, './files/sql/CREATE_TABLE_rating.sql')
    #create_table(connection, './files/sql/CREATE_TABLE_genres.sql')
    data_movies = read_movies_file()
    data_rating = read_rating_file()
    fill_table_with_movies(connection, data_movies, './files/sql/FILL_MOVIES_TABLE.sql')


main()

когда запускаю файл питона, то в воркбенче эта таблица заполняется только до 1301 строки, но в этом файле 10 000 строк и мне нужно импортировать все эти 10 000 строк в таблицу movies

Почему данные ипортируются только до 1301 строки? Как это исправить?

вот как выглядит запрос на создание таблицы movies:

CREATE TABLE movies (
movie_id        INT,
title           VARCHAR(256),
year            INT,
PRIMARY KEY     (movie_id)
);

вот как выглядит запрос на на добавление данных в таблицу movies:

INSERT   IGNORE   INTO      movies     (movie_id, title, year)
VALUES                                 ({}, '{}', {})

Вот как выглядит сроки рядом с 1301 строкой в csv файле:
1298,Pink Floyd: The Wall (1982),Drama|Musical
1299,"Killing Fields, The (1984)",Drama|War
1300,My Life as a Dog (Mitt liv som hund) (1985),Comedy|Drama
1301,Forbidden Planet (1956),Drama|Sci-Fi
1302,Field of Dreams (1989),Children|Drama|Fantasy
1303,"Man Who Would Be King, The (1975)",Adventure|Drama
1304,Butch Cassidy and the Sundance Kid (1969),Action|Western
1305,"Paris, Texas (1984)",Drama|Romance

Вопрос задан более трёх лет назад
312 просмотров

9 комментариев

Подписаться 1 Средний 9 комментариев

Slava Rozhnev @rozhnev Куратор тега MySQL

Попробуйте удалить проблемную строку и снова повторить импорт

Написано более трёх лет назад
Ипатьев @ipatiev

Самый большой проблемой QA сайтов являются вопросы "Как сделать ххх?", в которых дальше идёт подробный код, который, собственно, это ххх и делает
И что отвечать на такой вопрос - совершенно непонятно.

Написано более трёх лет назад
Denis @denislysenko Автор вопроса

Slava Rozhnev, удалил с 1300 по 1302 строки

теперь конец таблицы выглядит так:
'1297','Real Genius ','1985'
'1298','Pink Floyd: The Wall ','1982'
'1299','Killing Fields, The ','1984'
'1303','Man Who Would Be King, The ','1975'
'1304','Butch Cassidy and the Sundance Kid ','1969'

Написано более трёх лет назад
Akina @Akina

Код в принципе не учитывает, что внутри названия бывает запятая? 1299, 1303, 1305...

Написано более трёх лет назад
Denis @denislysenko Автор вопроса

Akina, нет

Написано более трёх лет назад
AVKor @AVKor

Зачем это всё надо было городить, если CSV-файл можно загружать в таблицу с помощью LOAD DATA LOCAL INFILE...

Написано более трёх лет назад
galaxy @galaxy

denislysenko, а посмотреть сам не пробовал, почему не загружается?
Ошибка при INSERT? Или из csv грузится только 1301 строка?

Написано более трёх лет назад

Denis @denislysenko Автор вопроса

galaxy, так и не решил эту проблему.
из csv файла загружается в таблицу movies только 1301 строка

я немного переписал код

import pymysql
from pymysql.constants import CLIENT
import csv
import re


def create_connection_to_server_and_create_db(host, user, passwd, sql_script_path):
    try:
        connection = pymysql.connect(
            host = host,
            user = user,
            passwd = passwd,
            client_flag = CLIENT.MULTI_STATEMENTS
        )
        try:
            with connection.cursor() as cursor:
                with open(sql_script_path) as file:
                    script = file.read()
                    cursor.execute(script)
            connection.commit()
            print('db was create')
        except Error as e:
            print(f"The error '{e}' occurred")
    except Error as e:
        print(f"The error '{e}' occurred")

def get_connection_to_db(host, user, passwd, db_name):
    connection = None
    try:
        connection = pymysql.connect(
            host = host,
            user = user,
            passwd = passwd,
            database = db_name,
            client_flag = CLIENT.MULTI_STATEMENTS
        )
        print('Connection to MySQl_db successful')
    except Error as e:
        print(f"The error '{e}' occurred")

    return connection

def create_table(connection, sql_script_path):
    try:
        with connection.cursor() as cursor:
            with open(sql_script_path) as file:
                script = file.read()
                cursor.execute(script)
            connection.commit()
    except Error as e:
        print(f"The error '{e}' occurred")

def get_list_from_csv_file(csv_file_path):
    data = []
    with open(csv_file_path, encoding='utf-8') as file:
        reader = csv.reader(file, delimiter=',')
        for row in reader:
            data.append(row)
    result_data = data[1:]
    return result_data

def fill_movies_table(connection, movies_data, sql_script_path):
        for movie_id, title, genres in movies_data:
            if re.search(r'\(\d{4}\)', title) is not None:
                search_year = re.search(r'\(\d{4}\)', title)
                result_year = search_year.group(0)[1:-1]
                year = int(result_year)
            else:
                year = 0
            title = title.replace("'", '`')
            title = title.replace('"', '`')

            with connection.cursor() as cursor:
                with open(sql_script_path) as file:
                    script = file.read()
                    cursor.execute(script.format(int(movie_id), title[:-6], int(year), genres))
                connection.commit()




def main():
    create_connection_to_server_and_create_db('localhost', 'root', '12345678', './files/sql/CREATE_DATABASE_my_movies_db.sql')
    connection = get_connection_to_db('localhost', 'root', '12345678', 'my_movies_db')
    create_table(connection, './files/sql/CREATE_TABLE_movies.sql')
    create_table(connection, './files/sql/CREATE_TABLE_rating.sql')
    movies = get_list_from_csv_file('./files/csv/movies.csv')
    rating = get_list_from_csv_file('./files/csv/ratings.csv')
    fill_movies_table(connection, movies, './files/sql/FILL_MOVIES_TABLE.sql')



main()

Написано более трёх лет назад

galaxy @galaxy

denislysenko, вопрос был в другом: из cvs файла грузятся не все записи? Т.е. лажает функция get_list_from_csv_file?
Или запись в БД останавливается на 1301? Почему останавливается - ошибка должна же быть?
Сделай print() в нужных местах, проверьте.
Уберите, кстати, IGNORE - к чему оно тут? У вас что, есть повторяющиеся movie_id?

И мелкий момент: зачем в fill_movies_table постоянно открывать и перечитывать файл sql_script_path? Зачем курсор каждый раз запрашивать и делать commit()? Все это можно вынести за пределы цикла.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Средний
Как одновременно сделать две записи в разных таблицах в Laravel?
- 1 подписчик
- 27 июл.
- 141 просмотр
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 178 просмотров
1

ответ
Linux

+2 ещё

Простой
Как запустить mysql после ошибки?
- 1 подписчик
- 22 июл.
- 152 просмотра
3

ответа
MySQL

Простой
Какое отставание MySQL Slave от MySQL master считать проблемным?
- 1 подписчик
- 21 июл.
- 143 просмотра
2

ответа
MySQL

Простой
MYSQL --skip-grant-tables?
- 1 подписчик
- 04 июл.
- 91 просмотр
1

ответ
JavaScript

+2 ещё

Простой
Как использовать js плагин mysql в сборке gulp?
- 1 подписчик
- 20 июн.
- 166 просмотров
1

ответ
MySQL

+1 ещё

Средний
MySQL/MariaDB. 10 vs 11 version. Индексы. Странное поведение?
- 5 подписчиков
- 01 июн.
- 3877 просмотров
0

ответов
MySQL

Простой
Возможно ли сделать такие запросы-замены в таблице?
- 1 подписчик
- 26 мая
- 170 просмотров
1

ответ
MySQL

Простой
MySQL как получить ID родительского поля у которого в разных строках есть значение?
- 1 подписчик
- 24 мая
- 110 просмотров
0

ответов
MySQL

+1 ещё

Простой
Как предотвратить поломку базы данных XAMPP?
- 1 подписчик
- 11 мая
- 162 просмотра
0

ответов
Показать ещё Загружается…

DBA в команду базовой инфраструктуры

SMALL

от 2 000 до 4 500 $

Fullstack Developer

Айдис • Сергиев Посад

от 100 000 ₽

PHP-разработчик

Wanted

До 300 000 ₽

Попробуйте удалить проблемную строку и снова повторить импорт
Самый большой проблемой QA сайтов являются вопросы "Как сделать ххх?", в которых дальше идёт подробный код, который, собственно, это ххх и делает
И что отвечать на такой вопрос - совершенно непонятно.
Slava Rozhnev, удалил с 1300 по 1302 строки

теперь конец таблицы выглядит так:
'1297','Real Genius ','1985'
'1298','Pink Floyd: The Wall ','1982'
'1299','Killing Fields, The ','1984'
'1303','Man Who Would Be King, The ','1975'
'1304','Butch Cassidy and the Sundance Kid ','1969'
Код в принципе не учитывает, что внутри названия бывает запятая? 1299, 1303, 1305...
Зачем это всё надо было городить, если CSV-файл можно загружать в таблицу с помощью LOAD DATA LOCAL INFILE...
denislysenko, а посмотреть сам не пробовал, почему не загружается?
Ошибка при INSERT? Или из csv грузится только 1301 строка?
denislysenko, вопрос был в другом: из cvs файла грузятся не все записи? Т.е. лажает функция get_list_from_csv_file?
Или запись в БД останавливается на 1301? Почему останавливается - ошибка должна же быть?
Сделай print() в нужных местах, проверьте.
Уберите, кстати, IGNORE - к чему оно тут? У вас что, есть повторяющиеся movie_id?

И мелкий момент: зачем в fill_movies_table постоянно открывать и перечитывать файл sql_script_path? Зачем курсор каждый раз запрашивать и делать commit()? Все это можно вынести за пределы цикла.

Как заполнить таблицу sql, из файла csv используя cursor.execute?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт