@lPolar
data scientist

Как быстро портировать .csv в Oracle?

Всем привет!
Вопрос - какие есть инструменты по увеличению производительности RODBC/Pandas+Sqlalchemy для отправки .csv файлов в Oracle?
Допустим, в Python это выглядит так:
import pandas as pd
from sqlalchemy import create_engine
e = create_engine("oracle://user:pass@DB")
df = pd.read_csv("data.csv")
df.to_sql("data",e)

А вот так - в R:
library(RODBC)
conn = odbcConnect("dsn","user","pass")
tab = read.csv("data.csv")
sqlSave(conn,tab,"data",fast=TRUE)

Однако и то и другое работает достаточно медленно - таблица в 100к строк и 120 столбцов грузится в pandas - 20 минут, в R - 20 минут.
Есть какие-нибудь возможности по увеличению производительности?
  • Вопрос задан
  • 3234 просмотра
Пригласить эксперта
Ответы на вопрос 1
@protven
Пользуйтесь инструментами, которые вам предоставляет сам Oracle. В данном случае оптимально воспользоваться утилитой SQL*Loader.
По моему опыту, если не будет никаких блокировок на таблицу и БД работает на относительно быстром сервере,100к строк должно вставиться за 2-4 минуты.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 нояб. 2024, в 08:04
1 руб./за проект
22 нояб. 2024, в 06:06
1500 руб./в час
22 нояб. 2024, в 06:04
1 руб./за проект