Как удалить дубли в CSV по значению с отдельного столбика (PHP)?

Question

Gangg @Gangg

PHP
CSV

Как удалить дубли в CSV по значению с отдельного столбика (PHP)?

Помогите пожалуйста решить мою проблемку.

Есть CSV файл с таким содержимым:

17.12.15;01:11:57;Имя1;Фамилия1;RU;176.70.69.242;1;123;
18.12.15;05:45:43;Имя2;Фамилия2;RU;456.8.39.432;1;123;
18.12.15;09:24:32;Имя3;Фамилия3;RU;176.70.69.242;1;123;

В 6-м столбике встречаются дубли (выделил жирным).
Как мне почистить csv файл от подобных дублей?

То есть, задача следующая. Если встречаются две или больше строки с одинаковыми значениями в 6-м столбце то в файле нужно оставить только одну строку.

Заранее благодарен за помощь!

p.s Интересует вариант на PHP

Вопрос задан более трёх лет назад
1760 просмотров

2 комментария

Подписаться 1 Оценить 2 комментария

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как декодировать/закодировать спец символы в get запросе?
- 1 подписчик
- 2 часа назад
- 41 просмотр
1

ответ
PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- 16 дек.
- 272 просмотра
2

ответа
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 279 просмотров
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 240 просмотров
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 225 просмотров
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 175 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 154 просмотра
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 321 просмотр
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 292 просмотра
2

ответа
CSV

+1 ещё

Простой
Как перевести большие CSV файлы через ИИ?
- 1 подписчик
- 27 нояб.
- 138 просмотров
2

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Вы эти данные часом не из БД берете? Если из БД, то проще оттуда сразу готовые данные получать.
Евгений Вольф: нет не из базы данных. CSV файл результат работы парсера, но он не удаляет такие дубли.

Answer 1 · 2016-11-23 14:37:16

$ips = array(); //массив уникальных значений
... //тут код обработки, далее в цикле
$row_items = split(";",$row); //Разбиваем строку на массив
if (in_array($row_items[5], $ips)) { //Если уже есть в массиве
//удаляем строку
} else {
$ips[] = $row_items[5]; //добавляем значение в массив
}

Answer 2 · 2016-11-23 14:53:44

Я думаю, при таком раскладе (на основании комментариев выше), поступил бы примерно так:

$uniq_string = []; //Пустой массив уникальных значений
$uniq_column = 4; //Номер уникальной колонки
$data = file('file.csv'); //Получаем массив строк

$f = fopen('new_file.csv', 'w');
for($i = 0; $i < count($data); $i++) {
    $row_array = explode(';', $row[$i]);
    if (!in_array($row_array[$uniq_column], $uniq_string)
        $uniq_string[] = $row_array[$uniq_column];
        fwrite($f, $data[$i])
    }
}
fclose($f);

Как-то примерно так, код приблизительный и я его не тестировал, но думаю, мысль ясна... Мы переписываем файл оставляя только уникальные строки.

Answer 3 · 2016-11-23 18:53:42

Всем спасибо. Но я уже решил проблему свои костылем) Как всегда задам вопрос на форуме, а через пол часа приходит озарение)

Вот код, может кому пригодится)

$baseCSV = file('base.csv', FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);//Складываем строки из CSV файла в масив

 
foreach($baseCSV as $itemBaseCSV){
$arrLineCsv = explode(";", $itemBaseCSV);//Формируем масив из отдельной строки по разделителю ;
$arrUniqFinish[$arrLineCsv[0].";".$arrLineCsv[1].";".$arrLineCsv[2].";".$arrLineCsv[3].";".$arrLineCsv[4].";".$arrLineCsv[5].";".$arrLineCsv[6].";".$arrLineCsv[7]] = $arrLineCsv[5];//В новый масив забиваем всю строку как ключ, а елемент масива, по которому фильтруем на дубли, как значение          

}

 
$arrUniqFinish = array_unique($arrUniqFinish);//Фильтруем дубли с помощью функции array_unique.

foreach($arrUniqFinish as $keyArr => $valueArr){
$finishSavedCsv[] = $keyArr;//Забиваем в новый масив значения которые берем с ключей масива $arrUniqFinish, который в свою очередь уже чистый от дублей по признаку 5 столбца (счет от 0)

}

file_put_contents('base.csv', implode("\n", $finishSavedCsv))//Перезаписываем CSV файл с уникальными строками

Как удалить дубли в CSV по значению с отдельного столбика (PHP)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт