Как при помощи powershell сравнить 2 csv файла и записать из разницу в 3-й?

Question

Z-RoVeR @Z-RoVeR

Как при помощи powershell сравнить 2 csv файла и записать из разницу в 3-й?

Есть 2 csv файла с более чем 3к строк. Структура столбцов у них одинаковая, каждом есть столбцы Name, Surname, Email, Phone и т.д.
Интересует сравнение этих файлов только по столбцу Email и запись не дублирующихся строк в 3-й(желательно с маркировкой в каком файле этот email присутствует, а в каком нет.)
Я очень долго танцевал с Compare-Object, но так и не добился результата. Может что сталкивался с подобной задачей?

Вопрос задан более трёх лет назад
2452 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по информационной безопасности

11 месяцев

Далее
Stepik

Профессия "Инженер технической поддержки" - ваш старт в IT

4 недели

Далее
GB (GeekBrains)

Профессия Специалист по кибербезопасности 2.0

12 месяцев

Далее

Решения вопроса 1

9 комментариев

Z-RoVeR @Z-RoVeR Автор вопроса

Изначально скрипт ругался на пустое значение -Append и я его удалил.
Так же изменил разделители на ";"
Получилось:
if(test-path c:\tmp\unique_emails.csv){remove-item c:\tmp\unique_emails.csv -force}
$1csv = Import-Csv C:\tmp\mail_old.csv -Delimiter ";"
$2csv = Import-Csv C:\tmp\mail_new.csv -Delimiter ";"
foreach ($line in $1csv){if($2csv -notmatch $line.email){$line | export-csv -notypeinformation -delimiter ";" -path c:\tmp\unique_emails.csv}}

В итоге скрипт отрабатывает без ошибок но:
1) Файл "unique_emails.csv" показывает только одну строку с отличием, при чём ту что была последней в файле "mail_old.csv".
2) Все русские имена и фамилии превратились в знаки вопроса.

Написано более трёх лет назад
azarij @azarij

1 случается из-за отсутствия -append ключа. у него нет значения, он там только для того, чтобы указать команде, что нужно добавлять строки в файл, а не перезаписывать его одной строкой на каждом проходе цикла.
2. попробуйте обновить повершелл до 5.1 ($psversiontable) если он старый. попробуйте ввести ключ -encoding в команду export-csv.

Написано более трёх лет назад
Z-RoVeR @Z-RoVeR Автор вопроса

azarij, Сделал исправления: добавил -append -encoding и обновил версию ps.

if(test-path c:\tmp\unique_emails.csv){remove-item c:\tmp\unique_emails.csv -force}
$1csv = Import-Csv C:\tmp\mail_old.csv -Delimiter ";"
$2csv = Import-Csv C:\tmp\mail_new.csv -Delimiter ";"
foreach ($line in $1csv){if($2csv -notmatch $line.email){$line | export-csv -notypeinformation -encoding unicode -delimiter ";" -path c:\tmp\unique_emails.csv -Append}}

Проблема с Кириллицей решилась, но после добавления ключа -append, другая проблема изменилась. Теперь файл unique_emails.csv точная копия файла "mail_old.csv", даже вес файла в КБ одинаковый.
Верхняя строчка обоих файлов:

"Name";"Surname";"Phone";"DisplayName";"Email"

Не знаю имеет ли значение, но один и тот же email может находится на совершенно разных строчках файлов. Т.е. например user@email.ru может находится на 10 строчке файла "mail_old.csv", а в файле "mail_new.csv" он может находится на 2000-й строчке.

Написано более трёх лет назад
azarij @azarij

странно. ладно. натравите скрипт на следующие два файла:

1.csv
"name";"email";"phone"
"ak";"ak@ak.com";"0123456"
"kb";"kb@kb.com";"98543221"
"akk";"akk@akk.com";"0123456"
"kak";"kak@kak.com";"98543221"
"aak";"aak@aak.com";"0123456"
"kka";"kka@kka.com";"98543221"
"aka";"aka@aka.com";"0123456"
"kakk";"kakk@kakk.com";"98543221"

2.csv
"name";"email";"phone"
"ak";"ak@ak.com";"0123456"
"kb";"kb@kb.com";"98543221"
"akkk";"akkk@akkk.com";"0123456"
"kakk";"kakk@kakk.com";"98543221"
"aakk";"aakk@aakk.com";"0123456"
"kkak";"kkak@kkak.com";"98543221"
"akak";"akak@akak.com";"0123456"
"kakkk";"kakkk@kakkk.com";"98543221"

в результирующем файле должны быть все строки, кроме тех двух, что совпадают в обоих файлах.
и я бы все таки посмотрел в сторону compare-object. с ним не так сложно разобраться.

Написано более трёх лет назад
Z-RoVeR @Z-RoVeR Автор вопроса

azarij,
Опять копия первого файла:
"name";"email";"phone"
"ak";"ak@ak.com";"0123456"
"kb";"kb@kb.com";"98543221"
"akk";"akk@akk.com";"0123456"
"kak";"kak@kak.com";"98543221"
"aak";"aak@aak.com";"0123456"
"kka";"kka@kka.com";"98543221"
"aka";"aka@aka.com";"0123456"
"kakk";"kakk@kakk.com";"98543221"

с Compare-Object я ковырялся, но так и не заставил его работать.

Написано более трёх лет назад
azarij @azarij

ладно. а под ковром? ;)

if(test-path c:\tmp\unique_emails.csv){remove-item c:\tmp\unique_emails.csv -force}
$1csv = Import-Csv C:\tmp\mail_old.csv -Delimiter ";"
foreach ($line in $1csv){if((get-content C:\tmp\mail_new.csv -raw) -notmatch $line.email){$line | export-csv -notypeinformation -encoding unicode -delimiter ";" -path c:\tmp\unique_emails.csv -Append}}

Написано более трёх лет назад
Z-RoVeR @Z-RoVeR Автор вопроса

azarij,
Заработало!
Правда этот скрипт показывает только адреса которое есть в *_old, но нет в *_new.
Придется наверно дублировать скрипт меняя местами файлы чтобы получить 2 списка с полной разницей :)

Написано более трёх лет назад

azarij @azarij

либо так, либо:

Compare-Object $1csv $2csv -Property email -PassThru (как написали в другом ответе):

PS C:\Users\user> Compare-Object $1csv $2csv -Property email -PassThru

name  email           phone    SideIndicator
----  -----           -----    -------------
akkk  akkk@akkk.com   0123456  =>           
aakk  aakk@aakk.com   0123456  =>           
kkak  kkak@kkak.com   98543221 =>           
akak  akak@akak.com   0123456  =>           
kakkk kakkk@kakkk.com 98543221 =>           
gb    akk@akk.com     0123456  <=           
kak   kak@kak.com     98543221 <=           
aak   aak@aak.com     0123456  <=           
kka   kka@kka.com     98543221 <=           
aka   aka@aka.com     0123456  <=

Написано более трёх лет назад

Z-RoVeR @Z-RoVeR Автор вопроса

azarij, Я пробовал этим способом, вывод там небольшой, многих ящиков нет.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PowerShell

+2 ещё

Средний
Как найти что блокирует пользователя анализируя логи Exchange?
- 1 подписчик
- 07 июл.
- 92 просмотра
3

ответа
PowerShell

Средний
Первую букву каждой строки заглавной?
- 2 подписчика
- 29 мая
- 311 просмотров
2

ответа
PowerShell

Средний
PowerShell 5.1. Навсегда изменить стандартное кодирование выхода PowerShell на UTF-8?
- 1 подписчик
- 11 апр.
- 232 просмотра
3

ответа
Windows

+2 ещё

Простой
Как в Powershell переопределить обработку квадратных скобок в путях?
- 1 подписчик
- 06 мар.
- 275 просмотров
1

ответ
PowerShell

+1 ещё

Простой
Как подружить Robocopy со смонтированным webdav диском в powershell?
- 2 подписчика
- 05 мар.
- 243 просмотра
1

ответ
Windows

+1 ещё

Простой
Как переопределить стандартную папку запуска Powershell?
- 5 подписчиков
- 24 февр.
- 655 просмотров
2

ответа
PowerShell

Простой
Как обработать ошибки send-mailmessage (try-catch)?
- 1 подписчик
- 27 янв.
- 117 просмотров
3

ответа
CSV

+1 ещё

Простой
Как перевести большие CSV файлы через ИИ?
- 1 подписчик
- 27 нояб. 2025
- 264 просмотра
2

ответа
cmd/bat

+1 ещё

Простой
Как запустить команды в свеже запушенной CMD через PowerShell?
- 1 подписчик
- 12 нояб. 2025
- 340 просмотров
3

ответа
Windows

+1 ещё

Простой
Висят процессы powershell, кто их использует?
- 1 подписчик
- 05 нояб. 2025
- 491 просмотр
4

ответа
Показать ещё Загружается…

Answer 1 · 2018-08-28 20:30:39

if(test-path c:\test\unique_emails.csv){remove-item c:\test\unique_emails.csv -force}
$1csv = Import-Csv C:\test\1.csv -Delimiter "`t"
$2csv = Import-Csv C:\test\2.csv -Delimiter "`t"
foreach ($line in $1csv){if($2csv -notmatch $line.email){$line | export-csv -notypeinformation -delimiter "`t" -path c:\test\unique_emails.csv -Append}}

1.csv
name email phone
ak ak@ak.com 0123456
kb kb@kb.com 98543221
akk akk@akk.com 0123456
kak kak@kak.com 98543221
aak aak@aak.com 0123456
kka kka@kka.com 98543221
aka aka@aka.com 0123456
kakk kakk@kakk.com 98543221

2.csv
name email phone
ak ak@ak.com 0123456
kb kb@kb.com 98543221
akkk akkk@akkk.com 0123456
kakk kakk@kakk.com 98543221
aakk aakk@aakk.com 0123456
kkak kkak@kkak.com 98543221
akak akak@akak.com 0123456
kakkk kakkk@kakkk.com 98543221

в цсв файлах все разделено табами

Answer 2 · 2018-08-30 04:48:39

forspamonly2 @forspamonly2

compare-object (Import-Csv 1.csv) (Import-Csv 2.csv) -Property "email" -PassThru

Ответ написан более трёх лет назад

Комментировать

Как при помощи powershell сравнить 2 csv файла и записать из разницу в 3-й?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт