@Arthaus25

Как вытащить из текста названия химических вещест?

Есть файлы отчётов Росгидромета «Об аварийном, экстремально высоком и высоком загрязнении окружающей среды,
а также радиационной обстановке на территории России в <месяц> <года> года» с 2008 по 2021 год.

Нужно вытащить оттуда место, превышение ПДК и название химического вещества.

Нужные абзацы примерно такие:
Случай высокого загрязнения (ВЗ)** атмосферного воздуха веществом 1 класса опасности - бенз(а)пиреном, был зарегистрирован в Архангельске (1 случай, 13 ПДКм.р.).

В апреле 2020 года на территории Российской Федерации случаи ЭВЗ поверхностных вод веществами 1-го и 2-го классов опасности (превышение ПДК** в 5 и
более раз) наблюдательной сетью Росгидромета были зарегистрированы 19 раз на 5 водных объектах (для сравнения: в апреле 2019 года – 5 раз на 4 водных объектах).


Slovnet и Navec выделяют только места и организации, а веществ («азотом нитритным») — нет. Можно ведь как-нибудь их вытащить?

4 мая в реке Зай (Бугульминский Зай, бассейн Камы) в 1 км ниже г. 
             LOC  LOC──────────────          LOC─                 
Бугульмы Республики Татарстан было зарегистрировано высокое 
         LOC─────────────────                               
загрязнение (ВЗ) речной воды азотом нитритным (12 ПДК). По данным ФГБУ
                                                                  ORG─
 «УГМС Республики Татарстан» Росгидромета, ВЗ было обусловлено 
───────────────────────────  ORG─────────  OR                  
поступлением в реку недостаточно очищенных сточных вод с очистных 
сооружений ООО «Водоканал» г. Бугульмы Республики Татарстан.
           ORG────────────             LOC─────────────────
  • Вопрос задан
  • 88 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
да, руками

или потренировать описанные вами пакеты
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы