Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

Question

Demigodd @Demigodd

Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

<body>
  <p>Content</p>
   ...Content...
<body>

Так получаю весь контент в виде текста

new_content = nokogiri_content.at('body').children.text

Но пробельные символы остаються.
Правильнее ли так будет, если да то как убрать пробельные символы ?

Вопрос задан более трёх лет назад
112 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Ruby on Rails с нуля

10 месяцев

Далее
Code Basics

Ruby для начинающих

1 месяц

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+3 ещё

Средний
Как локально установить плагин для vagrant?
- 1 подписчик
- более года назад
- 180 просмотров
0

ответов
PostgreSQL

+1 ещё

Средний
Как исправить ошибки Postgres deadlock в Minitest?
- 1 подписчик
- более года назад
- 113 просмотров
2

ответа
Bootstrap

+1 ещё

Простой
Почему не обводит окошко красным при ошибке?
- 1 подписчик
- более года назад
- 77 просмотров
1

ответ
Ruby

Простой
Как скомпилировать программу Ruby?
- 3 подписчика
- более двух лет назад
- 266 просмотров
1

ответ
Ruby on Rails

Средний
Почему не отображает картинку?
- 1 подписчик
- более двух лет назад
- 79 просмотров
0

ответов
Ruby on Rails

+1 ещё

Простой
Почему не работает дебаггер rubymine?
- 1 подписчик
- более двух лет назад
- 61 просмотр
0

ответов
Ruby on Rails

+1 ещё

Простой
Почему сохраняется часть данных, если есть сообщение об ошибке?
- 1 подписчик
- более двух лет назад
- 66 просмотров
1

ответ
Ruby

+2 ещё

Средний
Как эффективно читать сжатый лог файл с S3 бакета в Ruby?
- 1 подписчик
- более двух лет назад
- 122 просмотра
1

ответ
Ubuntu

+2 ещё

Средний
Почему не работает на сервере подключение по SMTP?
- 1 подписчик
- более двух лет назад
- 304 просмотра
1

ответ
Ruby on Rails

Простой
Как перенести проект с базой данных с одного компа на другой?
- 1 подписчик
- более двух лет назад
- 122 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-04-29 14:13:24

Сокращать пробелы, увы, не входит в функции Nokogiri, можно убрать стартовые пробелы регуляркой
new_content.gsub(/^ +/, "")

Но в целом, это не совсем нормальный способ, так как в тексте вам будут сыпаться не только пробелы, но и контент, который обычно не обрабатывается как текст. Обработка html с помощью Nokogiri предполагает более прицельные действия, например извлечение необходимых тегов и текста из них:

require 'open-uri'
require 'nokogiri'

url = 'https://ru.wikipedia.org/wiki/Ruby'
doc = Nokogiri::HTML(open(url))

text = ''
doc.css('p,h1').each do |e|
  text << e.content
end

puts text

Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт