Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

Question

Demigodd @Demigodd

Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

<body>
  <p>Content</p>
   ...Content...
<body>

Так получаю весь контент в виде текста

new_content = nokogiri_content.at('body').children.text

Но пробельные символы остаються.
Правильнее ли так будет, если да то как убрать пробельные символы ?

Вопрос задан более трёх лет назад
107 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Code Basics

Ruby для начинающих

1 месяц

Далее
Хекслет

Разработчик на Ruby on Rails

5 месяцев

Далее
Skillbox

Ruby on Rails с нуля

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+3 ещё

Средний
Как локально установить плагин для vagrant?
- 1 подписчик
- 22 мая
- 138 просмотров
0

ответов
PostgreSQL

+1 ещё

Средний
Как исправить ошибки Postgres deadlock в Minitest?
- 1 подписчик
- более года назад
- 87 просмотров
2

ответа
Bootstrap

+1 ещё

Простой
Почему не обводит окошко красным при ошибке?
- 1 подписчик
- более года назад
- 67 просмотров
1

ответ
Ruby

Простой
Как скомпилировать программу Ruby?
- 3 подписчика
- более года назад
- 219 просмотров
1

ответ
Ruby on Rails

Средний
Почему не отображает картинку?
- 1 подписчик
- более года назад
- 68 просмотров
0

ответов
Ruby on Rails

+1 ещё

Простой
Почему не работает дебаггер rubymine?
- 1 подписчик
- более года назад
- 51 просмотр
0

ответов
Ruby on Rails

+1 ещё

Простой
Почему сохраняется часть данных, если есть сообщение об ошибке?
- 1 подписчик
- более года назад
- 55 просмотров
1

ответ
Ruby

+2 ещё

Средний
Как эффективно читать сжатый лог файл с S3 бакета в Ruby?
- 1 подписчик
- более года назад
- 107 просмотров
1

ответ
Ubuntu

+2 ещё

Средний
Почему не работает на сервере подключение по SMTP?
- 1 подписчик
- более года назад
- 249 просмотров
2

ответа
Ruby on Rails

Простой
Как перенести проект с базой данных с одного компа на другой?
- 1 подписчик
- более года назад
- 108 просмотров
2

ответа
Показать ещё Загружается…

Frontend Developer/ Vue.js

DevTeam.Space • Москва

от 1 000 до 3 000 $

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2020-04-29 14:13:24

Сокращать пробелы, увы, не входит в функции Nokogiri, можно убрать стартовые пробелы регуляркой
new_content.gsub(/^ +/, "")

Но в целом, это не совсем нормальный способ, так как в тексте вам будут сыпаться не только пробелы, но и контент, который обычно не обрабатывается как текст. Обработка html с помощью Nokogiri предполагает более прицельные действия, например извлечение необходимых тегов и текста из них:

require 'open-uri'
require 'nokogiri'

url = 'https://ru.wikipedia.org/wiki/Ruby'
doc = Nokogiri::HTML(open(url))

text = ''
doc.css('p,h1').each do |e|
  text << e.content
end

puts text

Как с помощью Nokogiri правильно получить весь контент в body и преобразовать его в текст?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт