@murkamax

Как с помощью jsoup достать текст из div?

Для проекта нужно как то записать в переменную типа string название предмета, для работы с этой переменной.

<div id="lesson" 
	title="Лекция" 
	data-lesson-comment="" 
	data-lesson-id="342" 
	data-lesson-duration="2" 
	data-teacher-id="32" 
	data-curriculum-id="8892" 
	data-lesson-type="0" 
	data-corpus-id="2" 
	data-cabinet-id="72"
	data-group-id="404" 
        data-undergroup="0" 
	style="background-color:#e5ffd5; text-shadow: #E6E6E6 0px 1px;">
		<span class="ldur">
			<span>
					2ч
			</span>
		</span>
	Астрономия
		<span class="ugn">
		</span>
		<br>
			Лекция
		<br>Крестниковская Е.А.
</div>


Нужен текст "Астрономия"

В моём проекте данный html код находится путем парсинга сайта
где находится методом
doc = Jsoup.connect("rating.ivpek.ru/timetable/timetable/show?gid=404&d...").get();
Elements alltable = doc.getElementsByTag("div");

String x = alltable.get(5).text(); //пятый элемент нужный html

Данный код выдаст следующее:

2чАстрономия Лекция Крестниковская Е.А.

Нужно только "Астрономия"
  • Вопрос задан
  • 241 просмотр
Пригласить эксперта
Ответы на вопрос 2
al_gon
@al_gon
public static void main(String[] args) {
		String html = "<div id=\"lesson\" \n" +
				"  title=\"Лекция\" \n" +
				"  data-lesson-comment=\"\" \n" +
				"  data-lesson-id=\"342\" \n" +
				"  data-lesson-duration=\"2\" \n" +
				"  data-teacher-id=\"32\" \n" +
				"  data-curriculum-id=\"8892\" \n" +
				"  data-lesson-type=\"0\" \n" +
				"  data-corpus-id=\"2\" \n" +
				"  data-cabinet-id=\"72\"\n" +
				"  data-group-id=\"404\" \n" +
				"        data-undergroup=\"0\" \n" +
				"  style=\"background-color:#e5ffd5; text-shadow: #E6E6E6 0px 1px;\">\n" +
				"    <span class=\"ldur\">\n" +
				"      <span>\n" +
				"          2ч\n" +
				"      </span>\n" +
				"    </span>\n" +
				"  Астрономия\n" +
				"    <span class=\"ugn\">\n" +
				"    </span>\n" +
				"    <br>\n" +
				"      Лекция\n" +
				"    <br>Крестниковская Е.А.\n" +
				"</div>";
		Document document = Jsoup.parse(html);
		System.out.println((document.select("div").textNodes().get(1)));
	}
Ответ написан
@murkamax Автор вопроса
В моём проекте данный html код находится путем парсинга сайта
где находится методом

doc = Jsoup.connect("http://rating.ivpek.ru/timetable/timetable/show?gid=404&date=2022-12-10").get();
     Elements alltable = doc.getElementsByTag("div");

     String x = alltable.get(5).text();   //пятый элемент нужный html


Данный код выдаст следующее:

2чАстрономия Лекция Крестниковская Е.А.

Нужно только "Астрономия"
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы