Есть готовое регулярное выражение, которое работает так, как показано на рисунке, однако при написании того же выражения в C# оно выводит весь текст первой строки
Код на C#:
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
string pattern = @"(?<=\s)\d(\.|-(\d))\s.*" + surname + @".*\d";
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
foreach (Match match in Regex.Matches(currentText, pattern, RegexOptions.IgnoreCase))
{
for (int i = 0; i < match.Groups.Count; i++)
resultText += match.Value + "\n";
}
text.Append(resultText);
}
P.S. Уже читал об этом тут
https://qna.habr.com/q/703268, однако это не помогло