try:
from urllib.request import Request, urlopen # Python 3
except:
from urllib2 import Request, urlopen # Python 2
import os,re, base64
autors = {}
BROWSER = "Mozilla/5.0 Gecko/20100101 Firefox/36.0"
for i in range(123400000,123500000):
s="http://aaa.com/pic-%d"%i
autors[i] = re.findall(r'itemprop=\s?["\']?author["\']?\s?>(.+)<',urlopen(Request(s,None,{"User-Agent":BROWSER})).read())
А вообще регулярные выражения можно тестировать онлайн
https://regex101.com/#python
также рекомендую добавить случайные задержки, а то некоторые сайты могут перестать отдавать контент посчитав это ДДОС атакой.