.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[0] orignalName: str = re.findall(r'<title>.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[1].split(' -')[0] translatedType: str = match.split('<div class="text_card text_fr txt_fr_right"><div class="type">')[1].split('</div>')[0] translatedInfo: str = convertMana(match.split('<div class="txt">')[1].split('</div>')[0]) #print(orignalName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo) output.writelines(orignalName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo + '\n') except IndexError: #Request probably gives multiple value print(response.url) output.close() exit(0) output = open('cardnames-fr-FR-missing.txt', 'a') #Show only missing lines for line in lines: #None complete line if line.endswith('||\n'): engName = line.split('|')[0] #Check already done with open('cardnames-fr-FR-missing.txt') as f: if engName in f.read(): continue response = requests.get(url + engName) #Founded if response.url.endswith(engName) == False and response.status_code == SUCCESS_STATUS: #print(counter, end='\r', flush=True) #Get brut chaos the data from web page try: match = re.search(re.compile('<div class="text_card text_fr txt_fr_right"><div class="type">.+?<\/div><div class="clear"><\/div><div class="cout (1|hide)">.+?<\/div><div class="clear"><\/div><div class="txt">.+?<\/div>(<div class="forc_end">|<\/div>)'), response.content.decode('utf-8').replace('\n', '')).group() #Split in different tags, interesting data translatedName: str = re.findall(r'<title>.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[0] translatedType: str = match.split('<div class="text_card text_fr txt_fr_right"><div class="type">')[1].split('</div>')[0] translatedInfo: str = convertMana(match.split('<div class="txt">')[1].split('</div>')[0]) #print(engName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo) output.writelines(engName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo + '\n') except IndexError: #Request probably gives multiple value print(response.url) except AttributeError: #Request probably gives multiple value print(response.url) except UnicodeDecodeError: #Request probably gives multiple value print(response.url) counter += 1 output.close() print('end: ', counter)

.+?<\/div>

<\/div>

.+?<\/div>

<\/div>

.+?<\/div>(

|<\/div>)'), response.content.decode('utf-8').replace('\n', '')).group() #Split in different tags, interesting data translatedName: str = re.findall(r'.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[0] orignalName: str = re.findall(r'<title>.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[1].split(' -')[0] translatedType: str = match.split('<div class="text_card text_fr txt_fr_right"><div class="type">')[1].split('</div>')[0] translatedInfo: str = convertMana(match.split('<div class="txt">')[1].split('</div>')[0]) #print(orignalName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo) output.writelines(orignalName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo + '\n') except IndexError: #Request probably gives multiple value print(response.url) output.close() exit(0) output = open('cardnames-fr-FR-missing.txt', 'a') #Show only missing lines for line in lines: #None complete line if line.endswith('||\n'): engName = line.split('|')[0] #Check already done with open('cardnames-fr-FR-missing.txt') as f: if engName in f.read(): continue response = requests.get(url + engName) #Founded if response.url.endswith(engName) == False and response.status_code == SUCCESS_STATUS: #print(counter, end='\r', flush=True) #Get brut chaos the data from web page try: match = re.search(re.compile('<div class="text_card text_fr txt_fr_right"><div class="type">.+?<\/div><div class="clear"><\/div><div class="cout (1|hide)">.+?<\/div><div class="clear"><\/div><div class="txt">.+?<\/div>(<div class="forc_end">|<\/div>)'), response.content.decode('utf-8').replace('\n', '')).group() #Split in different tags, interesting data translatedName: str = re.findall(r'<title>.+?<\/title>', response.content.decode('utf-8').replace('\n', ''))[0].split('<title>')[1].split(' -')[0] translatedType: str = match.split('<div class="text_card text_fr txt_fr_right"><div class="type">')[1].split('</div>')[0] translatedInfo: str = convertMana(match.split('<div class="txt">')[1].split('</div>')[0]) #print(engName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo) output.writelines(engName + '|' + translatedName + '|' + translatedType.replace(' ', '') + '|' + translatedInfo + '\n') except IndexError: #Request probably gives multiple value print(response.url) except AttributeError: #Request probably gives multiple value print(response.url) except UnicodeDecodeError: #Request probably gives multiple value print(response.url) counter += 1 output.close() print('end: ', counter)