根据所有的class为rc的标签的长度,生成新的XPath并定位、点击,即跳转至亚马逊商品页面。
# for X in range () 是前开后闭,所以需要len_all_rc + 1 才能循环len_all_rc次。for i in range(1, len_all_rc + 1):
# 拼接新的XPathxpath = "//*[@id='rso']/div/div/div["+str(i)+"]/div/div/h3/a"# 根据XPath定位搜索结果的标题,并点击
driver.find_element_by_xpath(xpath).click()
返回亚马逊商品页面源码。
pageSource = driver.page_source
如果“Currently unavailable.”在页面源码中,即可确定是为僵尸链接。则在控制台打印该商品链接。
if 'Currently unavailable.' in pageSource:
print(driver.current_url)