如何提取该图中的页面上的所有courseid

img


如题
请问用XPATH如何提取页面中的所有courseid,因为用了各种方法都没有试成功

【以下回答由 GPT 生成】

使用XPath提取页面中的所有courseid,可以根据以下步骤进行:

  1. 首先,需要导入相应的模块:
from lxml import etree
import requests
  1. 接下来,我们需要使用requests库获取这个页面的HTML代码:
url = '' # 添加页面的URL
response = requests.get(url)
html = response.text
  1. 然后,我们可以使用lxml库的etree模块将HTML代码解析为可搜索的树状结构:
tree = etree.HTML(html)
  1. 然后,使用XPath表达式来提取所有的courseid。在这个例子中,可以使用以下XPath表达式:
courseids = tree.xpath('//div[@class="course"]/@courseid')
  1. 最后,打印出所有的courseid:
for courseid in courseids:
    print(courseid)

完整的代码如下:

from lxml import etree
import requests

url = '' # 添加页面的URL
response = requests.get(url)
html = response.text

tree = etree.HTML(html)
courseids = tree.xpath('//div[@class="course"]/@courseid')

for courseid in courseids:
    print(courseid)

请注意替换代码中的URL为你自己的页面URL。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^