我在做网络爬虫爬网页的时候,怎样获取网页的关键词?HTML中keywords的内容?需要通过PHP代码获取吗?
发送http请求获取返回网页内容,然后就是调用xml类库,根据xpath等来解析对应的节点内容。
正则表达式,一般是在html的<head>的<meta>标签中