区分 HTML 和 XML
网页不规范,有多个 标签,浏览器可以解析,但是 lxml 不可以解析。case:http://ggzyjy.quanzhou.gov.cn/govProcurement/govProcurementDetail.do?bltId=178813¢erId=-1
处理 html entity
区分 HTML 和 XML
网页不规范,有多个 标签,浏览器可以解析,但是 lxml 不可以解析。case:http://ggzyjy.quanzhou.gov.cn/govProcurement/govProcurementDetail.do?bltId=178813¢erId=-1
处理 html entity