获得详细情况页具体内容。详细情况页主要分成两部分:基础信息和其他信息。因为不同信息种类会有不一样的小标题,因此提取内容时,用if先进行判断有无该小标题,若有,则将内容赋值,若无,则将该小标题赋空值,预防由于没办法找到该小标题,从而影响整页文书的爬取。 基础信息都在fullJudgement下面,直接提取出来即可,并放入Basic_Information列表中。
其他信息是在fullJudgement下面的paragraphs下面,所以要先将paragraphs提取出来,再一一将它他小标题提取出来,再放入document_body列表中。