遇到这个问题很多次了,下面是解决方法
网页本身是utf-8,但我们爬取网页时用的是
Unicode,但使用print()打印时,里面的内容应该是GBK编码,那么就需要我们将需要打印的数据后加上 .encode('GBK’,'ignore’).decode('GBk’)
第一个GBK是忽略掉非法字符,然后再译码
例如:
print(需要打印的数据.encode('GBK’,'ignore’).
decode('GBK’))
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。