打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python爬虫练习:爬取800多所大学学校排名、星级等

前言

国内大学最新排名,北大反超,浙大仅第四,中科大跌至第八

时隔五年,“双一流”大学即将迎来首次大考,这也是继改变高校评断标准之后,第一次即将以官方对外发布,自然是引来了许多人的关注。最近,有许多不同机构发布的国内高校排名,但彼此之间的差异很大,网友之间的争议也很大。

私信小编01即可获取大量Python学习资料

项目目标

爬取高三网大学排名,并保存

目标网址

http://m.gaosan.com/gaokao/265440.html

基本环境配置

  • python 3.6 pycharm

爬虫代码

导入工具

import requestsimport parselimport csv

请求网页数据

url = 'http://m.gaosan.com/gaokao/265440.html'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)response.encoding = response.apparent_encoding

爬取数据

selector = parsel.Selector(response.text)trs = selector.css('#page tr')for tr in trs:    dit = {}    ranking = tr.css('td:nth-child(1)::text').get()    dit['名次'] = ranking    school = tr.css('td:nth-child(2)::text').get()    dit['学校名称'] = school    score = tr.css('td:nth-child(3)::text').get()    dit['综合得分'] = score    star = tr.css('td:nth-child(4)::text').get()    dit['星级排名'] = star    level = tr.css('td:nth-child(5)::text').get()    dit['办学层次'] = level    csv_writer.writerow(dit)

保存数据

f = open('排名.csv', mode='a', encoding='utf-8', newline='')csv_writer = csv.DictWriter(f, fieldnames=['名次', '学校名称', '综合得分', '星级排名', '办学层次'])f.close()

运行代码,效果如下图

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
一个1000元的爬虫外包项目,三种爬虫模式给你轻松做出来
Python采集当当得图书畅销榜书籍信息数据保存csv
Python Scrapy中文教程,Scrapy框架快速入门!
实战|手把手教你用Python爬虫(附详细源码)
5行Python代码就能让你的电脑 “永不息屏”?
Python爬虫新手入门教学(四):爬取前程无忧招聘信息
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服