基本信息
源码名称:豆瓣热门电影爬取
源码大小:1.82KB
文件格式:.py
开发语言:Python
更新时间:2020-08-28
友情提示:(无需注册或充值,赞助后即可获取资源下载链接)
嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元×
微信扫码支付:2 元
×
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
源码介绍
爬取的电影数据保存到 如下excel中了
import requests # 引用requests模块 import openpyxl headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'} a = int(input("请输入你想爬的页数:")) b = input("请输入你想看的电影类型(热门, 最新, 经典, 豆瓣高分, 动作, 喜剧, 爱情, 科幻, 悬疑, 恐怖):") wb = openpyxl.Workbook() #创建工作薄 sheet = wb.active #获取工作薄的活动表 sheet.title = '热门电影' #工作表重命名 column_name = ['影名','URL','id','评分'] sheet.append(column_name) def movies(pages,type): for i in range(0,pages): url = 'https://movie.douban.com/j/search_subjects' param = {'type': 'movie', 'tag': type, 'sort': 'recommend', 'page_limit': '20', 'page_start': i*20} # print(param) res_movie = requests.get(url,params=param,headers=headers) # 调用get方法,下载电影列表 json_movie = res_movie.json() # 使用json()方法,将response对象,转为列表/字典 # print(json_movie) list_movies = json_movie['subjects'] # 一层一层地取字典,获取电影名称 for comment in list_movies: # list_movies,comment是它里面的元素 name = comment['title'] # 电影名名称 movie_url = comment['url'] ID = comment['id'] scores = comment['rate'] sheet.append([name,movie_url, ID,scores]) # 把name、album、time、link和geci写成列表,用append函数多行写入Excel movies(a, b) wb.save( '热门电影.xlsx') wb.close() open( '热门电影.xlsx')