豆瓣热门电影爬取 - A8源码实例

基本信息

源码名称：豆瓣热门电影爬取

源码大小：1.82KB

文件格式：.py

开发语言：Python

更新时间：2020-08-28

友情提示：（无需注册或充值，赞助后即可获取资源下载链接）

嘿，亲！知识可是无价之宝呢，但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下，绝对物超所值哦！如有下载和支付问题，请联系我们QQ(微信同号)：78630559

本次赞助数额为： 2 元　

源码介绍


	爬取的电影数据保存到 如下excel中了



	



	



	



	


import requests        # 引用requests模块
import openpyxl

headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'}

a = int(input("请输入你想爬的页数："))
b = input("请输入你想看的电影类型（热门, 最新, 经典,  豆瓣高分, 动作, 喜剧, 爱情, 科幻, 悬疑, 恐怖）：")

wb = openpyxl.Workbook()                 #创建工作薄
sheet = wb.active                        #获取工作薄的活动表
sheet.title = '热门电影'             #工作表重命名
column_name = ['影名','URL','id','评分']
sheet.append(column_name)
def movies(pages,type):
    for i in range(0,pages):
        url = 'https://movie.douban.com/j/search_subjects'
        param = {'type': 'movie',
                'tag': type,
                'sort': 'recommend',
                'page_limit': '20',
                'page_start': i*20}
        # print(param)
        res_movie = requests.get(url,params=param,headers=headers)    # 调用get方法，下载电影列表
        json_movie = res_movie.json()                        # 使用json()方法，将response对象，转为列表/字典
         # print(json_movie)

        list_movies = json_movie['subjects']   # 一层一层地取字典，获取电影名称
        for comment in list_movies:            # list_movies，comment是它里面的元素
            name = comment['title']            # 电影名名称
            movie_url = comment['url']
            ID = comment['id']
            scores = comment['rate']
            sheet.append([name,movie_url, ID,scores])
            # 把name、album、time、link和geci写成列表，用append函数多行写入Excel
movies(a, b)
wb.save( '热门电影.xlsx')
wb.close()

open( '热门电影.xlsx')