基本信息
源码名称:豆瓣热门电影爬取
源码大小:1.82KB
文件格式:.py
开发语言:Python
更新时间:2020-08-28
   友情提示:(无需注册或充值,赞助后即可获取资源下载链接)

     嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300

本次赞助数额为: 2 元 
   源码介绍

爬取的电影数据保存到 如下excel中了

import requests        # 引用requests模块
import openpyxl

headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36'}

a = int(input("请输入你想爬的页数:"))
b = input("请输入你想看的电影类型(热门, 最新, 经典,  豆瓣高分, 动作, 喜剧, 爱情, 科幻, 悬疑, 恐怖):")

wb = openpyxl.Workbook()                 #创建工作薄
sheet = wb.active                        #获取工作薄的活动表
sheet.title = '热门电影'             #工作表重命名
column_name = ['影名','URL','id','评分']
sheet.append(column_name)
def movies(pages,type):
    for i in range(0,pages):
        url = 'https://movie.douban.com/j/search_subjects'
        param = {'type': 'movie',
                'tag': type,
                'sort': 'recommend',
                'page_limit': '20',
                'page_start': i*20}
        # print(param)
        res_movie = requests.get(url,params=param,headers=headers)    # 调用get方法,下载电影列表
        json_movie = res_movie.json()                        # 使用json()方法,将response对象,转为列表/字典
         # print(json_movie)

        list_movies = json_movie['subjects']   # 一层一层地取字典,获取电影名称
        for comment in list_movies:            # list_movies,comment是它里面的元素
            name = comment['title']            # 电影名名称
            movie_url = comment['url']
            ID = comment['id']
            scores = comment['rate']
            sheet.append([name,movie_url, ID,scores])
            # 把name、album、time、link和geci写成列表,用append函数多行写入Excel
movies(a, b)
wb.save( '热门电影.xlsx')
wb.close()

open( '热门电影.xlsx')