基本信息
源码名称:python 获取新浪网新闻链接
源码大小:0.71KB
文件格式:.py
开发语言:Python
更新时间:2017-09-14
友情提示:(无需注册或充值,赞助后即可获取资源下载链接)
嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元×
微信扫码支付:2 元
×
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
源码介绍
通过python BS 模块获取新浪新闻 链接,
如果您的python版本较高(>=python 3.3),那么请按照如下注释
#reload(sys)
#sys.setdefaultencoding("utf-8")
import imp
imp.reload(sys)
抓取结果保存在sinonews.txt中,如下:
#coding = 'utf-8'
import requests
from bs4 import BeautifulSoup
import sys
#reload(sys)
#sys.setdefaultencoding("utf-8")
import imp
imp.reload(sys)
url = "http://news.sina.com.cn/china/"
res = requests.get(url)
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text, "html.parser")
elements = soup.select('.news-item')
fname = "sinanews.txt"
try:
f = open(fname, 'w')
for element in elements:
if len(element.select('h2')) > 0:
f.write(element.select('.time')[0].text)
f.write(element.select('h2')[0].text)
f.write(element.select('a')[0]['href'])
f.write('\n\n')
f.close()
except Exception as e:
print(e)
else:
pass
finally:
pass