基本信息
源码名称:pycaret数据挖掘实践
源码大小:4.02KB
文件格式:.py
开发语言:Python
更新时间:2021-02-04
   友情提示:(无需注册或充值,赞助后即可获取资源下载链接)

     嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300

本次赞助数额为: 2 元 
   源码介绍
pycaret数据挖掘实践

# 初始化配置 (在Notebook环境内)
clf1 = setup(data, target='is_canceled',train_size = 0.7,silent=True)
# 初始化配置 (在 Notebook 环境外)
#clf1 = setup(data, target = 'target-variable', html = False)
# 初始化配置 (在 Kaggle / GitHub actions / CI-CD 管道等远程执行)
#clf1 = setup(data, target = 'target-variable', html = False, silent = True)
#自动提取特征 自动填补缺失值
#best=compare_models()
#print('best is ')
#print(best)
#--- 输出特征字段的重要占比
#print(best.feature_importances_)
best = create_model('catboost')

test_input='hotel_bookings_test.csv'

ct1=best
pred_holdout = predict_model(ct1)
test_data=get_testdata('test_data')
pred_test_data = predict_model(ct1,data=test_data)
y_pred = pred_test_data[['Label','Score']]
print(y_pred.head())