嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元微信扫码支付:2 元
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
pycaret数据挖掘实践
# 初始化配置 (在Notebook环境内)
clf1 = setup(data, target='is_canceled',train_size = 0.7,silent=True)
# 初始化配置 (在 Notebook 环境外)
#clf1 = setup(data, target = 'target-variable', html = False)
# 初始化配置 (在 Kaggle / GitHub actions / CI-CD 管道等远程执行)
#clf1 = setup(data, target = 'target-variable', html = False, silent = True)
#自动提取特征 自动填补缺失值
#best=compare_models()
#print('best is ')
#print(best)
#--- 输出特征字段的重要占比
#print(best.feature_importances_)
best = create_model('catboost')
test_input='hotel_bookings_test.csv'
ct1=best
pred_holdout = predict_model(ct1)
test_data=get_testdata('test_data')
pred_test_data = predict_model(ct1,data=test_data)
y_pred = pred_test_data[['Label','Score']]
print(y_pred.head())