Signed-off-by: hsiatein <12955678+hsiatein@user.noreply.gitee.com>
This commit is contained in:
hsiatein
2023-07-16 02:20:50 +00:00
committed by Gitee
parent bb9c641835
commit 82e8ed2858
@@ -0,0 +1,24 @@
本项目由第三组成员共同完成
文件夹"大作业"包含了数据集, 数据集的处理, 模型的建立, 模型调用的方法,可视化,模型文件等
文件夹"flask预测"为前端, 用于面向用户使用
文件夹"可视化图片"为可视化程序的运行结果
下面依次介绍
大作业:
最初只有数据集job.csv
然后分双路线:
路线1:用数据集完成可视化vis.py(此程序已停用) → 用数据集完成可视化painting.py(最终采用的可视化程序), 同时fuli.txt也在此阶段生成(中间产物),生成九张图片
路线2:预处理数据集world.py, 得到job_clean.csv, train.csv → 为了更准确的模型, 增加了更多的预处理部分(比较相关系数确定参数种类等)dataop2.py, 得到train_q.csv, 这个数据集特征比train.csv多一维 → 程序training.py用数据集train.csv训练线性回归模型 → 程序BaggingReg.py用数据集train_q.csv训练Bagging回归模型和AdaBoost回归模型, 将模型保存为了BaggingReg1.pkl, BaggingReg2.pkl, AdaBoostReg1.pkl, AdaBoostReg2.pkl → 将使用模型的方法写入了model_using.py
flask预测:
BaggingReg1.pkl, BaggingReg2.pkl, AdaBoostReg1.pkl, AdaBoostReg2.pkl为上面训练好的模型, app.py为客户端入口, 运行后点击控制台输出的地址即可进入网页, templates为网页模板
可视化图片:
大作业的可视化部分生成的图片
note代码演示:
用jupyter notebook展示代码及其运行结果
pdf代码演示:
同上, 只不过转成pdf格式