diff --git a/1、人才招聘数据分析/第3组-夏添/人才招募/Readme.txt b/1、人才招聘数据分析/第3组-夏添/人才招募/Readme.txt new file mode 100644 index 0000000..f9c03cf --- /dev/null +++ b/1、人才招聘数据分析/第3组-夏添/人才招募/Readme.txt @@ -0,0 +1,24 @@ +本项目由第三组成员共同完成 + +文件夹"大作业"包含了数据集, 数据集的处理, 模型的建立, 模型调用的方法,可视化,模型文件等 +文件夹"flask预测"为前端, 用于面向用户使用 +文件夹"可视化图片"为可视化程序的运行结果 +下面依次介绍 + +大作业: +最初只有数据集job.csv +然后分双路线: +路线1:用数据集完成可视化vis.py(此程序已停用) → 用数据集完成可视化painting.py(最终采用的可视化程序), 同时fuli.txt也在此阶段生成(中间产物),生成九张图片 +路线2:预处理数据集world.py, 得到job_clean.csv, train.csv → 为了更准确的模型, 增加了更多的预处理部分(比较相关系数确定参数种类等)dataop2.py, 得到train_q.csv, 这个数据集特征比train.csv多一维 → 程序training.py用数据集train.csv训练线性回归模型 → 程序BaggingReg.py用数据集train_q.csv训练Bagging回归模型和AdaBoost回归模型, 将模型保存为了BaggingReg1.pkl, BaggingReg2.pkl, AdaBoostReg1.pkl, AdaBoostReg2.pkl → 将使用模型的方法写入了model_using.py + +flask预测: +BaggingReg1.pkl, BaggingReg2.pkl, AdaBoostReg1.pkl, AdaBoostReg2.pkl为上面训练好的模型, app.py为客户端入口, 运行后点击控制台输出的地址即可进入网页, templates为网页模板 + +可视化图片: +大作业的可视化部分生成的图片 + +note代码演示: +用jupyter notebook展示代码及其运行结果 + +pdf代码演示: +同上, 只不过转成pdf格式 \ No newline at end of file