【自动化应用】🌟3分钟学会数据预测, 数据挖掘机器学习算法(线性回归/随机森林/XGBoost)
创作者俱乐部成员
📢一.应用介绍
💡 | 基于影刀、Python、机器学习算法的一款应用, 通过对历史数据的深度挖掘和多种模型的计算, 对目标进行预测, 以帮助用户对数据进行更深入的分析, 为决策和运营提供有力支持 |
❓二.可以做什么?
💡 |
(该应用是基础的数据预测模型, 可扩展的方向: 对各种指标进行预测, 例如用户意愿, 用户评价, 高质量用户画像, 风险评估, 岗位薪资, 股票期货走势, 成绩预测) |
📌三.获取应用
• 1.自助领取, 同意给作者叠甲后, 才能获取应用: 1.自助领取_良心协议
• 2. 填写后,点击以下链接,使用手机号获取应用: 2.自助领取_获取应用
作者会通过多维表记录该应用能够帮助多少人, 成功获取后在文章内获取模型
❗四.怎么使用?
1.生成模型
1.1准备历史数据
准备好足够多的历史数据, 特征和目标的值都必须是数字, 另存为csv文件
确保数据具有一定的代表性和完整性, 以便模型能够学习到有效的规律.
WPS另存为时选择图中标红选项
1.2清洗数据
删补数据:尽量删除0/空值/错误值的数据,
根据实际情况, 可考虑用中位数,平均数, 众数代替.
1.3生成模型
登录影刀, 找到应用, 点击运行, 根据提示操作
示例过程:
依次选择训练-线性回归-清洗后的csv文件-在第一行写入特征和目标的字段名-模型导出文件夹
*第一次运行应用会初始化环境, 只需要等待即可.
1.4查看模型
在导出文件夹中, 会看到模型文件
生成了该文件就行, 不用动它.
*记住导出文件夹的路径
2.预测收益
2.1准备预测数据
新建表格, 可以是csv、xls或xlsx格式, 在表格中写入需要预测的数据, 注意必须包含四.1.3中填写的特征字段名, 值必须为数字.
*记住该表格所在文件路径
2.2导入模型和预测数据
登录影刀, 找到应用, 点击运行, 根据提示操作
示例过程:
依次选择预测-线性回归-模型所在的文件夹(1.3选择的文件夹路径)-预测数据文件(2.1中记住的文件路径)
2.3打开结果
在预测数据所在的文件夹中, 有一个*预测结果*的文件, 打开文件, 最后一列会多出一个字段[预测]