*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据清洗 | 缺失值处理、异常值处理、重复值处理、数据格式转换、数据标准化等 |
2 | 特征选择 | 皮尔逊相关系数、方差阈值、L1正则化、嵌入式方法、递归特征消除等 |
3 | 特征提取 | 主成分分析、线性判别分析、因子分析、独立成分分析、t:SNE降维等 |
4 | 特征工程 | 多项式特征、交叉特征、时间序列特征、文本特征、图像特征等 |
5 | 数据集划分 | 训练集、验证集、测试集、交叉验证集、时间序列划分等 |
6 | 数据平衡 | 过采样、欠采样、SMOTE、ADASYN、欠采样与过采样结合等 |
7 | 特征缩放 | 标准化、最大最小化、log转换、归一化、二值化等 |
8 | 特征编码 | 独热编码、二进制编码、标签编码、词袋模型、TF:IDF编码等 |
9 | 特征归一化 | 小数定标归一化、对数函数归一化等 |
10 | 特征重要性评估 | 方差分析、卡方检验、互信息、Lasso回归系数等 |