*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据清洗 | 缺失值处理、异常值检测、数据类型转换、数据归一化、数据标准化等 |
2 | 特征选择 | 方差选择法、相关系数法、卡方检验法、互信息法、嵌入法等 |
3 | 特征编码 | 独热编码、有序编码、标签编码、哈希编码、词袋编码等 |
4 | 特征降维 | 主成分分析、线性判别分析、t:SNE、LDA等 |
5 | 样本均衡 | 过采样、欠采样、SMOTE、ADASYN等 |
6 | 数据切分 | 训练集划分、验证集划分、测试集划分、k折交叉验证、时间序列切分等 |
7 | 特征缩放 | 最小:最大缩放、归一化、log变换、Box:Cox变换等 |
8 | 数据集合并 | 行合并、列合并、内连接、外连接、索引连接等 |
9 | 数据变换 | 平移、缩放、旋转、翻转、模糊等 |
10 | 数据采样 | 随机采样、分层采样、聚类采样、次序采样、分布采样等 |
11 | 数据归约 | 特征归约、样本归约、维度归约、数据剪枝、参数归约等 |
12 | 数据转换 | 数值转换、时间戳转换、文本转换、图像转换、音频转换等 |
13 | 特征分组 | 聚类分组、相关性分组、相似性分组、互信息分组、自定义分组等 |
14 | 数据预处理 | 一致性检查、重复值检查、数据格式化、缺失值填充、数据分布调整等 |
15 | 特征量化 | 离散化、连续化、中心化、标准化、聚类向量化等 |
16 | 文本处理 | 分词、去停用词、词干化、词性标注、n:gram等 |
17 | 图像处理 | 图像裁剪、图像旋转、图像缩放、图像滤波、图像增强等 |
18 | 时间序列处理 | 滑动平均、指数平滑、时间分解、时间聚合、时间平移等 |
19 | 异常检测 | 统计学方法、基于模型方法、基于聚类方法、基于距离方法、基于密度方法等 |
20 | 数据可视化 | 散点图、折线图、条形图、饼图、热力图等 |