*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据采集 | URL、页面标题、页面正文、作者、发布时间、网站分类、关键词、外链等 |
2 | 数据清洗 | HTML标签去除、特殊字符去除、停用词过滤、去噪处理、词性标注等 |
3 | 分词 | 分词结果、词频统计、词性分析、同义词映射、词云生成等 |
4 | 词向量 | 文本向量化、TF:IDF、Word2Vec、GloVe、FastText等 |
5 | 文本分类 | 分类标签、分类结果、模型评估指标、准确率、召回率、F1值等 |
6 | 文本聚类 | 聚类结果、聚类中心、聚类效果指标、簇间距离、簇内距离等 |
7 | 关键词提取 | 关键词列表、权重值、关键词摘要、关键词权重排序等 |
8 | 文本摘要 | 摘要结果、关键句提取、摘要长度控制、摘要评估指标等 |
9 | 情感分析 | 情感极性判断、正负向情感指数、情感分类标签、情感评分等 |
10 | 实体识别 | 人物姓名、地名识别、机构名识别、时间识别、数字识别等 |
11 | 关系提取 | 实体关系抽取、关系类型、关系强弱程度、关系可视化等 |
12 | 文本可视化 | 词云图、主题图、情感分布图、聚类图、关系图等 |
13 | 文本对比 | 文本相似度、比较结果、相似度阈值、比较指标等 |
14 | 自动摘录 | 自动摘录结果、摘录长度控制、摘录评估指标、自动标注等 |
15 | 文本索引 | 倒排索引、全文索引、关键词索引、相似度检索、高亮显示等 |
16 | 文本监控 | 新闻舆情监控、竞争对手监控、品牌监控、监控指标、报警通知等 |
17 | 自动标注 | 实体标注、情感标注、分类标注、自动标注算法等 |
18 | 模型训练 | 数据集准备、特征工程、模型选择、模型训练、参数调优等 |
19 | 模型验证 | 测试数据集、验证指标、ROC曲线、混淆矩阵、模型可解释性等 |
20 | 模型部署 | 模型上线、API接口、模型版本管理、模型性能监控、模型更新等 |