品牌型号:微软 surface pro7
系统:Windows 10 64位专业版
软件版本:JMP 18
在数据分析的过程中,可能因为抽样误差或实验误差导致收集到的数据集合中存在一些重复项和异常点,删除重复项和处理异常点就是数据清洗的关键步骤,那么如何删除重复项和处理异常点呢?下面就来为大家详细介绍一下JMP怎么删除重复项,JMP怎么删除异常点的详细步骤。
一、JMP怎么删除重复项
重复项是指数据中被重复记录的数据,删除重复项可以提升数据质量,避免分析结果因为重复项出现偏差,同时可以减少数据集合的大小,在数据处理和建模中将会耗费更少的时间,更可以避免影响模型的决策,下面就来为大家介绍有关删除重复项的具体操作。
JMP无直接删除重复项功能,需先检查重复项,再导出至Excel处理。
1、检查数据的重复项:在菜单栏选择【列】-【列管理器】。

2、通过对比唯一值数和实际数据,就可以知道数据中是否存在重复项。

3、依次点击【文件】,【另存为】,在保存类型中选择【Excel工作簿】。

4、在Excel工作簿,依次点击【数据】,【重复项】,【删除重复项】。

5、将处理后的数据重新导入JMP。
二、JMP怎么删除异常点
异常点通常是指远离主体分布的极端数值,或是说不符合预期和趋势的数据点,又或是由于测量错误,数据录入错误,或是罕见的抽样错误引起的,在JMP软件中,我们可以先通过图表找到异常值之后,手动对于异常点进行删除。
1、导入数据,打开数据表。
2、在菜单栏中选择【图形】-【图形生成器】。

3、将需要分析的数据拖动到Y轴,选择箱型图的选项,可以很明显的看出哪些点属于异常点。

4、在图中,可以对异常值点进行编辑和标记,但是在删除异常点的过程中,我们一定要注意分析异常点产生的原因,有些异常点或许在实验中还是需要保留,盲目删去异常点会影响实验准确程度。
5、如果觉得上面对于异常点的观察不是很明显,也可以通过点击鼠标右键,在出现的菜单栏中选择【添加】-【箱线图】,在此之外的就是异常点。

重复项和异常点的处理是我们提高模型准确性的重要指标,可以帮助我们发现录入数据时会产生的错误,让我们能更好的进行数据分析和可视化操作,以上便是有关JMP怎么删除重复项,JMP怎么删除异常点的全部内容,希望可以帮助到大家。