手绘数据
在二维平面上绘制数据。可以绘制单个数据点,或使用笔刷绘制更大的数据集。
输出:
数据:坐标系中绘制的数据集
该组件用于创建数据集,创建方式是平面坐标系中手动绘制数据。数据可以以数据点的方式逐个绘制,也可以使用笔刷,以批量的方式喷刷绘制。
功能:
1.给坐标轴命名并选择一个分类来绘制数据实例。可以添加或删除分类。可以只使用一个分类来创建无分类、无监督的数据集。
2.绘图工具。组件支持在平面坐标系中逐个绘制或喷刷绘制数据、选择并移动数据点、将数据稀疏化或密集化,并且支持设置笔刷的半径和密度。
3.重置为输入数据集。
4.以.svg或.png格式将坐标图像保存到本地。
5.生成报表。
6.勾选“自动发送”可将改动自动应用到其他组件,或者点击“发送”手动应用。
示例:
手绘数据是一个学习和探索数据挖掘概念的有效工具。在下面的示例中,我们绘制了一个包含4个分类的数据集,用于演示k均值聚类和层次聚类模型。在下图中,我们看到k均值方法总体上比层次聚类方法的聚类效果要好。K均值可以返回一个表示聚类效果的得分排名,其中得分最高的一项表示最有可能的集群数。然而,层次聚类并不能将正确的分类聚集在一起。