分布图
用图形展示某一个属性的值的分布情况。
输入:
数据:输入数据集
输出:
所选数据:在分布图中选中的实例
数据:输出数据中增加了一个附加列“selected”,显示数据被选中的条件
分布图组件用来显示每个离散或连续属性的值的分布情况。如果数据包含类目型变量,则分布可能会以分类为条件。
对于离散型变量,箱线图显示每个属性值在数据集中出现的次数(例如,在多少个实例中出现)。如果数据包含类目型变量,则可以选择按不同的类将分布图进行拆分。
功能:
1.分布变量列表显示。
2.滑动来设置条形的间隔宽度。选择拟合分布。
3.选择列的拆分依据。
4.选择是否勾选显示概率。
5.当“自动应用”为启动状态时,所有更改都将自动传送到其他窗口组件。
6.生成报表。
对于连续型变量,属性值也可以显示为分布图。可以将各种分布拟合为数据,下图的示例中使用了鸢尾花数据集。
对于没有类目型变量的数据集,分布图的条形显示为蓝色,下图的示例中使用的是波士顿房价数据集。