频繁项集
在数据中查找频繁项集。
输入:
数据:数据集(数据集中实例和变量的数量)
输出:
匹配数据:符合条件的数据实例(根据选择的项目集来确定输出实例和变量的数量)
频繁项集组件根据对规则的支持程度来查找数据集中的频繁项。
功能:
1.数据集的信息。“全部展开”会显示所有项集的,而“全部折叠”是只展示单项目集的支持度。
2. 在“查找项目集”中,可以为项目集搜索设置条件。
- “最小支持度”包含生成项目集的数据实例的最小比例,对于大型数据集,通常设置较低的最小支持度;
- “最大项集数”限制生成的项目集的最大数量。项目集的生成没有特定的顺序。如果勾选了“自动查找项集”,则组件将在每次参数更改时运行搜索。对于大型数据集,最好是在相关参数设置好后,再手动点击“查找项集”。
3.筛选项集。通过正则表达式可以筛选特定的项目或项目集。用逗号或空格分割的正则表达式列表,可以筛选多个项目或项目集。
- 包含。“包含”后面的空格中填入正确格式的正则表达式,以逗号或空格隔开多个正则表达式。
- 最小项目数。项目集中包含的最小项目数。
- 最大项目数。项目集中包含的最大项目数。如果勾选了“在搜索中应用这些筛选器”,频繁项集组件将实时过滤结果;否则将不考虑“筛选项集”中的选项内容。对于大型数据集,建议不要勾选。
4.如果勾选了“自动发送所选内容”,更改后信息将自动传递;否则,需要手动按“发送所选内容”。
示例:
频繁项集可以直接与其他组件一起使用。