文件
从输入文件中读取属性值数据。
输入:
通过导入文件来获取属性值的数据
输出:
数据,即来自文件的数据集
“文件”组件的功能是读取输入文件的数据,并将数据集发送到输出端。并且可以保存最近打开文件的历史记录。该组件还包括一个目录,其中包含预先安装了蓝鲸的实例数据集。
该组件支持导入多种格式的文件,包括Excel工作表(.xlsx)、文本文档(.txt)、逗号分隔值文件(.csv)或从URL地址读取数据等等。
功能:
1.浏览之前打开过的数据文件,或加载任意示例文件。
2.浏览数据文件。
3.导入来自URL地址的数据。
4.展示数据集的详细信息,包括数据集大小,数据集所包含特征的数量和类型。
5.数据集中的特征具有附加信息,并且可以通过双击特征来编辑。用户可以更改属性名称,设置属性的变量类型(分类型、数值型、文本型、日期时间型),并进一步定义属性(特征变量、目标变量或元变量)。用户还可以设置忽略某些属性。
6.浏览文档数据集。
7.生成报表。
示例:
大多数数据挖掘工作流可能都是从“文件”组件开始的。在下面这个示例中,该组件的作用是读取文件中的数据并将其发送到“数据表格”和“箱线图”组件。