变换列表

1.概述

本文描述了在创建数据多维数据集(ETL过程)时可以使用的转换。

在编辑数据多维数据集时,根据您当前的画布选择,可以从工具栏访问大多数转换。例如,插入一个加入变换,首先选择连接链接在两个已经连接的变换之间。

2.输入转换

变换 名字 描述 输入
数据立方体 数据立方体 此转换使用另一个数据多维数据集的输出作为输入,该输入是在将另一个数据多维数据集拖放到画布上时创建的。 N/A
数据输入 数据输入 引用包含用户输入数据的仓库数据存储区域。您可以使用Data Input转换从Dundas BI内部添加和修改数据。 N/A
manual-select 手动选择 输入SQL或MDX语句从数据连接器中进行选择,而不是将本地结构拖到画布上。 N/A
mdx-select MDX选择 拖放从OLAP多维数据集选择表格数据结果作为Dundas BI数据多维数据集的输入。 N/A
python Python数据生成器 通过使用Python编程语言编写脚本生成数据。 N/A
r-data-generator R数据生成器 通过使用R统计编程语言编写脚本生成数据。 N/A
sql select SQL Select 当从支持关系查询的数据连接器将结构拖到画布上时,将创建此转换。然后可以选择或取消选择要在数据多维数据集中使用的列,并可以为每个元素设置聚合器。检索数据时,这些设置将被转换成SQL语句并发送到数据源。 N/A
stored-procedure-select 存储过程选择 此转换允许您使用关系存储过程检索数据。当您将存储过程从Explore中的数据连接器拖到数据多维数据集画布时,它将自动创建。 N/A
tabular-select 表格选择 与SQL Select类似,当从支持表格数据(例如XML、CSV)的数据连接器将结构拖放到画布上时,会创建此转换。 N/A

3.常见的变换

变换 名字 描述 输入
总 将聚合函数应用于前一个转换的列,如SUM、AVG、COUNT、MIN和MAX。还允许为未聚合的列设置GROUP BY功能。 1
calculated-element 计算元素 通过提供表达式创建新列。表达式可以包含使用$columnName$表示法表示列的占位符,并使用MEDIAN和RATECHANGE等函数。 1
数据转换 数据转换 将列的数据类型更改为其他数据类型。例如,来自CSV文件的数据可能被识别为字符串,但已知它是整数。 1
过滤器 过滤器 过滤掉不符合配置条件/设置的行。例如,当不需要从数据源读取所有数据并且数据源不允许查询(例如XML)时,使用此转换。另一个示例用法是在ID列上放置一个过滤器,设置为Less Than,值为1000,这将导致只接收ID值小于1000的记录。可用的过滤操作符有:等于、不等于、大于、大于或等于、小于和小于或等于。 1
加入 加入 通过定义键和指定连接类型连接两个表。如果两个表之间存在关系,则自动创建链接,但如果需要,可以更改链接。如果要连接的转换的数据连接器是相同的,并且相应的数据提供程序支持连接,那么将生成一个优化的查询并将其发送到服务器。 2
查找 查找 将输入列中的数据与查找表中的列连接起来。 2
数学 数学 对数字输入列执行简单的数学函数,如Absolute、Ceiling和Square Root。 1
字符串 字符串 通过应用To Upper、To Lower、Substring、Trim、Left和Right等函数来操作数据表中的字符串列。 1
联盟 联盟 通过将列相互映射来组合来自多个输入结构的数据。如果结构来自相同的数据连接器,并且该数据提供程序支持联合语句,则将生成优化的查询并将其发送到服务器。 2+

4.其他的转换

变换 名字 描述 输入
copy-column 复制的元素 通过复制选定的输入列并将新列添加到输出中来创建新列。这可以在需要操作列但又希望保留原始列的情况下使用。 1
平json 平JSON Flatten JSON转换将包含JSON文本的数据行转换为每个值的单独列。 1
平xml 平XML Flatten XML转换将包含XML文本的数据行转换为每个值的单独列。 1
fuzzy-grouping 模糊分组 允许通过查看不同列的值之间的相似性对记录进行分组。可能出现拼写错误的两条记录可以组合在一起进行进一步分析,或者可以通过设置Output Top Level records Only来删除重复的记录。灵敏度可通过设置“概率阈值”进行设置和调整。 1
fuzzy-lookup 模糊查找 当两个表之间没有定义关系键字段时,从辅助表中搜索匹配记录。 2
合并列 合并 将多个列中的值合并为一个列。在一个列可能为空的完整外部连接之后,这可能很有用。 2+
null-replacement 零替代 当发现空值时,用用户指定的值替换输入数据。使用它来替代需要编写脚本的计算元素转换。 1
百分比采样 抽样比例 通过指定速率,此转换将读入前一个转换中的所有数据,并根据输入的速率乘以总记录计数生成一组随机索引,然后根据这些索引输出记录。 1
主 允许创建新列并将数据转置到新布局中。可以通过在列值上旋转输入数据来使结果更紧凑。 1
python Python的分析 使用Python编程语言编写脚本,对数据执行统计和预测分析。 1 +
r-language-analysis R语言分析 使用R编程语言编写脚本,对数据进行统计和预测分析。 1 +
排名 排名 允许为转换创建的新元素分配一个等级号。 1
record-sampling 记录采样 读入前一个转换中的所有数据,并根据输入的数字生成一组随机索引。然后根据这些索引输出记录。 1
消除重复的数据 删除重复的 通过对所有选择的输入列进行分组并将结果复制到输出中来删除重复的记录。 1
排序 排序 对多个列应用排序条件。数据将从前面的转换中读入,并根据选项进行排序。然后,它将数据输出到数据多维数据集中的下一个转换。如果前一个转换的数据提供程序支持排序,那么将生成一个优化的查询并将其发送到服务器。 1
自上而下地 上/下 设置关于数据如何排序和要返回多少记录的规则(Sort转换和Record Sampling转换的组合,没有随机生成)。 1
转置 转置 把列变成行,把行变成列。 1
透视 透视 将多个列合并为一个列(与Pivot相反)。它通过将单个记录中多个列的值扩展为单个列中具有相同值的多个记录,将结果扩展为更规范化的形式。 1

5.输出转换

变换 名字 描述 输入
处理结果 过程的结果 表示数据多维数据集(ETL过程)的最终输出或结果。此转换不进行任何数据处理,但它允许您配置度量和层次结构,这些度量和层次结构将对下游项目(如度量集)可用。 1

6.另请参阅

Dundas数据可视化公司
热维斯路400-15号
加拿大安大略省多伦多
M3C 1日元

北美:1.800.463.1492
国际:1.416.467.5100

登打士服务时间:
电话:美国东部时间周一至周五上午9点至下午6点
电子邮件:美国东部时间周一至周五上午7点至下午6点