端庄:从版块 2020.4.1 开动文爱 porn,当作 Creator,您还不错在 Web 上创建和裁剪经由。本教程是使用 Tableau Prep Builder 设想的,但也不错在 Web 上完成,不外有一些值得端庄的例外。
本教程先容 Tableau Prep 中的常见操作。您将使用 Tableau Prep 附带的样本数据集来演练为示例 Superstore 创建经由。本教程使用最新版块的 Tableau Prep Builder。要是您使用的所以前的版块,收尾可能会不同。
请在进行演练的过程中不雅看请示,真切了解 Tableau Prep 如何匡助您计帐和养息数据以进行分析。
若要在不竭本教程之前装配 Tableau Prep Builder,请参见 Tableau Desktop 和 Tableau Prep Builder 部署指南中的通过用户界面装配 Tableau Desktop 或 Tableau Prep Builder(畅达在新窗口中翻开)。不然您不错下载免费试用版(畅达在新窗口中翻开)。
示例文献若要完本钱教程中的任务,您需要装配 Tableau Prep Builder,或者要是在工作器版块 2020.4 或更高版块上启用了 Web 制作,还不错尝试 Web 上的法子。
在规划机上装配 Tableau Prep Builder 后,您还不错在以下位置找到示例文献:
(Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files(Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files或者,从这些畅达下载示例文献,并创建一个 Samples 目次和一个 South 子目次。要是在 Web 上完本钱教程,则需要这么作念。
下载到 Samples 目次下载到 South 子目次Orders_CentralOrders_EastOrders_Westreturns_reasons_newOrders_South_2015Orders_South_2016Orders_South_2017Orders_South_2018配景故事...您在一家大型零卖连锁店的总部责任。您的雇主念念要分析往日四年公司的家具销售额和利润。您保举他使用 Tableau Desktop 来完成该操作。您的雇主觉得这个主意很棒,并但愿您立即入部属手完成该责任。
在开动网罗需要的所稀薄据时,您端庄到,有东谈主还是通过其他边幅为每个区域网罗和追踪过数据。您还端庄到不同文献中有大量立异数据条件,而且一个区域致使每年都有单独的文献!
您将不得不先执行大量的数据计帐责任,然后才略开动在 Tableau 等分析数据,而这项责任将需要很万古辰。
在您翻找餐厅的菜单来订晚餐时,您念念起来 Tableau 有一款名为 Tableau Prep 的新家具,该家具可匡助您完成繁重的数据计帐任务。
您下载家具,并注册了免费试用版(畅达在新窗口中翻开),决定试用一下。
1.勾通到数据翻开 Tableau Prep Builder 时,您当先看到是一个带有“勾通”窗格的开动页面,就像 Tableau Desktop 一样。
若要开动操作,第一步是勾通到数据并创建输入法子。您将从该处开动创建责任流(在 Tableau Prep 中称之为“经由”),并跟着弘扬添加更多法子来对数据执行操作。
请示:输入法子是数据的摄入点和经由的开动点。您可能有多个输入法子,况且某些法子可能包括多个数据文献。联系勾通到数据的注目信息,请参见勾通到数据(畅达在新窗口中翻开)。
不同区域的销售额数据文献以不同的边幅存储,况且“南部”区域的订单本色上是多个文献。您查验了“勾通”窗格,并发现您有许多遴荐来勾通到数据。太好了!
由于其他区域全部四年的数据是一个文献,因此您决定先 入部属手处理“南部”区域的文献。
在“勾通”窗格上,单击“添加勾通” 按钮。
在 Web 制作中,从“主页”中单击“创建”>“经由”,或从“浏览”页面中单击“新建”>“经由”。然后单击“勾通到数据”。
文献是 .csv 文献,因此请在勾通列表中遴荐“文本文献”。
导航到您的文献的目次。在 Orders South 子目次中,遴荐第一个文献 orders_south_2015.csv,并单击“翻开”以将其添加到经由。(联系文献位置,请参见记忆和资源。)
勾通到第一个文献后,Tableau Prep Builder 责任区将翻开,您会看到它分为两个主要部分。顶部的“经由”窗格和底部的“输入”窗格。
与 Tableau Desktop 很像,“经由”窗格是您的责任区,您不错在其中直不雅地与数据交互并构建经由。“输入”窗格包含联系如何摄入数据的建树选项。它还显露数据集结的字段、数据类型以及值的示例。
咱们将鄙人一部分中计划您如何才略与此数据交互。
请示:关于单个表,Tableau Prep 会在您将数据添加到经由时自动为您在“经由”窗格中创建输入法子。不然,您不错使用拖放功能将表添加到“经由”窗格。
在南边,您还有另外三个订单文献,如何组合它们取决于您在那儿责任。
在 Tableau Prep Builder 中:
您不错单独添加每个文献,但您念念要将统共文献合并到一个输入法子中,因此您在“输入”窗格中单击“表”选项卡。您会看到一个“合并多个表”选项。遴荐该选项。
您端庄到,您在其中遴荐文献的目次已填充,况且您需要的其他文献列在“输入”窗格的“已包括文献”部分中。
请示:使用通配符并集不错相等简易的勾通到单一数据源中具有类似称呼和结构的多个文献并将其合并。若要使用此选项,文献必须位于并吞父目次或子目次中。要是莫得立即看到所需的文献,请更动搜索条件。联系注目信息,请参见在输入法子中合并文献和数据库表(畅达在新窗口中翻开)。
单击“应用”以将这些文献中的数据添加到“orders_south_2015”输入法子。
其他区域的文献全部都是单一表文献,因此您不错一次性遴荐统共文献并将它们添加到经由。
端庄:在 Web 上,文献只可单独上载。
在 Tableau Server 或 Tableau Cloud 中:
通配符选技俩前关于 Tableau Server 或 Tableau Cloud 不可用。不外,您照旧但愿包括来自南边的统共文献并雷同处理数据,因此将它们组合在一谈是有真义的。
近似法子 2 和 3 以添加 Orders South 子目次中的其他文献。将它们与合并法子结合。(联系更多注目信息,请参见在输入法子中合并文献和数据库表(畅达在新窗口中翻开)。)将“Orders_South_2016”拖到“Orders_South_2015”上,并将其放在“并集”选项上。
将“Orders_South_2017”拖到新的合并法子上,并将其放在“添加”上。 对最终文献近似此法子。
添加其余文献。
在 Tableau Prep Builder 中:
翻开文献资源管制器或 Finder,并导航到文献的目次。按住 Ctrl 单击或按住 Cmd 单击 (MacOS),遴荐以下文献并将它们拖放到“经由”窗格上,将这些文献添加到经由。(联系文献位置,请参见记忆和资源。)Orders_Central.csvOrders_East.xlsxOrders_West.csv端庄:这些是不同的文献类型。要是您看不到统共这些文献,请确保您的文献资源管制器或 Finder 设立为稽查统共文献类型。
在 Tableau Server 或 Tableau Cloud 中:
按照法子 2 和 3 添加 Orders_Central.csv 和 Orders_West.csv。在“勾通”窗格上,单击“添加勾通” 按钮。单击 Microsoft Excel 并遴荐“Orders_East.xlsx”。查验您的责任:不雅看“勾通到数据”的本色运行效能。单击图像可重播
2.浏览数据既然您已将数据文献加载到 Tableau Prep,您很细目我方念念要将统共文献合并在一谈。但在执行该操作之前,不妨先查验一下这些文献,望望是否能找出任何问题。
在“经由”窗格中遴荐输入法子时,您可能会看到用于引入数据的设立、所包括的字段以及值的预览。
在这里不错很简易地决定要在经由中包括些许数据,以及移除或筛选不需要的字段。您还不错更动未正确分拨的任何数据类型。
请示:要是在处理大型数据集,Tableau Prep 会自动引入数据样本,从而最大范围耕作性能。要是看不到预期数据,您可能需要养息样本。可在“数据样本”选项卡上执行此操作。联系建树数据选项和样本大小的注目信息,请参见遴荐数据样本大小(畅达在新窗口中翻开)。
在“经由”窗格中,当您遴荐每个法子并稽查每个数据集时,您端庄到需要稍后开发的一些问题,以及一个可立即在输入法子中开发的问题。
遴荐“Orders_West”输入法子。
“State”(州)字段使用州称呼的缩写。其他文献则使用圆善拼写,因此您将需要稍后开发该问题。
有许多以“Right_”发轫的字段。这些字段似乎与其他字段近似。您不念念在经由中包括这些近似字段。此问题可在“输入”法子中的此处开发:
若要立即开发此问题,请废除以“Right_”发轫的统共字段的复选框。这会招引 Tableau Prep 忽略这些字段,不将它们包括在经由中。
请示:当您在某个法子中执行计帐操作(比如移除字段)时,Tableau Prep 会在“更动”窗格中追踪您所作念的更动,并在“经由”窗格中(以小图观念局势)添加扫视来匡助您追踪对数据所作念的操作。关于“输入”法子,也会向每个字段中添加扫视。
在“经由”窗格中,单击“Orders_Central”输入法子将其采用。在“输入”窗格中,您端庄到以下问题:
订单日历和发货日历在字段中已针对月、日和年分开。
某些字段的数据类型与其他文献中相通字段的数据类型不同。“Region”(区域)莫得字段。
您将需要对这些字段执行一些计帐操作,然后才略将此文献与其他文献合并。但您无法在“输入”法子中的此处开发该问题,因此记下来以便稍后进行
遴荐“Orders_East”输入法子。
此文献中的字段看起来与其他文献王人备一致。但“Sales”(销售额)值似乎全部都包括了货币代码。您稍后也需要开发该问题。
既然您还是细目了数据集结的一些问题,那么下一步是更仔细地查验您的数据并计帐找到的任何问题,以便大约合并和养息数据,并生成可用于分析的输出文献。
3.计帐数据在 Tableau Prep 中,查验和计帐数据是一个反复的过程。细目了要处理的数据集之后,下一步是查验该数据,并通过对数据应用多样计帐、养息和合并操作来对其进行操作。您通过向经由中添加法子来应用这些操作。联系计帐选项的注目信息,请参见计帐和养息数据(畅达在新窗口中翻开)。
阐述您尝试进行的操作,法子有多种作风。举例,在念念要对字段应用像筛选、合并、拆分、重定名这么的计帐操作时随时添加计帐法子。添加团聚法子来对字段进行分组和团聚,并更动数据的注目级别。联系不同法子类型偏激用法的注目信息,请参见构建和组织经由(畅达在新窗口中翻开)。
请示:向经由中添加法子时,会自动添加一条经由线将法子互相勾通在一谈。您不错将这些经由线四处出动,并阐述需要移除或添加经由线。运行经由时,必须要有这些勾通点,以便 Tableau Prep 知谈哪些法子已勾通以及法子在经由中的应用规章。要是短少经由线,则经由会中断并出现错误。
计帐 Orders_Central为了惩办之前发现的问题并细目是否还有任何其他问题,您当先向“Orders_Central”输入法子中添加一个计帐法子。
在“经由”窗格中,遴荐“Orders_Central”,执行以下操作之一:
单击加号 图标并添加计帐法子。阐述您的版块,此菜单选项为“添加法子”、“添加计帐法子”或“计帐法子”。单击提出的计帐法子(Tableau Prep Builder 版块 2020.3.3 及更高版块以及在 Web 上)
向经由中添加计帐法子时,责任区将发生变化,您将看到数据的注目信息。
A. “经由”窗格、B. 用具栏、C. “建树”窗格、D. 数据网格
责任区当今分为三个部分:“经由”窗格、带用具栏的“建树”窗格和“数据”网格。
“建树”窗格显露数据的结构,同期将字段值汇总到数据桶中,以便您大约快速稽查关系值,并找出离群值和 null 值。“数据”网格显露字段的行级别注目信息。
请示:“建树”窗格中的每个字段都显露在建树卡上。使用每张卡上的“更多选项” 菜单(在以前的版块中为下拉箭头)来稽查和遴荐可用于该字段类型的不同计帐选项。您也不错对字段值进行排序、更动数据类型、为字段分拨数据脚色,或在“数据”网格中拖放建树卡和列以从头枚举它们。
使用规划字段计帐数据
此数据集短少“Region”(区域)字段。由于其他数据集有此字段,因此您将需要添加此字段,以便大约稍后合并数据。您将需要使用规划字段来执行此操作。
在用具栏中,单击“创建规划字段”。
在规划裁剪器中,将规划字段定名为“Region”(区域)。然后输入 "Central"(包括引号),并单击“保存”。
您大约使用规划字段来养息数据,这种生动性让您相等可爱。您相等欣慰看到 Tableau Prep 使用与 Tableau Desktop 相通的规划裁剪器谈话。
请示:当您对字段和值进行更动时,Tableau Prep 会在左侧的“更动”窗格追踪所作念的更动。同期,会向经由中的计帐法子和“建树”窗格中的字段添加一个暗示更动的图标(扫视)。咱们将在进行更多更动之后稽查“更动”窗格。
接下来,您需要惩办单独订单日历和发货日历字段的问题。您需要将它们合并为两个单一字段,一个用于“Order Date”(订单日历),一个用于“Ship Date”(发货日历),使它们与其他数据集结的相通字段保抓一致。确保表具有相通的字段将使您大约稍后使用并集来合并表。
您不错再次使用规划字段,通过一个卤莽的法子执行此操作。
在用具栏中,单击“创建规划字段”,将“Order Year”(订单年份)、“Order Month”(订单月份)和“Order Day”(订单日)字段合并为一个边幅为“MM/DD/YYYY”的字段。
在规划裁剪器中,将规划字段定名为“Order Date”(订单日历)。然后输入以下规划,并单击“保存”:
MAKEDATE([Order Year],[Order Month],[Order Day])
既然有了新的订单日历字段,那么您需要移除现存字段,因为您不再需要它们。
“建树”窗格中有许多字段。您端庄到用具栏右上角的“搜索”框。您不知谈是否能使用该框来快速查找念念要移除的字段。您决定试一下。
在“建树”窗格的搜索框中,键入 Order。
Tableau Prep 将在视图中快速转念称呼中包含“Order”的统共字段。太酷了!
按住 Ctrl 单击或按住 Cmd 单击 (MacOS),遴荐“Order Year”(订单年份)、“Order Month”(订单月份)和“Order Day”(订单日)字段。然后右键单击所选字段,并从菜单中遴荐“移除字段”(在以前的版块中为“移除字段”)来移除它们。
当今近似上头的法子 4 至 7,为“Ship Date”(发货日历)创建单一字段。我方尝试一下,或使用底下的法子来匡助您。
在用具栏中,单击“创建规划字段”,将“Ship Year”(发货年份)、“Ship Month”(发货月份)和“Ship Day”(发货日)字段合并为一个边幅为“MM/DD/YYYY”的字段。
将该规划字段定名为“Ship Date”(发货日历),并输入规划 MAKEDATE([Ship Year],[Ship Month],[Ship Day])。然后单击“保存”。
移除“Ship Year”(发货年份)、“Ship Month”(发货月份)和“Ship Day”(发货日)字段。搜索并遴荐字段,然后从菜单中遴荐“移除”(在以前的版块中为“移除字段”)来移除这些字段。
请示:Tableau Prep 会将“建树”窗格中的数据汇总到数据桶中,匡助您快速稽查数据的局势、查找离群值、找出字段之间的关系,等等。在此有野心中,订单日历和发货日历当今可按年份汇总。每个数据桶都暗示从肇端年份一月份到下一年一月份的一年,并带有相应标签。由于有处于 2018 年和 2019 年下半年的销售日历及发货日历,因此该数据的数据桶相应标有 2019 年和 2020 年年末。若要将此视图更动为本色日历,请单击“建树”卡中的“更多选项” 菜单(在以前的版块中为下拉箭头),并遴荐“注目信息”。
与字段平直交互来计帐数据
您的数据一开动看起来很好。但在完成为订单日历和发货日历移除畸形字段的操作后,您端庄到“Discounts”(扣头)字段有一些问题。
系统为其分拨了“字符串”数据类型,而不是“数字(极少)”数据类型。
关于无扣头的情况,字段值是“None”(无),而不是数字值。
这将在合并文献时导致问题,因此最佳也开发该问题。
废除搜索,并在搜索框中输入 disc 来查找字段。
遴荐“Discounts”(扣头)字段,双击字段值“None”(无),并将其更动为数字值“0”。
若要将“Discount”(扣头)字段的数据类型从“字符串”更动为“数字(极少)”,单击“Abc”,并从下拉菜单中遴荐“数字(十进制)”。
终末为法子定名,以匡助追踪您在此法子中进行的操作。在“经由”窗格中,双击法子称呼“Clean 1”(计帐 1),并键入“Fix dates/field names”(开发日历/字段称呼)。
稽查您的更动您对此数据集进行了许多更动,并开动系念我方会不铭记所进行的操作。在查验责任时,您看到“建树”窗格的左侧有一个名为“更动”的列。
您单击箭头将其翻开,看到其中列出了您刚刚进行的每项更动,这让您很欣慰。在您转念浏览列表中的更动时,您端庄到,您不错删除或裁剪更动,致使能将更动四处出动来篡改所作念更动的规章。
您不错卤莽地查找构建经由时在职何法子中所作念的更动,并对这些更动的规章进行锻真金不怕火来最猛进程地愚弄您的数据,这让您相等可爱。
查验您的责任:不雅看“计帐 Orders_Central”的本色运行效能。
单击图像可重播
既然已计帐了一个文献,那么您将稽查其他文献来细目需要开发的其他问题。
接下来您决定稽查“Orders_East”的 Excel 文献。
计帐 Orders_East在稽查“Orders_East”文献的字段时,除了“Sales”(销售额)除外,大多数字段看起来与其他文献一致。为了进一步稽查并细目是否还有任何其他要惩办的问题,您向“Orders_East”输入法子中添加一个计帐法子。
在“经由”窗格中,遴荐“Orders_East”,并执行以下操作之一:
单击加号 图标并添加计帐法子。阐述您的版块,此菜单选项为“添加法子”、“添加计帐法子”或“计帐法子”。单击提出的计帐法子(Tableau Prep Builder 版块 2020.3.3 及更高版块以及在 Web 上)。通过稽查“Sales”(销售额)字段,您很快发现随销售额数字一谈包括了 USD 货币代码,况且 Tableau Prep 已将这些字段值解读为字符串。
要是要获取准确的销售额数据,您将需要从此字段中移除货币代码,并更动数据类型。
开发数据类型很容易,您还是知谈如何作念了。但唯一的销售额数据行跨越 2000 行,而开发每个单独的行来移除货币代码看起来很贫困。
但这是 Tableau Prep,因此您决定查验下拉菜单,望望是否灵验于开发此问题的选项。
当您单击“Sales”(销售额)字段的“更多选项”(以前版块中的下拉箭头)时,您看到一个名为“计帐”的菜单选项,以及该选项下一个用于移除字母的选项。您决定尝试一下,望望该选项有什么用。
遴荐“Sales”(销售额)字段。单击“更多选项” 菜单(在以前的版块中为下拉箭头),并遴荐“计帐”>“移除字母”。
哇!该计帐选项立即从每个字段中移除了货币代码。当今您只需要将数据类型从“字符串”更动为“数字(极少)”,此文献看起来就闲居了。
单击“Sales”(销售额)字段的数据类型,并从下拉列表中遴荐“数字(极少)”来更动数据类型。
文献的其余部分看起来很好。为计帐法子定名以追踪您的责任。举例,定名为“Change data type”(更动数据类型)。
接下来您将稽查 Orders_West 的终末一个文献,望望是否有任何需要开发的问题。
计帐 Orders_West在您稽查“Orders_West”文献的字段时,大多数字段看起来都与其他文献一致,但您铭记看到过“States”(州)字段为值使用了缩写,而不是州称呼的圆善拼写。为了将此文献与其他文献合并,您将需要开发此问题。因此您向“Orders_West”输入法子中添加一个计帐法子。
在“经由”窗格中,遴荐“Orders_West”,并执行以下操作之一:
单击加号 图标并添加计帐法子。单击提出的计帐法子(Tableau Prep Builder 版块 2020.3.3 及更高版块以及在 Web 上)。转念或使用“搜索”来查找“State”(州)字段。
您将看到统共州称呼值都使用简略缩写。此字段唯独 11 个唯一的值。您不错手动更动每个值,但 Tableau Prep 是否可能有另一种设施来完成此操作?
您单击字段的“更多选项” 菜单(以前版块中的下拉箭头),并看到一个名为“对值进行分组”(在以前的版块中为“分组和替换”)的选项。遴荐该选项时,您将看到若干选项:
手动遴荐
发音
常用字符
拼写州称呼的发音不相似,它们的拼写不正确,也莫得共用相通的字符,因此您决定尝试“手动遴荐”选项。
请示:您不错双击字段称呼或字段值来裁剪单个值。若要裁剪多个值,您不错遴荐统共值,并使用右键单击菜单选项“裁剪值”。但要是要将一个或多个值映射到特定值,请使用下拉菜单中的“对值进行分组”选项。联系对值进行裁剪和分组的注目信息,请参见裁剪字段值(畅达在新窗口中翻开)。
遴荐“State”(州)字段。单击下拉箭头,并遴荐“对值进行分组”(以前版块中的“分组和替换”)>“手动遴荐”。
一个两列的卡将翻开。这是“对值进行分组”裁剪器。左侧的列显露现时字段值,右侧的列显露可映射到左侧字段的字段。
您念念要将州缩写映射到州称呼的圆善拼写版块,但在“Orders_West”数据集结莫得这些值。您不知谈是否能平直裁剪称呼和在该处添加称呼,因此您尝试了一下。
在左侧窗格的“对值进行分组”裁剪器中,双击“AZ”以凸起显露值,并键入 Arizona。然后按 Enter 以添加更动。
Tableau Prep 为新值“Arizona”创建了一个映射值,并自动将旧值“AZ”映射到该值。要是您像这么输入了更多此区域的数据,那么为这些值建立映射关系将省俭您的时辰。
请示:您不错添加数据样本中莫得的字段值,建立映射关系来组织数据。要是刷新数据源并添加了新数据,您不错将新数据添加到映射,而不是手动开发每个值。当您手动添加数据样本中莫得的值时,值将带有红点绚烂,可匡助您卤莽识别该值。
近似这些法子,将每个州都映射到其称呼的圆善拼写版块。
缩写州称呼AZArizonaCACaliforniaCOColoradoIDIdahoMTMontanaNMNew MexicoNVNevadaOROregonUTUtahWAWashingtonWYWyoming然后,单击“完成”关闭“对值进行分组”裁剪器。
映射了统共州之后,您稽查“更动”窗格,看到其中唯惟一个条件,而不是 11 个条件。
Tableau Prep 已将字段的类似操作分组在一谈。您可爱该功能,因为愚弄它不错更卤莽地查找随后对数据集所作念的更动。
开发“State”(州)字段值是您需要在此处进行的唯一更动。
为计帐法子定名以追踪您的责任。举例“Rename states”(重定名州)。
您在文献中进行了大量的计帐,不敢确信操作能如斯快捷卤莽地完成。您果真还不错回家吃晚饭!为了确保不会丢失到咫尺为止所作念的责任,请保存您的经由。
端庄:要是在 Web 上责任,更动会在您出动时自动保存,从而创建草稿经由。单击草稿标题以定名草稿。联系在 Web 上制作的注目信息,请参见 Tableau Server(畅达在新窗口中翻开) 或 Tableau Cloud(畅达在新窗口中翻开) 匡助中的“Web 上的 Tableau Prep”。
单击“文献”>“保存”或“文献”>“另存为”。将文献另存为经由文献 (.tfl) 并为其定名。举例“My Superstore”(我的超市)。
请示:在保存经由文献时,您不错将它们另存为经由文献 (.tfl) 或打包文献 (.tflx),并将腹地数据文献与这些文献打包在一谈,以便将经由和文献与其他东谈主分享。联系保存和分享经由的注目信息,请参见保存和分享责任(畅达在新窗口中翻开)。
4.合并数据既然计帐了统共文献,那么您就已最终准备好将它们合并在一谈。
由于计帐后统共文献都有类似的字段,因此若要将统共行合并到单个表中,您需要将这些表合并。
您铭记有一个名为“并集”的法子选项,但不知谈是否能纯粹地通过拖放法子来合并文献。您决定试一下望望。
合并数据针对您的责任位置执行关系法子。
Tableau Prep Builder
在“经由”窗格中,将计帐法子“Rename states”(重定名州)拖到计帐法子“Changed data type”(更动的数据类型)法子,并将其放在“并集”选项上。
您看到 Tableau Prep Builder 向经由中添加了一个新的“Union”(合并)法子。太好了!当今,您念念要向此并集结添加其他文献。
Tableau Server 或 Tableau Cloud
在“经由”窗格中,将计帐法子“Rename states”(重定名州)拖到之前为 South 文献创建的“并集”法子,并将其放在“添加”选项上。
您会看到 Tableau Prep 将新文献添加到以前的并集结。太好了!当今,您念念要向此并集结添加其他文献。
将经由中的下一个计帐法子拖到新的“并集”法子,然后将其放在“添加”上以添加到现存并集。
将其余法子(要是在 Tableau Prep Builder 中责任,为“orders_south_2015”输入法子,要是在 Web 上责任,则为您的计帐法子)拖到新的“并集”法子。将其放在“添加”上以添加到现存并集。
当今,统共文献已合并到一个表中。在“经由”窗格中,遴荐新的“Union”(合并)法子以稽查收尾。
在 Tableau Prep Builder 上:
在 Tableau Server 或 Tableau Cloud 上:
您端庄到,Tableau 自动匹配了具有相通称呼和类型的字段。
您还看到,分拨给经由中法子的神采取在并集建树中指明字段来自于何处,并同期出当今每个字段顶部的色带中,显露该字段是否存在于该表中。
您端庄到新增了一个名为“Table Names”(表称呼)的新字段,该字段列出了并集结统共行的着手表。
不匹配字段的列表也显露在撮要窗格中,况且您不错立即看到字段“Product”(家具)和“Discounts”(扣头)只出当今 Orders_Central 文献中。
若要更仔细地稽查这些字段,请在“并迫临果”窗格中选中“仅显露不匹配字段”复选框。
通过稽查字段数据,您很快发现数据相通,但字段名不同。您不错纯粹地重定名字段,但不知谈是否能拖放这些字段来合并它们。您决定试一下望望。
遴荐“Product”(家具)字段,并将其拖放到“Product Name”(家具称呼)字段上来合并字段。字段合并后将不再出当今窗格中。
近似此法子,将“Discounts”(多项扣头)字段与“Discount”(扣头)字段合并。
当今,唯一莫得匹配项的字段是“File Paths”(文献旅途)字段。在 Tableau Prep Builder 中,此字段显露您为“南部”区域销售订单执行的通配符并集的文献旅途。您决定将此字段保留在该处,因为它有很好的信息。
请示:在合并之后开发不匹配的字段时,您有若干遴荐。要是 Tableau Prep 检测到可能的匹配项,它将以黄色凸起显露相应匹配项。若要合并字段,请将光标悬停在凸起显露的字段上,并单击出现的加号 按钮。联系在并集结合并字段的更多边幅,请参见开发不匹配的字段。
废除“仅显露不匹配字段”复选框以显露并集结包括的统共字段。
为合并法子定名以暗示此并集所包括的内容。举例,“All orders”(统共订单)。
查验您的责任:不雅看“合并数据”的本色运行效能。单击图像可重播
您是计帐天才!高洁您对收尾拍案叫绝时,您的雇主打来了电话。他忘了说他还念念要您在分析中包括任何家具退货。他但愿这项责任不会太贫困。愚弄用具包中的 Tableau Prep,这王人备不行问题!
计帐家具退货数据您查验雇主发给您的家具退货关系 Excel 文献,发现文献有一丝杂沓。您将新文献 return_reasons new 添加到您的经由来仔细查验。
在“勾通”窗格中,单击“添加勾通”。遴荐“Microsoft Excel”并导航到您用于本熟习的示例数据文献。(请参见教例文献以下载文献。)
遴荐 return reasons_new.xlsx,然后单击“翻开”将该文献添加到经由窗格。
此文献中唯独 4 个您念念要包括在经由中的字段:“Order ID”(订单 ID)、 “Product ID”(家具 ID)、 “Return Reason”(退货原因)和“Notes”(扫视)。
在“returns_new”的“输入”窗格中,废除最左边的列顶部的复选框以废除统共复选框。然后,选中“Order ID”(订单 ID)、“Product ID”(家具 ID)、“Return Reason”(退货原因)和“Notes”(扫视)字段的复选框。
重定名输入法子以更好地反应此输入中包括的数据。在“经由”窗格中,双击输入法子称呼“Returns_new”,并键入“Returns (all)”(退货(全部))。
通过稽查示例字段值,您端庄到“Notes”(扫视)字段似乎有许多不同的数据合并在一谈。
您要在此文献中执行一些计帐,然后才略对数据进行进一步处理,因此,您添加了计帐法子来进行查验。
在“经由”窗格中,遴荐输入法子“Returns (all)”(退货(全部)),单击加号 图标或提出的计帐法子,添加一个计帐法子。
在“建树”窗格中,养息“Notes”(经由)字段的大小以便更好地能看到各个条件。为此,请单击并将字段的右侧外缘向右拖。
在“Notes”(扫视)字段中,使用字段值右侧可视的转念条来浏览各个值。
您端庄到一些内容有问题:
某些条方针内容中有畸形的空格。这可能会导致字段被读取为 null 值。
审批者的称呼似乎包括在退货扫视条件中。为了更好地使用此数据,您需要将该信息放在一个单独的字段中。
为了处理畸形的空格,您铭记有一个用于移除尾随空格的计帐选项,因此决定尝试一下,望望该选项是否能开发问题。
遴荐“Notes”(扫视)字段。单击“更多选项” 菜单(在以前的版块中为下拉箭头),并遴荐“计帐”>“剪裁空格”。
太好了!它准确地完成了所需的操作。畸形的空格不见了。
接下来,您念念要为审批者称呼创建一个单独的字段。您看到菜单中的“拆分值”选项,因此决定尝试该选项。
遴荐“Notes”(扫视)字段。单击“更多选项” 菜单(在以前的版块中为下拉箭头),并遴荐“拆分值”>“自动拆分”。
此选项准确地完成了您但愿其进行的操作。它自动将退货扫视和审批者姓名拆分到单独的字段中。
就像 Tableau Desktop 一样,Tableau Prep 也为这些字段自动分拨了称呼。因此您将需要将新字段重定名为有真义的称呼。
遴荐字段“Notes-Split 1”(扫视-拆分 1)。在字段名中双击,并键入“Return Notes”(退货扫视)。
为第二个字段近似此法子,并将其重定名为“Approver”(审批者)。
终末,在您不再需要原始“Notes”(扫视)字段时将其移除。遴荐“Notes”(扫视)字段,单击“更多选项” 菜单(在以前的版块中为下拉箭头),并从菜单中遴荐“移除”(在以前的版块中为“移除字段”)。
通过稽查新的“Approver”(审批者)字段,您端庄到字段值列出了相通称呼,但这些称呼的输入边幅不同。您念念要将这些字段分组,以放手并吞值的多个变体。
也许“对值进行分组”(以前版块中的“分组和替换”)选项可匡助完成该操作?
您铭记有一个用于“共同字符”的选项。由于这些值共用相通字母,因此您决定试一下。
遴荐“Approver”(审批者)字段。单击“更多选项” 菜单(在以前的版块中为下拉箭头),并遴荐“对值进行分组”(以前版块中的“分组和替换”)>“共同字符”。
此选项为您将每个称呼的统共变体分组在一谈。这王人备即是您念念要达到的方针。
查验了其他称呼来确保其正确分组后,您单击“完成”关闭“对值进行分组”裁剪器。
此文献看起来相等好。
为计帐法子定名以追踪您的责任。举例,“Cleaned notes”(计帐的扫视)。
既然家具退货数据全部已计帐,那么您念念要将退货数据添加到合并的文献中的订单数据。但其中许多字段在合并的文献中不存在。若要将这些字段(数据列)添加到合并的数据集,您需要使用聚积。
聚积数据在聚积数据时,这些文献至少必须有一个共同的字段。您的文献共用“Order ID”(订单 ID)和“Product Id”(家具 Id)字段,因此您不错在这些字段上聚积,以稽查共有这些字段的统共行。在您使用拖放创建并集时,您铭记有一个用于创建聚积的选项,因此您试了一下。
在“经由”窗格中,将“Cleaned notes”(计帐的扫视)法子拖到“All orders”(统共订单)合并法子上,并将其放在“聚积”上。
在聚积文献时,Tableau Prep 会在“聚积建树”中显露聚积的收尾。
处理聚积可能会很难办。您频繁念念要有一个具有聚积中所包括要素的明显视图,举例用于聚积文献的字段、收尾中的包括的行数,以及未包括或为 null 值的任何字段。
大姨子在 Tableau Prep 中稽查聚积的收尾时,您很欣慰地看到有如斯多的信息,况且不错随时交互。
请示:在聚积建树最左侧的窗格中,您不错浏览聚积并与之交互。您也不错在“聚积子句”窗格中平直裁剪值,并在“聚积收尾”窗格中执行计帐操作。在“聚积类型”图表中单击以尝试不同的聚积建树,并在 “聚积收尾汇总”部分中稽查聚积中为每个表包括或排除的行数。在“已应用聚积子句”部分中遴荐要进行聚积的字段,或通过“聚积子句提出”部分添加提出的聚积子句。联系使用聚积的注目信息,请参见团聚、聚积或合并数据(畅达在新窗口中翻开)。
您看到有跨越 13,000 行被从“All Orders”(统共订单)文献中排除。创建聚积之后,Tableau Prep 自动对“Product ID”(家具 ID)字段进行了聚积,但您还念念对“Order ID”(订单 ID)字段进行聚积。
在浏览聚积建树的左侧窗格时,您看到提出的聚积子句列表中有“Order ID”(订单 Id),因此您从该处快速添加了该字段。
在聚积建树左侧窗格中的“聚积子句提出”部分,遴荐“Order ID = Order Id”,并单击加号 按钮添加聚积子句。
由于“聚积类型”设立为里面聚积(Tableau Prep 的默许设立),因此聚积仅包括两个文献中均存在的值。但您需要“Orders”(订单)文献中的所稀薄据,以及这些文献的退货数据。因此您将需要更动聚积类型。
在“聚积类型”部分,单击图表的一侧以包括统共订单。鄙人面的示例中,单击图表的左侧以将聚积类型更动为“左”聚积,并包括“All orders”(统共订单)合并法子中的所稀薄据,以及“Cleaned notes”(计帐的扫视)法子中的任何匹配数据。
当今,您有了销售订单文献中的所稀薄据,以及适用于这些订单的任何退货数据。您稽查“聚积子句”窗格,并看到一些其他文献中不存在的不同值。
举例,有许多莫得对应退货数据的订单行(显露为红色)。您大约浏览此注目级别的聚积关系信息,这让您相等可爱。
您急于念念在 Tableau Desktop 中开动分析此数据,但在开动分析之前,您端庄到聚积要有一些收尾需要计帐。辛亏您知谈怎么作念!
请示:不知谈数据是否弥散干净?从 Tableau Prep Builder 中,您不错从经由的任何法子中通过 Tableau Desktop 预览数据,对其进行查验。只需在“经由”窗格中右键单击该法子,并从菜单中遴荐“在 Tableau Desktop 中预览”。您可能会碰到您的数据和在 Tableau Desktop 中进行的更动未写回 Tableau Prep Builder 中的数据源的情况。联系注目信息,请参见在 Tableau Desktop 中稽查经由输出(畅达在新窗口中翻开)。
在开动计帐聚积收尾之前,将蚁正当子定名为“Orders+Returns”(订单+退货),并保存经由。
计帐聚积收尾端庄:若要计帐聚积中的字段,您不错平直在“聚积”法子中执行计帐操作。关于本教程,咱们将添加一个计帐法子,以便您大约明显地看到您的计帐操作。要是要尝试平直在蚁正当子中执行这些法子,请跳过底下的法子 1 和 3。
聚积了两个法子之后,系统为两个表都添加了“Order ID”(订单 ID)和“Product ID”(家具 ID)共同字段。
您念念要保留统共订单中的“Product ID”(家具 ID)字段和退货文献中的“Order ID”(订单 ID)字段,并移除来自这些字段的近似字段。您也不需要输出文献中的“File Paths”(文献旅途)和“Table Names”(表称呼)字段,因此也需要移除这些字段。
请示:当您使用两个文献中均存在的字段聚积表时,Tableau Prep 将会引入这些字段,并通过向字段名中添加“-1”或“-2”来重定名第二个文献中的近似字段。举例,“Order ID”(订单 ID)和“Order ID-1”(订单 ID-1)。
在“经由”窗格中,遴荐“Orders+Returns”(订单+退货),单击加号 图标,并添加计帐法子。
在“建树”窗格中,遴荐并移除以下字段:
Table Names(表称呼)
Order ID(订单 ID)
文献旅途(仅限 Tableau Prep Builder)
Product ID-1(家具 ID-1)
将字段“Order ID-1”(订单 Id-1)重定名为“Order ID”(订单 ID)。
有许多家具已退货的 null 值,但莫得指明退货扫视或审批者。为了使此数据更易于分析,您念念要添加一个值为“Yes”和“No”的字段来指明家具是否已退货。
您莫得此字段,但不错通过创建规划字段来添加它。
在用具栏中,单击“创建规划字段”。
将字段定名为“Returned?”(已退货?),然后输入以下规划并单击“保存”。
If ISNULL([Return Reason])=FALSE THEN "Yes" ELSE "No" END
为了进行分析,您还念念要知谈订单发货天数,但您也莫得该字段。
不外您有创建该字段所需的全部信息,因此添加了另一个规划字段来创建它。
在用具栏中,单击“创建规划字段”。
将字段定名为“Days to Ship”(发货天数),然后输入以下规划并单击“保存”。
DATEDIFF('day',[Order Date],[Ship Date])
将法子定名为“Clean Orders +Returns”(计帐订单+退货)。
保存您的经由。
5.运行经由并生成输出您的数据看起来很好,况且您已准备好生成输出文献以便开动在 Tableau Desktop 中对其进行分析。您只需运行经由并生成数据索求文献即可。为此,您需要添加一个输出法子。
阐述责任位置,您不错将经由输出到文献(仅限 Tableau Prep Builder),输出到已发布数据源或数据库。
在“经由”窗格中,遴荐“Clean Orders+Returns”(计帐订单+退货),单击加号 图标,并遴荐“输出”(以前版块中的“添加输出”)。
添加输出法子时,“输出”窗格将翻开,并显露数据的快照。在这里您不错遴荐要生成的输出的类型,并指定称呼和要保存文献的位置。
默许位置为数据源文献夹中的“我的 Tableau Prep Builder”存储库。
在左侧窗格的“将输出保存到”下拉列表中,阐述责任位置,执行以下操作之一:
Tableau Prep Builder
遴荐“文献”(在以前的版块中遴荐“保存到文献”)。单击“浏览”按钮,然后在“将数据索求另存为”对话框中输入文献的称呼,举例“Orders_Returns_Superstore”,并单击“摄取”。在“输出类型”字段中,遴荐一种输出类型。关于 Tableau Desktop,请遴荐 Tableau 数据索求 (.hyper),或者,要是要与第三方分享数据索求,请遴荐逗号分隔值 (.csv)。
Tableau Server 或 Tableau Cloud
遴荐“已发布数据源”。遴荐一个技俩。输入文献的称呼,举例“Orders_Returns_Superstore”。
请示:在通过经由生成输出时,您有一些遴荐。您不错生成数据索求文献(仅限 Tableau Prep Builder),不错将您的数据以数据源的局势发布到 Tableau Server 或 Tableau Cloud,或者不错将数据写入数据库。联系生成输出文献的注目信息,请参见创建数据索求文献和已发布数据源(畅达在新窗口中翻开)。
在“写入选项”部分,稽查将新数据写入文献的选项。您但愿使用默许选项(“创建表”)并将表替换为经由输出,因而此处莫得要更动的内容。
请示:从版块 2020.2.1 开动,您不错遴荐要如何将经由数据写回表。您不错从两个选项中进行遴荐;“创建表”或“追加表”。默许情况下,Tableau Prep 使用“创建表”选项,并在运行经由时用新数据消失表数据。要是遴荐“追加表”,Tableau Prep 会将经由数据添加到现存表,以便不错在每次经由运行时同期追踪新数据和历史数据。联系注目信息,请参见建树写入选项。
在“输出”窗格中单击“运行经由”,或在经由窗格中单击“运行经由” 按钮以生成输出。
端庄:要是在 Web 上责任,请单击“发布”以发布草稿经由。只可运行已发布的经由。
经由完成运行时,一个情景对话框将显露经由运行得胜,以及运行所消耗的时辰。单击“完成”关闭该对话框。
要是在 Web 上责任,请导航到“浏览”>“统共经由”页面,并找到您的经由。您不错在“经由概括”页面上稽查经由运行的情景。
若要使数据保抓最新,您不错手动或使用号令行来运行经由。要是您有 数据管制 并启用了 Tableau Prep Conductor,还不错在 Tableau Server 或 Tableau Cloud 中按规划运行经由。
从 Tableau Prep Builder 版块 2020.2.1 开动以及在 Web 上,您还不错遴荐在每次运行经由时刷新所稀薄据,或使用增量刷新运行经由,况且每次只处理新数据。
联系使数据保抓最新的注目信息,请参见以下主题:
通过号令行刷新经由输出文献(畅达在新窗口中翻开)将经由发布到 Tableau Server 或 Tableau Cloud(畅达在新窗口中翻开)使用增量刷新来刷新经由数据(畅达在新窗口中翻开)记忆和资源您是数据准备巨星了!您卤莽地找出了不良数据并对其进行了篡改!您很快计帐并准备好了来自多个数据集的数据,并将其调换为可立即在 Tableau Desktop 中处理来进行分析的有层有次、干净的数据集。
念念要进行更多熟习?尝试使用下列文献夹中的数据文献近似执行 Superstore 示例经由的其余法子:
Orders_South_2015Orders_South_2016Orders_South_2017Orders_South_2018Orders_CentralOrders_EastOrders_Westreturns_reasons_newQuota在装配 Tableau Prep Builder 后,您还不错在规划机上的以下位置找到这些文献:
(Windows) C:\Program Files\Tableau\Tableau Prep Builder <version>\help\Samples\en_US\Superstore Files(Mac) /Applications/Tableau Prep Builder <version>.app/Contents/help/Samples/en_US/Superstore Files念念要获取更多培训?稽查这些优质资源(畅达在新窗口中翻开),或干涉现场培训(畅达在新窗口中翻开)课程。
念念要了解咱们所盘考主题的注目信息?请稽查 Tableau Prep 联机匡助中的其他主题文爱 porn。