呵呵 ,搞不懂
---------------------------------------------------------------
Microsoft SQL Server 2000 Analysis Services 的目的是提供对数据仓库数据的快速分析访问。为达到这一目的,Analysis Services 通过数据仓库事实数据表和维度表中的数据创建多维数据集。在多维数据集的创建过程中,数字度量值也被汇总为预聚合的值。多维数据集存储在为快速响应查询而设计的多维结构中,将预聚合的信息与原始事实数据合并以响应各种查询。
多维数据集可以包含直接从数据仓库汇总、复制或读取的数据。修改数据仓库结构或其中所包含的数据将影响从数据仓库中创建的多维数据集的完整性和准确性。Analysis Services 对多维数据集提供连续的联机访问,因此若要修改基础数据仓库,必须完全了解所做的修改对多维数据集的影响,以及如何管理数据仓库中的数据使之与多维数据集内的数据保持同步。
修改数据仓库中的数据之后必须更新 OLAP 数据。需要处理 OLAP 多维数据集、维度和分区以包含数据仓库中的新数据或所修改的数据。处理 OLAP 对象的方法取决于对象和对数据仓库所做修改的类型,如添加数据、修改数据或改变结构等。
实时 OLAP 是使用实时多维数据集使多维数据集数据与基础关系数据库中的修改自动同步的功能。实时多维数据集可用于需要监视和分析实时数据的应用程序,并且旨在扩展 OLAP 功能而不是替换传统的多维数据集设计和应用程序。
数据仓库中的修改
通常需要定期向数据仓库中添加数据,以包含组织业务活动的最新信息。但不经常修改数据仓库中现有的数据,而只是在发现数据的获取来源中有错误需要纠正,或是因组织变动需重新构造数据时才需修改数据仓库中的数据。一般很少修改数据仓库的设计结构。
添加数据
需要经常向数据仓库中添加新数据。在数据仓库中添加数据时,由于数据与多维数据集分区之间的交互作用,客户端应用程序可以联机使用的多维数据集信息会受到影响。可以通过仔细地定义分区筛选以及设计同步 OLAP 和数据仓库数据的策略,来管理向数据仓库中添加数据所带来的影响。
修改数据
若认真对待数据转换、验证和清理等操作,就可以减少因纠正数据仓库中的错误而进行的修改。组织或其产品的结构若发生改变,也需对数据仓库中已有的数据进行修改。例如,将产品重新组织成不同的类别就需要对数据仓库中的数据以及出自数据仓库的报告做重大修改。在某些情况下,这样的修改可能需要对多维数据集进行重新设计。在另外一些情况下,所要做的工作可能只是重新设计维度和处理所有使用那些维度的多维数据集。
应将因修改基础数据中的错误而进行的修改合并到源数据库中,通常是 OLTP 商业数据库,然后在受监控的状态下迁移到数据仓库中。许多商业 OLTP 数据库的设计都要求修改由事务来完成,该事务抵消错误数据并应用新的正确数据。在 OLAP 数据上管理此类纠错事务的影响通常更容易。多维数据集可以包含更正值错误(如不正确的销售值)的新数据事务。然而,将一个维度成员的事实移到另一个成员的事务,比如将一个销售数据发布给了错误的客户,会影响 Avg 等聚合函数的结果。对于非 OLAP 数据库也是如此;如果原来的销售订单被取消但记录仍保留在数据库中,则其将包含在销售记录的计数中并影响计算结果。
根据多维数据集的存储设计,修改事实数据表中的数据会影响对多维数据集查询的准确性,直到对多维数据集进行处理为止。可以使用"刷新数据"处理选项重新装载多维数据集的数据并重新计算聚合。由于聚合设计保持不变,"刷新数据"处理选项会比完整的"完整处理"处理选项的速度快。
即使表架构保持不变,维度层次结构也会受数据仓库维度表中数据改动的影响。维度层次结构基于维度表中成员间的关系。当改变这些关系时(例如,将城市重新组织成不同的销售区域时),必须重新生成维度结构。
添加、修改或删除数据仓库中的数据时必须保持引用的完整性。引用完整性损失会导致多维数据集处理过程中出现错误、避开事实数据表记录或产生不准确的 OLAP 信息。
改变结构
OLAP 多维数据集和维度的结构会受数据仓库设计改变的影响,比如添加、删除、修改表或表之间的关系。当结构改变时,必须修改受影响的多维数据集和维度的设计,重新定义分区和聚合,并彻底处理所修改的多维数据集和维度。
同步 OLAP 和数据仓库数据
当分析服务器正在运行时,有效的多维数据集处于联机状态,随时可由客户端应用程序使用。由于 OLAP 多维数据集分区与数据仓库数据之间存在潜在的交互,因此在设计数据仓库时应考虑同步策略,使添加数据时不会导致多维数据集在可由联机客户端应用程序使用的多维数据集内提供错误的查询答案。
管理数据仓库和 OLAP 数据库的数据添加的策略之一是设计一个批处理更新系统。在该策略中,数据仓库事实数据表中的所有数据在每个记录中都包含一个批号。在设计多维数据集时,在多维数据集的每个分区的筛选中添加一个表达式以指定适用的最大批号,例如,"...AND DWBatch <= 33 ..."。当需要向事实数据表中添加数据时,在新记录中包含一个更大的新批号。这些添加的记录并不影响多维数据集,因为多维数据集的分区被限制为只从以前的批处理中读取数据。
添加到维度表中的数据并不影响多维数据集内现有的专用或共享维度,直到维度被处理时为止。批号在维度表记录中不是必需的,但在保证连续的引用完整性方面很有用。
将一批数据添加到事实数据表和维度表之后,可以对维度和多维数据集或分区进行处理,使其包含新数据。共享维度的处理应在包含它们的多维数据集之前。若要向维度中添加不影响维度结构的新成员,请使用"增量更新"选项。若要添加新成员并重建维度的结构,请使用"重建维度结构"选项。注意,当使用"重建维度结构"选项处理共享维度时,所有包含该维度的多维数据集都将立即变得不可用,只有在处理后才能重新由客户端应用程序使用。然而,当使用"增量更新"选项处理共享维度时,使用该共享维度的多维数据集将显示新成员,但与那些新成员相关联的单元仍保留为空,直到用与新成员相关的事实数据表中的新数据更新多维数据集。
要将一批新数据合并到多维数据集内,可在多维数据集的每个分区中更新筛选表达式以包含新的批号,然后处理或增量更新多维数据集。如果多维数据集的数据分散在多个分区中,可以用其中的一个分区来聚集这批新数据,然后只处理那一个分区。多维数据集的其它分区必须有不接纳新数据的筛选,这样新数据将只添加到那个聚集分区中。
对客户端应用程序的可视性
当正处于联机状态的多维数据集由三个处理选项("完整处理"、"增量更新"或"刷新数据")之一处理时,多维数据集将保持联机状态直到处理过程结束,结束时联机多维数据集会被新的多维数据集版本取代。当使用"完整处理"选项处理多维数据集时,联机客户端应用程序与多维数据集的连接将在多维数据集切换到新的版本时断开,每个客户端应用程序必须分别重新连接才能访问新版本。当使用"增量更新"或"刷新数据"选项处理多维数据集时,联机客户端应用程序与多维数据集的连接在处理过程结束时不会中断。即使在不中断服务的情况下,客户端也能立即看到多维数据集的新版本。
共享维度的处理过程会影响在设计中包含该维度的多维数据集。如果使用"重建维度结构"选项处理共享维度,所有使用该维度的多维数据集都将立即变得不可用,必须在处理之后才能重新由客户端应用程序使用。如果使用"增量更新"选项处理共享维度,则使用该维度的多维数据集仍可由客户端应用程序使用,任何添加到该维度的新成员将在维度处理结束时自动由客户端应用程序使用。在没有用新的相关事实更新多维数据集之前,上述任何新成员均没有关联的事实数据
---------------------------------------------------------------
OLTP 联机事务处理 online transaction processing
OLAP 联机分析处理 online analytical processing
SQL server 是OLTP
Analysis services 是OLAP
看看help吧