数据可视化

什么是数据可视化?为什么如此重要?

数据可视化是以图示或图形格式表示的数据。让决策者可以看到以直观方式呈现的分析,以便他们可以掌握困难的概念或识别新的模式。借助交互式可视化,您可以使用技术深入挖掘图表和图形以获取更多详细信息,以交互方式更改您所看到的数据以及其处理方法,从而将概念向前推进一步。

数据可视化的历史

从 17 世纪的地图和图形到 19 世纪初饼图的发明,使用图片来理解数据的概念已经存在了数个世纪。几十年后,Charles Minard 绘制的拿破仑入侵俄罗斯示意图成为了被引用最多的统计图表示例之一。该示意图描绘了军队的规模以及拿破仑从莫斯科撤退的路线,并将这些信息与温度和时间范围关联起来,以更深入地理解这一事件。

然而,正是这项技术真正地推动了数据可视化的发展。计算机让以闪电般的速度处理大量数据成为可能。如今,数据可视化已成为快速发展的、融合了科学和艺术的技术,必将在未来几年内改变公司格局。

数据可视化:对您大数据未来的明智投资

拥有大数据,就拥有了获得绝佳机会的潜力,但许多零售银行在从大数据投资中寻找价值时遇到了挑战。例如,他们如何使用大数据来改善客户关系?他们应该如何以及在多大程度上投资大数据?

在与英国一家大型银行的客户价值建模主管 Simon Samuel 进行的问答中,我们对零售银行家面临的这些问题以及其他大数据问题进行了研究。

 


为什么数据可视化很重要?

鉴于人脑处理信息的方式,使用图表或图形来可视化大量复杂数据要比研读电子表格或报告来得容易。数据可视化是一种以通用方式快速、轻松地传达概念的方法–您可以通过稍作调整来在不同的情景下进行试验。

数据可视化还可以:

  • 确定需要注意或需要改进的地方。
  • 明确哪些因素会影响客户的行为。
  • 帮助您了解将哪些产品放置在何处。
  • 预测销售量。

当今世界的数据可视化

数据可视化已对企业界产生了什么影响,以及未来会发生什么?专家是这样说的。

数据可视化技巧

一幅图片相当于一千个字,尤其是当您试图寻找个中关系并理解数据时,这其中可能包含成千上万个变量。

本白皮书提供了一些关于创建有意义的数据视图的基本技巧和技术。

探索技术

数据可视化将改变我们的分析师处理数据的方式。他们将有望对问题做出更快的反应。并将需要能够以不同的方式、更富想象力地查看数据,以挖掘更多的洞察。数据可视化将促进创造性的数据探索。 Simon Samuel Head of Customer Value Modeling for a large bank in the UK

SAS® 可视化分析


SAS 的数据可视化技术可快速回答复杂的问题,无论数据大小如何。

了解更多信息

它目前的应用情况如何?

无论何种行业、规模大小,所有企业都在使用数据可视化来解读数据。方法如下。

快速理解信息

通过使用商业信息图形表示,企业能够以清晰、一致的方式查看大量数据,并从该信息中得出结论。而且由于以图形格式分析信息的速度明显快于分析电子表格中信息的速度,所以企业可以更及时地解决问题或回答问题。

识别关系和模式

即使是大量的复杂数据,在其被以图形方式显示时也会变得容易理解;企业可以识别高度相关的参数。一些相关性将变得显而易见,而其他的则不会。识别那些关系可以帮助组织专注于最可能对其最重要目标产生影响的领域。

确定新兴趋势

使用数据可视化来发现业务和市场中的趋势,可以让企业在竞争中占据优势,并最终影响利润。易于发现影响产品质量或客户流失的离群值,并在问题变得更严重之前就对其加以解决。

与他人交流案例

一旦企业从视觉分析中发现了新的洞察,下一步就是将这些洞察传达给其他人。在此步骤中,使用图表、图形或其他具有视觉冲击力的表示形式非常重要,因为它可以吸引人们并迅速传达信息。

如何使用

实行数据可视化

虽然理解数据可视化可以帮助您理解大量数据这一概念可能很容易,但理解接下来会发生什么却并没有这么容易。您需要什么类型的技术,以及如何使用它?

本实用视频为您提供了 SAS 可视化分析和 SAS 可视化统计的概述,展示了如何能够通过使用不同的配置在几秒钟内探索数十亿行的数据。SAS 技术可帮助您准备数据、创建报告和图形、发现新洞察,并通过 Web、PDF 文件或移动设备与他人共享这些可视化结果。

为数据可视化奠定基础

在实施新技术之前,您需要采取一些步骤。您不仅需要扎实掌握数据,还需要了解目标、需求和受众。让组织为数据可视化技术做好准备首先需要:

  • 了解您要可视化的数据,包括其大小和基数(列中数据值的唯一性)。
  • 确定您要可视化的内容以及要传达的信息类型。
  • 确定用户并了解其如何处理显示的信息。
  • 从用户角度利用图表以最佳和最简单的形式传达信息。

在回答了拥有的数据类型、谁将是使用信息的受众这些问题后,您就需要为自己将要处理的数据量做好准备。大数据给可视化带来了新的挑战,因为必须考虑到数据具有庞大数量、不同种类和不同速度。另外,对数据进行管理和分析的速度通常赶不上数据生成的速度。

您应该考虑一些因素,例如您要可视化的列的基数。高基数意味着存在很大比例的唯一值(例如银行帐号,因为每一项都应该是唯一的)。低基数意味着一列数据包含很大比例的重复值(在“性别”列中可能会看到)。

确定哪种图表最合适

业务用户面临的最大挑战之一是确定应使用哪种图表能最好地表示信息。SAS 可视化分析使用智能自动图表绘制功能,根据所选数据创建最佳图表。

自动图表在您首次探索新数据集时尤为有用,因为它们可以提供对大量数据的快速预览。即使是对经验丰富的统计人员来说,这种数据探索功能在其寻求加快分析生命周期过程时也很有帮助,因为它实现了无需重复抽样即可确定适合每个模型的数据。