可视化数据(Visualizing Data)
分类: 图书,计算机与互联网,数据库,综合,
品牌: 弗莱
基本信息·出版社:电子工业出版社
·页码:366 页
·出版日期:2009年
·ISBN:7121082799/9787121082795
·条形码:9787121082795
·包装版本:1版
·装帧:平装
·开本:16
·正文语种:中文
·外文书名:Visualizing Data
产品信息有问题吗?请帮我们更新产品信息。
内容简介《可视化数据》是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,《可视化数据》都给出了非常详尽的介绍。《可视化数据》使用由作者开发的开源编程环境Processing编程,它非常简单易用。对于熟悉使用Java的程序员来说,《可视化数据》后面的章节还介绍了如何将Processing和Java结合使用。
《可视化数据》是写给那些拥有一个数据集合,好奇如何探索它,并且考虑如何交流这些数据的人们的。随着我们处理越来越多的信息,需要可视化数据的人们的数量增长的非常迅速。更重要的是,读者已经超越了某些可视化领域的专家。通过让更大范围的人们都接触到可视化思想,我们在接下来的几十年中应该可以看到一些真正让人惊叹的事情。
作者简介(美)弗莱(Ben Fry),在麻省理工多媒体实验室Aesthetics+Computation Group获得了博士学位,他是卡内基.梅隆设计学院2006~2007年度Nierenberg Chair of Design的客座教授。他同Casey Reas共同开发TProcessing,并在2005年荣获TPrix Ars Hectmnica的Gloden Nica奖项。Ben的作品还获得了Rockefeller基金会的NewMedia奖学金。
媒体推荐“通过现代数据图形大师的这本非常详细的向导书籍,您可以了解从零开始可视化数据编程的所有细节。阅读此书,你将不再依赖于别人对你数据的观点。”
——Martin Wattenberg《Map of the Market》和《Baby Name Voyaer》的作者
编辑推荐如今绝大多数的数据都变得难以利用,仅仅因为人们无法可视化其中的数量与关系。《可视化数据》使用了一种流行的、开源的由作者开发的编程环境Processing,并说明了准确地在网页上或别处表述数据的方法,实现了用户交互、动画和更多功能。如何将30亿人的基因同猩猩或是老鼠的基因相比较·数百万网民通过什么样的途径来访问同一个网页·通过《可视化数据》,可以学习使用交互显示来回答类似的复杂问题。我们不是谈论统一的图表模板。《可视化数据》指导您如何在Processing的帮助下,为一个庞大的、复杂的数据集合设计整个接口,Processing是一个强大的设计工具和编程环境。许多研究人员和公司都使用Processing,它以一种清晰易懂的方式来表达具体数据。通过这个工具和《可视化数据》,您可以学习基本的可视化原则,以及如何选择合适的显示,如何提供交互功能,为您的网站不断地带来更多的用户。
《可视化数据》内容包括:
·可视化数据的七个阶段:获取、分析、过滤、挖掘、表述、修饰和交互;
·数据问题是如何开始的,又是如何以一个清晰的答案结束的,通常还附有额外的细节;
·许多项目实例的实现;
·每种表述方式的优缺点,这些表述方式是以定制为中心的,这样它们能更好地表达它们要表示的数据集合。
目录
前言
第1章 可视化数据的七个阶段
1.1 为什么数据显示需要计划
1.2 一个例子
1.3 相互影响和联合
1.4 原则
1.5 综述
第2章 Processing入门
2.1 Processing的草图功能
2.2 导出和发布你的项目
2.3 示例和参考
2.4 函数
2.5 草图和脚本编程
2.6 准备好了吗?
第3章 映射
3.1 绘制一幅地图
3.2 地图上的定位
3.3 地图上的数据
3.4 使用你自己的数据
3.5 下面的步骤
第4章 时间序列
4.1 牛奶、茶和咖啡(获取和分析)
4.2 清理桌子(过滤和挖掘)
4.3 一个简单的图表(表述和修饰)
4.4 为当前数据集合贴上标签(修饰和交互)
4.5 绘制坐标轴(修饰)
4.6 选择一个合适的表述(表述和修饰)
4.7 通过鼠标滚动强调数据点(交互)
4.8 连接数据的方法(修饰)
4.9 标签面板一样的文本标签(交互)
4.10 数据集合之间插值(交互)
4.11 结束时间序列
第5章 连接和关连
5.1 改变数据源
5.2 问题描述
5.3 预处理
5.4 使用预处理过的数据(获取,分析,过滤,挖掘)
5.5 显示结果(表述)
5.6 回到问题本身(修饰)
5.7 复杂排序:将收入作为判断胜局的依据
5.8 转移到多个日期(交互).
5.9 平滑交互(修饰)
5.10 实施时的考虑因素(获取,分析,过滤)
第6章 散点地图
6.1 预处理
6.2 载入数据(获取和分析)
6.3 用邮政编码绘制散点图(挖掘和表述)
6.4 在输入的时候突出显示(优化和交互)
6.5 显示目前已选择的点(优化)
6.6 逐渐地将点变暗和变亮(优化)
6.7 放大(交互)
6.8 改变缩放时的点的画法(优化)
6.9 部署的问题(获取和优化)
6.10 下面的步骤
第7章 树、层次结构和递归
7.1 用递归来构建一个目录树
7.2 用队列来异步的加载(交互)
7.3 树图的简介
7.4 哪些文件占据了最多的空间
7.5 查阅文件夹的内容(交互)
7.6 提高树图的显示(修饰)
7.7 快速浏览文件(交互)
7.8 下面的步骤
第8章 网络和图
8.1 简单的图的演示示例
8.2 一个更加复杂的图
8.3 解决网络问题
8.4 高级图例
8.5 挖掘更多信息
第9章 获取数据
9.1 哪里能找到数据
9.2 从互联网上获取数据的工具
9.3 用Processing定位使用的文件
9.4 载入文本数据
9.5 处理文件和文件夹
9.6 列出一个文件夹中的文件
9.7 异步图像下载
9.8 以OpenStream()为桥联系Java
9.9 处理字节数组
9.10 高级网页技术
9.11 使用数据库
9.12 处理大量文件
第10章 分析数据
10.1 努力程度
10.2 收集线索的工具
10.3 文本是最好的
10.4 文本标注语言
10.5 正则表达式(regexps)
10.6 语法和BNF范式
10.7 压缩的数据
10.8 向量和几何
10.9 二进制数据格式
10.10 高级侦查工作
第11章 结合Processing和Java
11.1 编程模式
11.2 附加的源文件(Tabs)
11.3 预处理程序
11.4 API结构
11.5 将PApplet嵌入到Java应用程序中
11.6 在Processing的sketch程序中使用Java代码
11.7 使用库
11.8 用processing.core的源代码编译
参考书目
索引
……[看更多目录]
序言《可视化数据》是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,本书都给出了非常详尽的介绍。本书使用由作者开发的开源编程环境Processmg编程,它非常简单易用。对于熟悉使用Java的程序员来说,本书后面的章节还介绍了如何将Processing和Java结合起来使用。
“细致”是本书的特点之一。作者详细地从一组数字开始,一步一步地举例讲述如何生成最终的具有交互功能的图形或软件。在此引用亚马逊网站上一位读者对本书的书评,“《可视化数据》的最可贵之处是它还是一本真正的‘设计’书籍,书中对于颜色、排版和交互‘体验’的使用都是经过深思熟虑的。Fry的数据可视化方法是值得出现在任何一本EdwardTufte书籍里面的。当我在一段代码注释中间看到Fry写了几段关于为什么破折号和非线性数字会使得某个特定的示例看上去更好的原因之解释时,我几乎高兴得要跳起来。这种细致的程度,我认为,在其他书籍上是很难看到的。”市场上鲜见如此详细的与数据可视化相关的书籍,《可视化数据》以作者亲身实践为基础,从零开始手把手帮助读者学习创建数据的可视化步骤,正好填补了这一空白,是学习可视化数据不可或缺的宝贵资源。
同时,本书的适用读者对象十分广泛。无论是对于缺乏技术背景的美术设计专业的学生,还是对编写程序一无所知的初学者,以及那些有着高级编程背景的工程技术人员,本书都具有同样的指导和参考意义。即使在数据信息学其他领域(如数据挖掘等),本书中的许多概念和方法仍然可以被借鉴和使用。
借此机会,我要特别感谢韩宇先生和习平女士对本书所做的编辑、整理和检查工作。他们的辛苦努力是保证本书翻译质量的关键。另外,还要感谢孙勇先生在翻译过程中提供的宝贵建议。此外,我还要感谢我的父母,他们的支持永远是我前进的动力。由于翻译进度要求较高,加之本人翻译水平有限,书中难免有疏漏或错误,衷心地欢迎广大读者批评指正。
文摘插图:
第1章 可视化数据的七个阶段
1.1 为什么数据显示需要计划
每一组数据有其特殊的显示需要,为了这些需要,你使用这些数据集合所产生的作用和数据本身一样多。在办公应用程序,网络上和其他地方有很多快速图形开发工具,但是在特殊应用程序使用的复杂数据集合需要特殊处理。通过本书,我们将讨论数据集合的特性将如何帮助你选择须要使用的可视化类型。
1.1.1 过量信息
当听到“信息过载”这个词的时候,你可能会很准确地理解它的意思,因为每天都在和它打交道。在Richard Saul Wurman的新书Information Anxiety(Doubleday信息焦虑)中,他描述了《纽约时报》周日版所包含的信息如何比一个处于文艺复兴时期的人一生所接触的信息还要多。但是这是一个令人振奋的年代。你可以用$300就买到一个PC商品,其计算能力比第一个制作美国人口普查表的计算机的计算能力要高出上千倍。现代计算机的计算能力实在令人惊叹。进行复杂数据分析不再需要一个研究实验室,仅需要一台便宜的机器和一些代码。大众对复杂数据集合的存取、研究和分析都能以一种简单的方式实现,这在过去是不可能的事情。过去l0年中,普通机器的图形化能力也有大幅度提高。在游戏产业的带动下,高端的2D和3D图形硬件不再需要特殊厂商提供的固定机型,而只花$100买到一张附加卡作为替代,这些硬件成为适合于任何一台机器的标准设备,其花费大概是$700或再高一点。当这些卡不再用于游戏的时候,它们可以用于渲染极其复杂的模型,里面包含上千种图形,而且也能非常快速地制作流畅交互的动画。它们的价格会跟随年头逐渐降低,加速图形卡会成为上述PC商品上的一个标准设备。