王朝网络
分享
 
 
 

生物数据整合与挖掘

王朝导购·作者佚名
 
生物数据整合与挖掘  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  参考价格: 点此进入淘宝搜索页搜索
  分类: 图书,科学与自然,生物科学,生物工程学(生物技术),
  品牌: 朱扬勇

基本信息·出版社:复旦大学出版社

·页码:240 页

·出版日期:2009年

·ISBN:9787309066142

·条形码:9787309066142

·包装版本:1版

·装帧:平装

·开本:16

·正文语种:中文

产品信息有问题吗?请帮我们更新产品信息。

内容简介《生物数据整合与挖掘》较为系统地介绍了生物数据整合与挖掘的技术框架,主要介绍了作者在这方面的研究成果,包括:生物数据抽取技术、生物数据整合技术、生物序列数据挖掘、基因表达谱芯片数据挖掘、转录因子及顺式调控元件挖掘、生物数据模型和数据库管理系统等内容,还介绍了一个生物数据整合系统、一个基因表达谱芯片数据库和数据挖掘系统、一个转录因子及顺式调控元件的挖掘分析平台等等的设计与实现。生物信息学应用计算机技术对各种生物数据进行管理和分析,以期发现生物数据所反映的生物规律,促进生命科学的发展。一方面,生命科学实验产生的巨量的生物数据保存在世界各地的相关研究机构中,或隐含在浩瀚的科学文献里。这些数据反映了生命科学研究的整体进展和成果,有重叠更相互补充,这就需要将这些生物数据整合在一起。另一方面,生物信息学也希望采用数据挖掘技术对生物数据进行分析,以期发现生物规律,因此根据生命科学的需要和领域知识,设计出有效的生物数据挖掘算法和软件工具是一个重要的研究内容。《生物数据整合与挖掘》的读者对象为从事生物信息学研究的科学工作者。《生物数据整合与挖掘》也可以作为生物信息学专业研究生的教学参考书和生物软件工程技术人员的参考书。

作者简介朱扬勇,1963年生,浙江武义人。1994年于复旦大学获计算机软件专业理学博士学位。现为复旦大学计算机科学技术学院教授;上海市政府信息化专家;上海生物信息技术研究中心学术委员会委员;上海市计算机学会理事;上海市生物信息学会理事等。长期从事数据库、数据挖掘、生物信息等方面的研究,已发表论文100余篇,出版《数据库系统设计与开发》等教材5本。作为项目负责人,主持国家自然科学基金、“863计划”、上海市科委重点发展基金等10多项课题的研究工作。目前主要从事数据科学的研究.是该领域的主要倡导者。熊贇,1980年生,江西南昌人。2008年于复旦大学获计算机软件与理论专业理学博士学位。现为复旦大学计算机科学技术学院教师。主要研究领域为数据科学.包括数据整合与挖掘、生物信息技术等。在国内外主要刊物和会议上已发表论文20余篇。作为主要研究者参与国家自然科学基金、“863计划”、上海市科委重点发展基金等多项生物信息学领域的研究课题。作为项目负责人,主持上海市科委重点发展基金项目“面向医保基金风险防控的数据分析关键技术研究与实现”的研究工作。

编辑推荐《生物数据整合与挖掘》为复旦大学出版社出版发行。

目录

第1章 背景知识

1.1 生物信息学

1.1.1 基本概念

1.1.2 研究内容

1.1.3 研究方法

1.1.4 研究机构

1.2 数据整合

1.2.1 数据资源

1.2.2 数据整合的动因

1.2.3 数据整合的概念

1.2.4 数据整合的内容

1.3 数据挖掘

1.3.1 数据挖掘的定义

1.3.2 数据挖掘的任务

1.3.3 数据挖掘的类型

1.3.4 相关技术的差异

第2章 数据整合与数据挖掘方法

2.1 数据整合的方法

2.1.1 数据整合的方式

2.1.2 数据整合的步骤

2.2 数据挖掘的方法

2.2.1 数据挖掘过程示例

2.2.2 数据挖掘过程模型

2.2.3 数据挖掘应用方式

2.3 数据清洁技术

2.3.1 数据的质量问题

2.3.2 数据清洁的主要工作

2.4 数据仓库技术

2.4.1 数据仓库的概念

2.4.2 数据组织

2.4.3 主题设计

2.4.4 数据加载

2.4.5 数据规约

2.5 小结

第3章 生物数据源

3.1 生物数据

3.1.1 生物序列数据

3.1.2 生物分子结构数据

3.1.3 芯片及基因表达数据

3.1.4 生物网络数据

3.2 生物数据组织

3.2.1 生物数据的数据库组织形式

3.2.2 生物数据的互联网组织形式

3.3 生物数据库

3.3.1 生物序列数据库

3.3.2 基因组数据库

3.3.3 结构数据库

3.3.4 芯片和基因表达数据库

3.3.5 生物文献数据库

3.4 生物数据源的特征

3.5 小结

第4章 复杂生物数据源的数据抽取

4.1 生物数据抽取

4.1.1 生物数据抽取面临的问题

4.1.2 包装器的要素

4.1.3 抽取算法

4.1.4 元数据生成与包装器生成工具

4.2 包装器的设计

4.2.1 基于实例切分的抽取算法

4.2.2 基于定位器多结点共享的数据抽取模型

4.2.3 数据抽取模型描述

4.2.4 元数据的生成和维护

4.2.5 数据抽取模型表达能力

4.3 包装器解决方案

4.3.1 面向无噪声复杂数据源的解决方案

4.3.2 面向含噪声复杂数据源的解决方案

4.3.3 ReDE和L-树包装器生成工具的架构

4.3.4 ReDE和L-树包装器生成工具的实现技术

4.4 L-树匹配:面向复杂数据源的数据抽取算法

4.4.1 L-树上的数据映射机制

4.4.2 L-树匹配算法的相关概念

4.4.3 L-树匹配算法

4.4.4 L-树匹配算法举例

4.5 基于L-树的包装器生成工具

4.5.1 将ERE扩充成数据抽取脚本语言

4.5.2 可视化编辑调试环境

4.5.3 ERE的可视化构建

4.5.4 ERE的逻辑检查

4.5.5 抽取结果的可视化评价

4.5.6 以XML格式输出抽取结果

4.6 小结

第5章 生物数据整合案例

5.1 生物数据整合系统的设计

5.1.1 生物数据整合的关键问题分析

5.1.2 生物数据整合目标的确立

5.1.3 生物数据整合方式和技术的设计

5.2 基于GO的数据整合

5.2.1 GO简介

5.2.2 DB2GO表

5.2.3 语义相似数据库表

5.2.4 以GO统一数据的逻辑和语义

5.3 数据抽取和增量更新

5.3.1 数据抽取

5.3.2 数据的增量更新

5.4 基于GO的查询技术

5.4.1 异构生物数据库的语义查询

5.4.2 BioDW中语义查询的体系结构

5.4.3 GO语义相似性度量方法

5.4.4 语义相似性查询

5.5 BioDW系统

5.5.1 BioDW的系统结构

5.5.2 BioDW的系统的数据规模

5.5.3 BioDW的数据查询

5.6 小结

第6章 生物序列数据挖掘进展

6.1 生物序列数据挖掘的基本概念和内容

6.1.1 生物序列相似性

6.1.2 生物序列模式挖掘

6.1.3 生物序列聚类分析

6.1.4 生物序列分类分析

6.1.5 生物序列关联分析

6.1.6 生物序列异常分析

6.2 生物序列数据挖掘的研究阶段

6.2.1 基于统计技术的数据挖掘方法的应用阶段

6.2.2 一般化数据挖掘方法的应用阶段

6.2.3 专门数据挖掘技术的设计阶段

6.3 生物序列数据挖掘研究与应用现状

6.3.1 生物序列模式挖掘方面

6.3.2 生物序列聚类分析方面

6.3.3 生物序列分类分析方面

6.3.4 生物序列关联分析方面

6.3.5 生物序列异常分析方面

6.4 生物序列数据挖掘研究趋势

6.5 小结

第7章 生物序列数据挖掘技术

7.1 序列数据源

7.2 生物序列模式挖掘

7.2.1 生物序列模式挖掘问题

7.2.2 基于多支持度的生物序列模式挖掘框架

7.2.3 基于多支持度的生物序列模式挖掘算法

7.3 生物序列聚类分析

7.3.1 生物序列聚类问题分析

7.3.2 蛋白质序列聚类

7.3.3 基因序列聚类

7.4 生物序列分类分析

7.4.1 生物序列分类问题分析

7.4.2 转录因子分类

7.4.3 基于支持向量机的转录因子分类算法

7.5 小结

第8章 基因芯片数据挖掘

8.1 基因表达谱芯片数据挖掘

8.1.1 基因表达谱数据分析

8.1.2 基因表达相似性分析

8.1.3 基因表达共发生分析

8.1.4 基因表达路径分析

8.1.5 特殊表达基因分析

8.2 基因表达谱数据库建设

8.2.1 基因表达谱芯片数据的标准

8.2.2 基因表达谱数据库建设的难点

8.2.3 数据库结构设计

8.2.4 数据加载与数据管理

8.2.5 自动导入数据

8.3 基因表达谱数据挖掘系统

8.3.1 数据挖掘框架

8.3.2 BDMAPA架构扩展

8.3.3 基因表达谱芯片数据挖掘系统

8.4 小结

第9章 转录因子、顺式调控元件挖掘系统

9.1 转录因子、顺式调控元件挖掘原理

9.1.1 转录因子、顺式调控元件挖掘原理

9.1.2 顺式调控元件文本挖掘原理

9.2 转录因子、顺式调控元件挖掘系统设计

9.2.1 数据挖掘软件

9.2.2 数据分析服务

9.2.3 综合的转录因子、顺式调控元件数据库

9.3 小结

第10章 生物序列数据库管理系统

10.1 生物数据处理面临的问题

10.1.1 生物数据存储方式

10.1.2 生物序列数据库的查询需求

10.2 生物序列数据模型BioSeg

10.2.1 数据结构

10.2.2 代数操作

10.2.3 Open BUILTIN函数

10.2.4 等价规则

10.2.5 BioSeg模型的特点

10.3 生物序列数据库管理系统的设计

10.3.1 代数查询实例

10.3.2 查询语言

10.3.3 体系结构

10.4 小结

参考文献

致谢

……[看更多目录]

序言自然科学研究宇宙和生命,所用的方法是证明和实验,证明依靠的是数学,实验依靠的是观测。由于观测具有不确定性,因此依靠数学更能促进科学的发展。历史上,一旦某个研究领域采用了数学就会快速发展(例如,物理学采用数学后产生了数学物理),可以把这种现象称为“数学化”,从这个角度可以将数学看成是自然科学的工具。时至现今,几乎所有的学科都或多或少地依靠数学。后来,计算机出现了,这是建立在数学基础上的机器,计算机突破了入在运用数学时的局限性(如问题规模较大时,只能抽样)。于是,当一个领域采用了计算机也会快速发展(如数学本身采用计算机后产生的计算数学),这种现象称为“信息化”。

生命科学一直是以实验为主的,很难“数学化”,然而却能够“信息化”,信息化后形成了生物信息学。生物信息学应用计算机对各种生物数据进行存储、管理、处理和分析,以期发现生物数据所反映的生物规律,促进生命科学的发展。

生物数据主要来自于生命科学领域的实验,实验产生了巨量的生物数据,其中尤其是基因组计划产生的数据最具代表性。这些巨量的生物数据保存在世界各地的相关研究机构中,或隐含在浩瀚的科学文献里。这种方式存放的生物数据也常常被称为生物数据库,但是它们和计算机领域所用的数据库可能是完全不同的。这些数据有用文本文件方式存储的,也有用各种数据库管理系统存储的。它们反映了生命科学研究的整体进展和成果,有重叠更相互补充,这需要将这些生物数据整合在一起。

文摘插图:

生物数据整合与挖掘

第1章背景知识

诺贝尔奖获得者Dulbecc0于1986年在《Science》杂志上发表的一篇短文中率先提出了人类基因组计划。该计划在探讨生命奥秘的过程中,使得自动化的DNA测序技术、生物数据挖掘分析技术、基因组数据库和分析软件、基因芯片技术的一些工具性技术获得了快速发展,并使生物信息学作为一个学科领域获得了公认。本章介绍生物信息学、数据整合与数据挖掘方面的背景知识和基本概念。

1.1 生物信息学

生命科学实验产生了大量生物数据,如何在数学、计算机科学等的支持下充分利用这些生物数据更有效地开展生命的探讨是一个很有意义的问题。于是,生物数据处理技术获得了发展,并最终产生了生物信息学。

1.1.1 基本概念

生物信息学(Bioinformatics)是指生命科学与数学科学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。它应用先进的数据管理技术、数学分析模型和计算机软件对各种生物数据进行提取、存储、处理和分析,旨在掌握复杂生命现象的形成模式与演化规律。

该定义是Rashidi等人于2000年给出的。由于生命科学研究者各自从事的具体领域不同,对其存在不同的理解,因此至今仍没有一个关于生物信息学的统一定义。但其基本的研究内容和研究方法还是比较统一的,就是通过研究生物数据来促进生命科学的研究。随着生命科学研究的深入,生物信息学也受到广泛关注。

事实上,生物信息学起源要早很多。1953年4月25日,Waston和Crick提出DNA(Deoxyribo Nucleic Acid)双螺旋结构和自我复制机制,揭开了分子生物学研究的新篇章。1956年,在美国田纳西州盖特林堡召开首次“生物学中的信息理论研讨会”,萌生了生物信息学概念。20世纪60年代,研究者开始搜集生物信息,并应用计算方法对其进行分析,发现其中反映生命现象的重要规律。随后,生物学的研究手段发生了革命性的变化,由单纯的观察和实验研究转向与生物数据分析相结合。70年代到80年代初,数学统计方法和计算机技术得到了较快发展,研究者开始应用计算机技术解决生物学问题,生物信息学初步形成。1986年,美国科学家首次提出“人类基因组计划”(Human Genome Project,HGP),促进了生物信息学的迅速发展。1987年,Hwa A.Lim博士

首次将这一学科命名为“Bioinformatics”(生物信息学)。

正如Dulbecc0 1986年所说:“人类的DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序

……[看更多书摘]

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
>>返回首页<<
推荐阅读
 
 
频道精选
 
更多商品
实用德语100句(附盘)(实用外语口语100句系列)(附赠MP3光盘1张)
实用韩语100句(附盘)(实用外语口语100句系列)(附赠MP3光盘1张)
实用俄语100句(附盘)(实用外语口语100句系列)(附赠MP3光盘1张)
实用法语100句(附盘)(实用外语口语100句系列)(附赠MP3光盘1张)
实用日语100句(附盘)(实用外语口语100句系列)(附赠MP3光盘1张)
在职攻读硕士学位全国联考英语考试:综合辅导教程(2009年)(2009年在职攻读硕士学们全国联考英语考试辅导用书)
SAT11套题(2009双语版)(出国留学书系,SAT、AP备考书系)
AP Barron's经济学(第3版)(出国留学书系,SAT、AP备考书系)
国家司法考试历年真题2009双排双练图表式历年真题详解
国家历史(2009年6月)
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有