网站首页  英汉词典  古诗文  美食菜谱  电子书下载

请输入您要查询的图书:

 

书名 大数据技术入门
分类
作者 杨正洪
出版社 清华大学出版社
下载 抱歉,不提供下载,请购买正版图书。
简介
编辑推荐

《大数据技术入门》作者杨正洪是国内知名大数据专家,毕业于美国State University of New York at Stony Brook,在IBM公司从事大数据相关研发工作12年多。从2003~2013年,杨正洪在美国加州的IBM硅谷实验室(IBM Silicon Valley Lab)负责IBM大数据平台的设计、研发和实施,主持了保险行业、金融行业、政府行业的大数据系统的架构设计和实施。

本书以Hadoop和Spark框架为线索,全面地介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析等内容。

内容推荐

从2015年开始,国内大数据市场继续保持高速的发展态势,作者杨正洪在与地方政府、证券金融公司的项目合作中发现,他们对大数据技术很感兴趣,并希望从大数据技术、大数据采集、管理、分析以及可视化等方面得到指导和应用帮助。因此编写了《大数据技术入门》这本大数据技术的快速入门书。

本书共12章,以Hadoop和spark框架为线索,比较全面地介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析等内容。最后还给出两个案例:环保大数据和公安大数据,供读者参考。

本书适合大数据技术初学者,政府、金融机构的大数据应用决策和技术人员,IT经理,CTO,CIO等快速学习大数据技术。本书也可以作为高等院校和培训学校相关专业的培训教材。

目录

第1章 大数据时代

 1.1 什么是大数据

 1.2 大数据的四大特征

 1.3 大数据的商用化

 1.4 大数据分析

 1.5 大数据与云计算的关系

 1.6 大数据的国家战略

1.6.1 政府大数据的价值

1.6.2 政府大数据的应用场景

 1.7 企业如何迎接大数据

1.7.1 评估大数据方案的维度

1.7.2 业务价值维度

1.7.3 数据维度

1.7.4 现有IT环境和成本维度

1.7.5 数据治理维度

 1.8 大数据产业链分析

1.8.1 技术分析

1.8.2 角色分析

1.8.3 大数据运营

 1.9 大数据交易

 1.10 大数据之我见

第2章 大数据软件框架

 2.1 Hadoop框架

2.1.1 HDFS(分布式文件系统)

2.1.2 MapReduce(分布式计算框架)

2.1.3 YARN(集群资源管理器)

2.1.4 Zookeeper(分布式协作服务)

2.1.5 Ambari(管理工具)

 2.2 Spark(内存计算框架)

2.2.1 Scala

2.2.2 Spark SQL

2.2.3 Spark Streaming

 2.3 实时流处理框架

 2.4 框架的选择

第3章 安装与配置大数据软件

 3.1 Hadoop发行版

3.1.1 Cloudera

3.1.2 HortonWorks

3.1.3 MapR

 3.2 安装Hadoop前的准备工作

3.2.1 Linux主机配置

3.2.2 配置Java环境

3.2.3 安装NTP和python

3.2.4 安装和配置openssl

3.2.5 启动和停止特定服务

3.2.6 配置SSH无密码访问

 3.3 安装Ambari 和 HDP

3.3.1 配置安装包文件

3.3.2 安装 Ambari

3.3.3 安装和配置HDP

 3.4 初识Hadoop

3.4.1 启动和停止服务

3.4.2 使用HDFS

 3.5 Hadoop的特性

第4章 大数据存储:文件系统

 4.1 HDFS shell命令

 4.2 HDFS配置文件

……

第5章 大数据存储:数据库

第6章 大数据访问:SQL引擎层

第7章 大数据采集和导入

第8章 大数据管理平台

第9章 Spark技术

第10章 大数据分析

第11章 案例分析:环保大数据

第12章 案例分析:公安大数据

附录1 数据量的单位级别

附录2 Linux Shell常见命令

附录3 Ganglia(分布式监控系统)

附录4 auth-ssh脚本

附录5 作者简介

随便看

 

Fahrenheit英汉词典电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 frnht.com All Rights Reserved
更新时间:2025/11/23 15:04:54