当前位置:首页>正文

SPARK高级数据分析(影印版) 东南大学出版社 在线 免费 umd 下载 txt pdf mobi pmlz

免费下载书籍地址:PDF下载地址

精美图片

SPARK高级数据分析(影印版) 东南大学出版社书籍详细信息

  • ISBN:9787564159108
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2015-09
  • 页数:260
  • 价格:35.80
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

寄语:

新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!

内容简介:

网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成员打造,带领读者快速掌握用Spark收集、计算、简化保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

书籍目录:

Foreword

Preface

1.Analyzing Big Data

The Challenges of Data Saence

Introduang Apache Spark

About This Book

2.Introduction to Data Analysis with Scala and Spark

Scala for Data Scientists

The Spark Programming Model

Record Linkage

Getting Started: The Spark Shell and Spark Context

Bringing Data from the Cluster to the Client

Shipping Code from the Client to the Cluster

Structuring Data with Tuples and Case Classes

Aggregations

Creating Histograms

Summary Statistics for Continuous Variables

Creating Reusable Code for Computing Summary Statistics

Simple Variable Selection and Scoring

Where to Go from Here

3.Recommending Music and the Audioscrobbler Data Set

Data Set

The Alternating Least Squares Recommender Algorithm

Preparing the Data

Building a First Model

Spot Checking Recommendations

Evaluating Recommendation Quality

Computing AUC

Hyperparameter Selection

Making Recommendations

Where to Go from Here

4.Predicting Forest Cover with Deasion Trees

Fast Forward to Regression

Vectors and Features

Training Examples

Decision Trees and Forests

Covtype Data Set

Preparing the Data

A First Decision Tree

Deasion Tree Hyperparameters

Tuning Decision Trees

Categorical Features Revisited

Random Decision Forests

Making Predictions

Where to Go from Here

5.Anomaly Detection in Network Traffic with K—means Clustering

Anomaly Detection

K—means Clustering

Network Intrusion

KDD Cup 1999 Data Set

A First Take on Clustering

Choosing k

Visualization in R

Feature Normalization

Categorical Variables —

Using Labels with Entropy

Clustering in Action

Where to Go from Here

6.Understanding Wikipedia with Latent Semantic Analysis

The Term—Document Matrix

Getting the Data

Parsing and Preparing the Data

Lemmatization

Computing the TF—IDFs

Singular Value Decomposition

Finding Important Concepts

Querying and Scoring with the Low—Dimensional Representation

Term—Term Relevance

Document—Document Relevance

Term—Document Relevance

Multiple—Term Queries

Where to Go from Here

7.Analyzing Co—occurrence Networks with GraphX

The MEDLINE Citation Index: A Network Analysis

Getting the Data

Parsing XML Documents with Scala's XML Library

Analyzing the MeSH Major Topics and Their Co—occurrences

Constructing a Co—occurrence Network with GraphX

Understanding the Structure of Networks

Connected Components

Degree Distribution

Filtering Out Noisy Edges

Processing Edge Triplets

Analyzing the Filtered Graph

Small—World Networks

Cliques and Clustering Coefficients

Computing Average Path Length with Pregel

Where to Go from Here

8.Geospatial and Temporal Data Analysjs on the New York City Taxi Trip Data

Getting the Data

Working with Temporal and Geospatial Data in Spark

Temporal Data with Joda Time and NScala Time

Geospatial Data with the Esri Geometry API and Spray

Exploring the Esri Geometry API

Intro to GeolSON

Preparing the New York City Taxi Trip Data

Handling Invalid Records at Scale

Geospatial Analysis

Sessionization in Spark

Building Sessions: Secondary Sorts in Spark

Where to Go from Here

9.Estimating Financial Risk through Monte Carlo Simulation

Terminology

Methods for Calculating VaR

Variance—Covariance

Historical Simulation

Monte Carlo Simulation

Our Model

Getting the Data

Preprocessing

Determining the Factor Weights

Sampling

The Multivariate Normal Distribution

Running the Trials

Visualizing the Distribution of Returns

Evaluating Our Results

Where to Go from Here

10.Analyzing Genomics Data and the BDG Project

Decoupling Storage from Modeling

Ingesting Genomics Data with the ADAM CLI

Parquet Format and Columnar Storage

Predicting Tranion Factor Binding Sites from ENCODE Data

Querying Genotypes from the 1000 Genomes Project

Where to Go from Here

11.Analyzing Neuroimaging Data with PySpark and Thunder

Overview of PySpark

PySpark Internals

Overview and Installation of the Thunder Library

Loading Data with Thunder

Thunder Core Data Types

Categorizing Neuron Types with Thunder

Where to Go from Here

A.Deeper into Spark

B.Upcoming MLlib Pipelines API

Index

作者介绍:

Sandy Ryza,是Cloudera的不错数据科学家,也是Apache Spark项目的活跃贡献者。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:SPARK高级数据分析(影印版) 东南大学出版社在线阅读

在线听书地址:SPARK高级数据分析(影印版) 东南大学出版社在线收听

在线购买地址:SPARK高级数据分析(影印版) 东南大学出版社在线购买

原文赏析:

暂无原文赏析,正在全力查找中!

其它内容:

暂无其它内容!

书籍真实打分

故事情节:4分

人物塑造:7分

主题深度:5分

文字风格:8分

语言运用:7分

文笔流畅:4分

思想传递:7分

知识深度:4分

知识广度:9分

实用性:8分

章节划分:6分

结构布局:3分

新颖与独特:7分

情感共鸣:6分

引人入胜:5分

现实相关:5分

沉浸感:9分

事实准确性:4分

文化贡献:3分

网站评分

书籍多样性:5分

书籍信息完全性:9分

网站更新速度:7分

使用便利性:8分

书籍清晰度:8分

书籍格式兼容性:5分

是否包含广告:9分

加载速度:3分

安全性:7分

稳定性:5分

搜索功能:6分

下载便捷性:5分

下载点评

  • 五星好评(619+)
  • 二星好评(513+)
  • 三星好评(237+)
  • 在线转格式(389+)
  • 内容齐全(551+)
  • 无缺页(221+)
  • 藏书馆(134+)
  • 愉快的找书体验(443+)
  • 书籍完整(646+)
  • 好评多(347+)
  • 赞(206+)
  • 内容完整(590+)
  • 格式多(646+)

下载评价

网友 戈***玉:特别棒

网友 訾***晴:挺好的,书籍丰富

网友 冉***兮:如果满分一百分,我愿意给你99分,剩下一分怕你骄傲

网友 宓***莉:不仅速度快,而且内容无盗版痕迹。

网友 通***蕊:五颗星、五颗星,大赞还觉得不错!~~

网友 石***致:挺实用的,给个赞!希望越来越好,一直支持。

网友 印***文:我很喜欢这种风格样式。

网友 方***旋:真的很好,里面很多小说都能搜到,但就是收费的太多了

网友 隗***杉:挺好的,还好看!支持!快下载吧!

网友 利***巧:差评。这个是收费的

网友 步***青:。。。。。好

网友 马***偲:好 很好 非常好 无比的好 史上最好的

网友 冷***洁:不错,用着很方便

网友 谢***灵:推荐,啥格式都有

网友 孔***旋:很好。顶一个希望越来越好,一直支持。

网友 邱***洋:不错,支持的格式很多

版权声明

1本文:SPARK高级数据分析(影印版) 东南大学出版社转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • Visual C# 2010从入门到精通 在线 免费 umd 下载 txt pdf mobi pmlz
  • 野性的呼唤 在线 免费 umd 下载 txt pdf mobi pmlz
  • 理科综合 在线 免费 umd 下载 txt pdf mobi pmlz
  • 新东方 TOEFL iBT语法精要 在线 免费 umd 下载 txt pdf mobi pmlz
  • 高校舞蹈教育教学新模式研究 在线 免费 umd 下载 txt pdf mobi pmlz
  • 素食大全 在线 免费 umd 下载 txt pdf mobi pmlz
  • 眼耳鼻咽喉口腔科护理学(供本科护理学类专业用第4版全国高等学校教材) 在线 免费 umd 下载 txt pdf mobi pmlz
  • 堅定的錫兵 在线 免费 umd 下载 txt pdf mobi pmlz
  • 老板要懂的 法律常识 在线 免费 umd 下载 txt pdf mobi pmlz
  • 墨多多谜境冒险·阳光版7.青铜地宫的献礼 在线 免费 umd 下载 txt pdf mobi pmlz