本书由教科研经验丰富的专任教师、企业资深工程师、全国职业技能大赛一等奖获得者共同编著,依据“项目引领、任务驱动”思路,针对数据批量处理、流式处理、机器学习等Spark典型应用情境,设计了8个教学项目(涵盖SparkCore、SparkSQL、SparkStreaming、StructuredStreaming、Spar
本书针对大数据、云计算、软件技术、信息管理和其他计算机类专业学生的发展需求,系统、全面地介绍数据科学和大数据的基础入门、大数据采集与预处理、大数据存储、大数据计算平台、数据分析与数据挖掘、数据可视化等相关知识。本书将通过浅显易懂的案例、简化的技术和数学知识以方便高职院校学生学习,让学生在学习过程中获得成就感,从而激发学
面对日益严峻的数据安全形势和日趋复杂的数据应用场景,本书系统地介绍了数据安全治理的理论、方法与实践,旨在帮助读者深入理解数据安全治理的重要性和复杂性,掌握构建和维护有效数据安全体系的关键技能。本书共16章,每章重点突出,为读者提供了从理论到实践指导,帮助读者理解数据安全治理的背景与形势,掌握数据安全治理的基本理论、方法
本书的主要内容有:研究数据管理趋势,包括技术发展、法规要求和隐私问题。深?了解可拓展架构,学习各组件之间如何协同?作。探索数据治理和数据安全、主数据管理、?助式数据市场,以及元数据的重要性。
本书是一部关于医疗大数据和生物信息技术的综合性研究著作,内容涵盖从基本理论到实际应用的多个方面。全书共8章,详细探讨了数据挖掘、数据治理、机器学习、统计分析等核心技术及其在医疗卫生行业的应用实例。书中特别强调了数据的安全性与隐私保护问题,并提出了相应的解决策略。此外,作者还讨论了未来技术的发展趋势及可能带来的社会影响。
本书以互联网中的多媒体大数据为研究对象,主要包括词袋模型的对象识别基础知识、基于颜色合并的特征融合加权图像表示方法、基于上下文颜色注意力的多特征对象识别方法、基于颜色层次划分的多特征图像分类方法等内容。
本书采用项目式编写方法,以合理的结构、通俗易懂的语言、丰富实用的案例、学练结合的讲解方式,全面系统、循序渐进地介绍了数据挖掘的相关技术和实际应用。全书共分为8个项目,分别为数据挖掘基础、数据探索与预处理、分类、回归分析、聚类、关联规则挖掘、神经网络与深度学习和综合案例——北京二手房数据挖掘。
“大数据技术应用基础”是财经类专业学生学习财务大数据技术的入门课程。本书选取薪资管理、量化投资、固定资产管理3个常见的财务工作场景,详细介绍这些工作场景涉及的大数据基础知识、数据库基础操作和高级操作,以及数据采集和数据可视化等专业知识。
本书以Kettle工具实现ETL流程为目标,将ETL知识点与项目任务相结合,配套真实的案例,按照ETL的流程,循序渐进地介绍了ETL数据整合与处理的相关内容。全书共6个项目,项目1介绍了ETL概念和ETL工具;项目2以食品销售数据为例,介绍了获取不同类型源数据的方法,并说明了它们之间的差别;项目3以整合和处理某供应链的
本教材紧扣行业脉搏,以大数据与云计算技术在建筑领域的探索实践与场景应用为核心,精心编排内容。教材引入了行业一线的项目案例与工作场景,让适用性的理论知识与实际应用紧密结合,且生动形象。教材以大数据与云计算概述、大数据采集与预处理、大数据存储、大数据分析与挖掘、大数据可视化、大数据治理、虚拟化技术、云数据中心与云存储、并行