学会使用Power BI 的四大组件,分別是 Power Query、Power Pivot、Power View 和 Power Map,使得数据可视化和获得洞察力变得更为容易,学会SQL数据库应用基础,学会Python、R、SPSS等,学会运用统计学分析方法构建实战模型分析方法,并同结合Python软件实现等
课程大纲
可以独立完成数据报告撰写,理解活用多维数据模型结合恰当透视方法观测业务问题实现商业洞察,理解透视分析原理,理解DDL及DML语言等咨询详情
熟悉Python数据分析综合案例,熟悉docker应用部署、docker的私有仓库相关技术,熟悉数据清洗,可以完成缺失值填补、异常值处理等,熟悉Linux常用命令,能胜任基础大数据运维工作等咨询详情
掌握开发自动化交互式报表能力,掌握数据指标搭建与监测能力,并掌握如何基于数据进行解读分析、决策优化,掌握数据分析在各行业的应用场景,掌握商品数据分析框架等咨询详情
了解Spark技术应用实践
人工智能 人工智能的概念核心原理,
时代背景发展趋势
核心应用场景
大数据挖掘分析及机器学习 机器学习与挖掘分析
关联分析
分类与预测
聚类分析
Python in Hadoop Python 开发精要及核心分析包实战
Python 在Hadoop平台的开发实践
Spark技术应用实践 Spark SQL查询,Scala脚本(基于SPARK) Spark ML
典型的Spark计算模型和数据管理策略、资源管理策略、硬件配置特点
课程简介
熟练掌握数据科学领域的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
善用机器学习解决用户画像、精准营销、风险管理等商业问题
机器学习基础薄弱学员
高校在校生
待业、期待转行从事数据挖掘相关岗位的在职人员
CDA数据分析师level Ⅲ 考生。
希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
对数据挖掘技术感兴趣的各界人士
产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维
课程大纲
1数据库基本概念2DDL数据定义语言3DML数据操作语言
4单表查询5多表查询
6Python连接SQL
2控制流语句3自定义函数
4异常和错误5类与面向对象编程
6Numpy数组操作
7卡方分析8一元线性回归理论推导
9多元线性回归理论推导
3使用PySpark实现分布式计算
4数据接入策略与调度工具
1数据挖掘导论
2KNN
3贝叶斯4SVM
2决策树的模型调优3病马死亡归类与识别案例4用户分类-保险行业用户分类分析
1带正则项的回归分析
2大数据环境下的回归分析实现(Spark实现)
1集成学习的理论基础2AdaBoost
3随机森林及其Spark实现
4GBDT, XGBoost, LightGBM及Python实现
1数据处理的前沿方法:特征工程概要2数据不平衡问题3特征工程(特征的建构、选择、转换、学习)4感知器及多层感知器
11深度神经网络基础
12BP神经网络架构13反向传播算法14梯度与学习率专题15图像分析-手写数字自动识别
11数据的爬取(http原理、requests应用)
12文本数据清洗(正则表达式、HTML结构及xpath应用)
11分词与词性标注12文本信息提取13词嵌入(CBOW与Skip-gram)14构建文本信息库
15文本聚类算法
11聚类分析进阶(密度聚类,高混合聚类,谱聚类)12异常识别(孤立森林,局部异常因子)13交易反欺诈-异常交易识别案例
机器学习进阶(Level 3)第6周-大型项目案例
11实战项目-金融行业反欺诈
11数据挖掘概论
12高级数据处理与特征工程
13自然语言处理与文本分析
14机器学习算法
15机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化)
11互联网数字化运营
12何为数据产品经理
13Python 爬虫
14人工智能(深度学习)实战之图像识别
15Tableau 多维可视化分析
16SPSS 统计分析