Python数据分析与机器学习实战
课程观看地址:http://www.xuetuwuyou.com/course/167
课程出自学途无忧网:http://www.xuetuwuyou.com
课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。
课程目标
零基础快速掌握python数据分析与机器学习算法; 快速入门python最流行的数据分析库numpy,pandas,matplotlib; 从原理上进行推导较为繁琐的机器学习算法,以算法流程为主结合实际案例实现完整的算法代码; 使用scikit-learn机器学习库完成快速建立模型,评估以及预测; 结合Kaggle经典案例,从数据预处理开始一步步完成整个项目,对如何应用python库完成实际的项目形成完整的经验与概念。
适合人群:
数据分析,机器学习,数据挖掘领域研究者。Python语言使用者。
课程目录:
第1 章 : Python环境配置
课时1:使用Anaconda安装python环境
课时2:Eclipse配置python插件
课时3:课程简介
第2 章 : Python科学计算库-Numpy
课时4:Numpy库简介
课时5:Array数组
课时6:数组操作
课时7:矩阵基本操作
课时8:矩阵的创建与初始化
课时9:常用函数案例演示
课时10:排序与索引
课时11:习题实例
第3 章 : python数据分析处理库-Pandas
课时12:Pandas库简介
课时13:数据读取与显示
课时14:数据样本行列选取
课时15:数值计算与排序
课时16:数据预处理与透视表
课时17:自定义函数方法
课时18:核心数据结构Series详解
课时19:数据索引变换
第4 章 : Python数据可视化库-Matplotlib
课时20:Matplotlib简介
课时21:画出第一个简易折线图
课时22:打造一个完整的折线图
课时23:条形图实战
课时24:直方图与四分图
课时25:基于真实数据集的可视化分析
课时26:可视化图表细节
第5 章 : Python机器学习案例实战
课时27:初识机器学习
课时28:使用python库分析汽车油耗效率
课时29:使用scikit-learn库建立回归模型
课时30:使用逻辑回归改进模型效果
课时31:模型效果衡量标准
课时32:ROC指标与测试集的价值
课时33:交叉验证
课时34:多类别问题代码
课时35:梯度下降原理
课时36:实现简易梯度下降算法
课时37:SVD奇异值分解原理
课时38:SVD推荐系统应用实例
课时39:K近邻算法原理
课时40:K近邻算法代码实现
课时41:K近邻实例
第6 章 : 决策树与随机森林
课时42:决策树算法原理
课时43:基于ID3算法进行特征选择
课时44:构建决策树
课时45:使用scikit-learn库建立决策树
课时46:分类回归树CART
课时47:分类回归树代码实现
课时48:随机森林模型
课时49:随机森林特征重要性
第7 章 : 聚类模型
课时50:无监督聚类问题
课时51:聚类结果与离群点分析
课时52:K-means聚类案例对NBA球员进行评估
课时53:K-MEANS原理
课时54:K-MEANS聚类算法实现
第8 章 : 支持向量机
课时55:支持向量机算法原理
课时56:支持向量机对偶问题
课时57:核变换解决低维不可分问题
课时58:soft-margin支持向量机
课时59:SMO算法求解支持向量机
第9 章 : 神经网络模型
课时60:初识神经网络
课时61:神经网络强大的非线性
课时62:深入神经网络细节
课时63:代码实现简易神经网络
课时64:深度学习-递归神经网络
课时65:神经网络打造二进制加法器
第10 章 : 贝叶斯模型
课时66:贝叶斯原理
课时67:基于贝叶斯的垃圾邮件分类
课时68:使用贝叶斯算法打造拼写检查器
课时69:K近邻算法实现
第11 章 : Adaboost算法
课时70:Adaboost算法原理
课时71:Adaboost实例
课时72:Adaboost实现代码
课时73:Adaboost训练模型
第12 章 : 机器学习项目实战-泰坦尼克获救预测
免费 课时74:船员数据分析
免费 课时75:数据预处理
课时76:使用回归算法进行预测
课时77:使用随机森林改进模型
课时78:随机森林特征重要性分析
第13 章 : 机器学习项目实战-贷款申请最大化利润
课时79:数据清洗过滤无用特征
课时80:数据预处理
课时81:获得最大利润的条件与做法
课时82:预测结果并解决样本不均衡问题
第14 章 : 机器学习项目实战-用户流失预警
课时83:数据背景介绍
课时84:数据预处理
课时85:尝试多种分类器效果
课时86:结果衡量指标的意义
课时87:应用阈值得出结果
第15 章 : 机器学习项目实战-HTTP日志聚类分析
课时88:建立特征工程
课时89:特征数据预处理
课时90:应用聚类算法得出异常IP点
Python数据分析与机器学习实战
《机器学习实战》热门书评
-
一个合格的读者,应该明白自己需要什么
63有用 3无用 Kord 2013-08-27
为什么我会力荐这本书?也许书中分类器都非常的简单,数学理论都非常的粗浅(为了看明白书中SVM分类器的训练过程,不得不去复习了二次凸优化解法,自己推导被作者略去的中间过程),算法测试也只在轻量级的数据集上完成。不过,大可不必像其他评论一样对贬低本书。聪明的读者会知道自己没有什么,自己需要学习什么。如果...
-
光看这一本想做机器学习,还远的很
19有用 0无用 锅巴肉片 2014-10-14
本文将从三方面评价此书:一、仅从启发兴趣来说,这本书已经是巨大的成功了。机器学习到底是什么,要我总结,它就是数学(统计学),所以尽情happy地去学机器学习吧,因为数学是不会过时的。一谈到数学,令人想到的就是繁杂的公式,晦涩的理论,考验脑细胞的思想。有时怕一说到“数学”二字,就要吓跑一大批要学习机器...
-
还好的一本实战书
10有用 0无用 a_31415926 2015-02-08
这本书的最大好处是让你能够用最基本的pyton语法,从底层上让你构建代码,实现我们常说的比如邮件过滤,数据分类的应用。很多时候你要写最基本的代码和结构去做这些工作,而不是像kaggle的tutorial或者其他的工程...
-
看机器学习困了累了,就玩玩这本实验指导书吧
7有用 5无用 何磊 2013-03-28
1. 这本书的价值是提供了一系列有趣的「实验作业」和「对应的数据」,以及乱七八糟的 Python 代码,迫使读者在同样数据集上自己写一个更好的。2. 作者的 Python 代码写得真的真的很渣。3. 作者的 SVM 写错了,不是 Platt 的原始 SMO 算法,里面的 error cache 形同...
-
只能说是本源码
6有用 2无用 WeBless 2013-08-07
这本书最大的优点在于有源码实现,很赞,但是理论部分太差了,看了逻辑回归和支持向量机两章,发现好多理论都没讲,就比如逻辑回归中的Cost函数都没说,如果不了解,源码读起来也是一头雾水,所以对于初学者还需要一本理论较强的书,推荐李航博士的统计机器学习方法,刚好配套~...