博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Comprehensive learning path – Data Science in Python
阅读量:3762 次
发布时间:2019-05-22

本文共 1302 字,大约阅读时间需要 4 分钟。

原文:

综合学习路径 - Python中的数据科学

从Python菜鸟到高手之旅

所以,你想成为一名数据科学家,或者可能是你已经是一个,并希望扩大你的工具库。你来到了一个好地方。本文提供了一个使用Python进行数据分析的全面的学习路径。本学习路径提供了一个使用Python进行数据分的的全面的学习步骤。如果你已经有了一些基础知识,或者不需要所有的组件,可以随意调整自己的路径,同事让我们知道你在路径中做了哪些改变。

你还可以查看

第0步:热身

在开始旅途之前,第一个问题就是

为什么用Python,或者,Python如何有用?

第一步:设置你的机器

现在你已经做了决定,是时间设置你的机器了,最简单的方法是从Continuum.io下载。它与您将需要的大多数事情一起包装,采取这条路线的主要缺点是您需要等待Continuum更新软件包,即使可能有底层库可用的更新。 如果你是一个起步者,那就不要紧了。

如果您在安装过程中遇到任何问题,可以在找到有关各种操作系统的详细说明

第二步:学习python的基础知识

您应该首先了解语言的基础知识,库和数据结构,这里有一个四小时的免费的,这个教程将教会你怎么用pyhon来研究数据,你应该学会这个教程里的知识。

具体需要学习的部分有:列表,元祖,字典,列表解析,元祖解析
任务,参加
替代资源:如果你不喜欢这个教程,你也可以看一下,这是一个历史两天的教程,同时也涵盖了后面的一些知识。

第三步,学习正则表达式

因为我是java出身的,对正则表达式也有一些基础,所以我就略过了这部分的学习,如果后续需要的话,在择时加强,此部分的学习可以百度一下,有很多的学习资源。原文给出了一些学习资源,但是需要翻墙上网,所以这里就不在翻译了。倒是有一个挺有意思大家不妨去看看

第四步,学习NumPy, SciPy, Matplotlib and Pandas

这是乐趣开始的地方! 以下简要介绍各种库。 我们开始练习一些常见的操作。

1,彻底地练习,特别是NumPy数组。为今后的学习奠定良好的基础。

教程需要翻墙才能看,或者已经打不开了,但是百度也有很多的教程可以看

2,接下来,看看,看看简介和基础支持,做一些练习
3,
4,,
5,

用时你也可以看看和

其他资源:

如果你想买一本书,推荐Wes McKinney的
这里有一个,也可以参考
最终效果,解决这些哈佛的


经过一段时间的学习后,对numpy,matplotlib,pandas,也有了一些认识,接着做下一步,我是通过分析基金的数据来学习的,主要学习了matplotlib库。哈佛的作业我没做。

第五步:有效的数据可视化

去看看cs10g的讲座(这个资源没有了),你可以跳过前两分钟,但是后面的部分是非常酷的。另外一个

第六步:学习Scikit学习和机器学习

现在,我们到了整个过程的核心阶段,Scikit-learn是python机器学习中一个非常有用的库。这里有,看看讲座的讲座10到讲座18(翻墙吧),看完后会对机器学习有一个初步的了解,监督学习算法,如回归,决策树,集体建模和非监督学习算法,如聚类等。一些

转载地址:http://zdjpn.baihongyu.com/

你可能感兴趣的文章
在终端需要输入命令行运行,在pycharm运行的两种形式:更改参数运行和在终端运行
查看>>
PyCharm使用技巧及常用快捷键
查看>>
ubuntu内存爆满卡住,一顿操作任务栏菜单栏消失再解决办法记录
查看>>
ubuntu下pycharm无法输入中文解决办法(记录)
查看>>
torch.cuda.is_available()返回False的解决办法
查看>>
BITVehicle_Dataset数据集转换
查看>>
将视频转存成图片小代码
查看>>
ImportError: cannot import name ‘Line 解决方法
查看>>
Ubuntu 创建/删除虚拟环境
查看>>
deepsort算法中绘制轨迹部分的代码【记录】
查看>>
C++程序设计作业--坦克大战[分享]
查看>>
Uuntu20.04出现“qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in...已放弃 (核心已转储)”问题解决记录
查看>>
linux系统下,使用git clone拉取github上的仓库太慢、卡住问题解决【记录】
查看>>
Linux系统常用的基本操作记录
查看>>
ZeroDivisionError: integer division or modulo by zero解决记录
查看>>
“数据增强”学习记录
查看>>
使用软链接放置数据集
查看>>
TypeError: can‘t convert cuda:0 device type tensor to numpy. 解决记录
查看>>
在一个二维数组中查找整数【python实现】
查看>>
进程、线程、协程的联系与区别
查看>>