python中常用的工具包

更新时间:2020-06-01 09:42:50点击次数:365次
一、Python中常用的科学计算工具包:
1.1、NumPy
官方文档https://numpy.org/doc/stable//
中文文档https://www.numpy.org.cn/
简介
NumPy是Travis Oliphant的作品,是Python语言真正的主力分析工具。它为用户提供了多维数组,以及对这些数组进行多种数学操作的大型函数。
数组是眼多个维度排列的数据块,它实现了数学的向量和矩阵。数组不仅仅用来存储数据,还用于快速矩阵计算。
推荐安装命令
 pip install numpy

引用方法
python社区采用的一般惯例是导入NumPy模块时,修改名称为np:
import numpy as np

1.2、SciPy
官方文档https://docs.scipy.org/doc/scipy/reference/
简介
SciPy(Scientific Computing Tools for Python)完善了NumPy的功能,为多种引用提供了大量的科学算法,例如线性代数、稀疏矩阵、信号和图像处理、最优化、傅里叶变换、常微分方程求解等常用的计算。
推荐安装命令
 pip install scipy

引用方法
scipy中的子模块较多,一般使用哪个,引用哪个,且这些模块大部分都依赖于numpy,所以需要同时引入numpy:
import numpy as np
from scipy import stats
import scipy.optimize as opt 

1.3、Matplotlib
中文文档:https://www.matplotlib.org.cn/
官方文档:https://www.matplotlib.org
简介:
Matplotlib 是 Python 的绘图库,能根据数组创建高质量的图形,并交互的显示。 它也可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用,如 PyQt 和 wxPython。
matplotlib 提供了pylab模块,pylab包含许多像MATLAB一样的绘图库。
推荐安装命令
 pip install matplotlib

引用方法
import matplotlib.pyplot as plt

二、Python中常用的机器学习&数据挖掘工具包
2.1、pandas
中文文档:https://www.pypandas.cn/
官方文档:http://pandas.pydata.org/
简介:
pandas工具包能处理Scipy和numpy不能处理的问题。由于其特有的数据结构DataFrames(数据框)和Series,pandas可以处理包含不同类型数据的复杂表格和时间序列。
pandas可以轻松的加载各种类型的数据。同时,可以随意的对数据进行切片、切块、处理缺失元素、添加、重命名、聚合和可视化等操作。
 pip install pandas

引用方法
import pandas as pd

2.2、Scikit-learn
中文文档:https://www.cntofu.com/book/170/index.html
官方文档:http://scikit-learn.org/stable/
简介:
Scikit-learn 最初是Scikits(SciPy工具包)的一部分,它是Python数据科学处理的核心。它提供了所有机器学习可能用到的工具,如数据预处理、监督学习和无监督学习、验证和误差选择、模式选择。
scikit-learn是一个基于NumPy, SciPy, Matplotlib的开源机器学习工具包,主要涵盖分类,回归和聚类算法,例如SVM, 逻辑回归,朴素贝叶斯,随机森林,k-means等算法,代码和文档都非常不错,在许多Python项目中都有应用。例如在我们熟悉的NLTK中。scikit-learn提供了一致的调用接口。它基于Numpy和scipy等Python数值计算库,提供了高效的算法实现。总结起来,scikit-learn工具包有以下几个优点。
文档齐全:官方文档齐全,更新及时。
接口易用:
算法全面
缺点是scikit-learn不支持分布式计算,不适合用来处理超大型数据。

安装:
 pip install scikit-learn
 或者
 conda install scikit-learn

引用方法
scikit-learn的导入模块名称为sklearn
import sklearn

5、IPython
官方文档:https://pypi.org/project/ipython/
简介:
IPython,其中"i" 代表 交互 interactive,它满足了python交互式命令的需要,它是基于shell、web浏览器和应用程序接口的python版本,具有图形化集成、自定义指令、丰富的历史记录和并行计算等增强功能。
安装:
 pip install ipython

7、Statsmodels
中文文档:https://docs.apachecn.org/bookmark/statsmodels/l
官方文档:https://devdocs.io/statsmodels/
简介:
Statsmodels以前是Scikits的一部分,是SciPy统计函数的补充。statsmodels模块包含通用线性模型、离散选择模型、时间序列选择、一系列描述统计以及特性校验等。
安装:
 pip install statsmodels

引用方法
import statsmodels.api as sm

三、Python网页爬虫工具
8、Beautiful Soup
中文文档:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/
官方文档:http://www.crummy.com/software/BeautifulSoup/
简介:
Beautiful Soup是一个很优秀的HTML/XML解析器,用来分析从互联网上抽取出来的HTML和XML文档。甚至在网页有异常、矛盾和不正确标签时,它的效果也很好。
安装:
 pip install beautifulsoup4

引用方法
from bs4 import BeautifulSoup

9、NetworkX
中文文档:https://www.osgeo.cn/networkx/
官方文档:https://networkx.github.io/
简介:
NetworkX是由美国洛斯阿拉莫斯国家实验室(Los Alamos NationalLaboratory)开发,是一个专门进行现实生活网络数据创建、操作、分析和图示的软件包,它可以轻松的进行具有百万个节点和边的图操作。除了专门的图数据结构和良好的可视化方法(2D和3D),它为用户提供了许多标准的图的度量方法和算法,如最短路径、中心性、成分、群体、聚类和网页排名。
安装:
 pip install networkx

引用方法
通常networkx 的导入名称为 nx
import networkx as nx

四、Python文本处理工具
10、NLTK
中文文档:https://www.osgeo.cn/nltk/
官方文档:http://www.nltk.org/
简介:
NLTK(Natural Language Toolkit)自然语言工具箱能够访问语料和词汇库,提供从分词到词性标注、从树模型到命名实体识别等统计自然语言处理(Natural language processing NLP)的一整套函数。
安装:
 pip install nltk

引用方法
import nltk

11、Gensim
中文文档:https://github.com/apachecn/gensim-doc-zh
官方文档:https://radimrehurek.com/gensim/apiref.html
简介:
Gensim是由Radim开发的开源软件包,在并行分布式在线算法的帮助下,能进行大型文本集合分析。它具有许多高级功能,如实现了潜在语义分析(Latent Semantic Analysis,LSA)、通过LDA(Latent DirichletAllocation)进行主题建模等。Gensim还包含功能强大的谷歌word2vec算法,能将文本转换为矢量特征,再使用此矢量特征进行有监督和无监督的机器学习。
安装:
 pip install gensim

引用方法
import gensim

12、PyPy
官方文档:http://pypy.org/
简介:
PyPy不是软件包,它是Python 2.7.8的替代产品,支持大多数常用的Python标准包(遗憾的是,目前不完全支持NumPy)。PyPy的一个主要优势是提高了运行速度及内存处理能力,因此,非常适用于大型数据上的繁重操作,它应该成为大数据处理策略的一部分。

本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责,本站只提供参考并不构成任何投资及应用建议。本站是一个个人学习交流的平台,网站上部分文章为转载,并不用于任何商业目的,我们已经尽可能的对作者和来源进行了通告,但是能力有限或疏忽,造成漏登,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息
  • 项目经理 点击这里给我发消息