百科狗-知识改变命运!
--

python数据分析相关的技术

梵高1年前 (2023-11-20)阅读数 13#技术干货
文章标签框架


1.机器学习和计算机视觉

Crab:灵活、快速的推荐引擎

gensim:人性化的话题建模库

hebel:GPU加速的深度学习库

NuPIC:智能计算Numenta平台

pattern:Python网络挖掘模块

PyBrain:另一个Python机器学习库

Pylearn2:一个基于Theano的机器学习库

python-recsys:一个用来实现推荐系统的Python库

scikit-learn:基于SciPy构建的机器学习Python模块

pydeep:Python深度学习库

vowpalporpoise:轻量级VowpalWabbit的Python封装

skflow:一个TensorFlow的简化接口(模仿scikit-learn)

Caffe:一个Caffe的python接口

OpenCV:开源计算机视觉库

pyocr:Tesseract和Cuneiform的包装库

pytesseract:GoogleTesseractOCR的另一包装库

SimpleCV:一个用来创建计算机视觉应用的开源框架

2.数据分析

blaze:NumPy和Pandas的大数据接口

cclib:一个用来解析和解释计算化学软件包输出结果的库

NetworkX:一个为复杂网络设计的高性能软件

Neupy:执行和测试各种不同的人工神经网络算法

python数据分析相关的技术

Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发

NumPy:使用Python进行科学计算的基础包

OpenBabel:一个化学工具箱,用来描述多种化学数据

OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)

orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习

Pandas:提供高性能,易用的数据结构和数据分析工具

PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib

PyMC:马尔科夫链蒙特卡洛采样工具

RDKit:化学信息学和机器学习软件

SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统

statsmodels:统计建模和计量经济学

SymPy:一个用于符号数学的Python库

cclib:一个用来解析和解释计算化学软件包输出结果的库

NetworkX:一个为复杂网络设计的高性能软件

Neupy:执行和测试各种不同的人工神经网络算法

Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发

NumPy:使用Python进行科学计算的基础包

OpenBabel:一个化学工具箱,用来描述多种化学数据

OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)

orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习

Pandas:提供高性能,易用的数据结构和数据分析工具

PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib

PyMC:马尔科夫链蒙特卡洛采样工具

RDKit:化学信息学和机器学习软件

SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统

statsmodels:统计建模和计量经济学

SymPy:一个用于符号数学的Python库

3.数据可视化

matplotlib:一个Python2D绘图库

bokeh:用Python进行交互式web绘图

ggplot:ggplot2给R提供的API的Python版本

plotly:协同Python和matplotlib工作的web绘图库

pyecharts:基于百度Echarts的数据可视化库

pygal:一个PythonSVG图表创建工具

pygraphviz:Graphviz的Python接口

PyQtGraph:交互式实时2D/3D/图像绘制及科学/工程学组件

SnakeViz:一个基于浏览器的Python'scProfile模块输出结果查看工具

vincent:把Python转换为Vega语法的转换工具

VisPy:基于OpenGL的高性能科学可视化工具

4.数据API构建及服务

·Django

django-rest-framework:一个强大灵活的工具,用来构建webAPI

django-tastypie:为Django应用开发API

django-formapi:为Django的表单验证,创建JSONAPIs

·Flask

flask-api:为flask开发的,可浏览WebAPIs

flask-restful:为flask快速创建RESTAPIs

flask-restless:为SQLAlchemy定义的数据库模型创建RESTfulAPIs

flask-api-utils:为Flask处理API表示和验证

eve:RESTAPI框架,由Flask,MongoDB等驱动

·Pyramid

cornice:一个Pyramid的REST框架

·与框架无关的

falcon:一个用来建立云API和webapp后端的高性能框架

sandman:为现存的数据库驱动系统自动创建RESTAPIs

restless:框架无关的REST框架,基于从Tastypie学到的知识

ripozo:快速创建REST/HATEOAS/HypermediaAPIs

5.爬虫及网页处理

Scrapy:一个快速高级的屏幕爬取及网页采集框架

cola:一个分布式爬虫框架

Demiurge:基于PyQuery的爬虫微型框架

feedparser:通用feed解析器

Grab:站点爬取框架

MechanicalSoup:用于自动和网络站点交互的Python库

portia:Scrapy可视化爬取

pyspider:一个强大的爬虫系统

RoboBrowser:一个简单的,Python风格的库,用来浏览网站,而不需要一个独立安装的浏览器

BeautifulSoup:以Python风格的方式来对HTML或XML进行迭代,搜索和修改

bleach:一个基于白名单的HTML清理和文本链接库

cssutils:一个Python的CSS库

html5lib:一个兼容标准的HTML文档和片段解析及序列化库

lxml:一个非常快速,简单易用,功能齐全的库,用来处理HTML和XML

MarkupSafe:为Python实现XML/HTML/XHTML标记安全字符串

pyquery:一个解析HTML的库,类似jQuery

untangle:将XML文档转换为Python对象,使其可以方便的访问

xhtml2pdf:HTML/CSS转PDF工具

xmltodict:像处理JSON一样处理XML

6.算法和设计模式

·Python实现的算法和设计模式。

algorithms:一个Python算法模块

python-patterns:Python设计模式的集合

sortedcontainers:快速,纯Python实现的SortedList,SortedDict和SortedSet类型

以上内容为大家介绍了Python数据分析相关的技术,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注开发教育。http://www.baikegou.com/

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)