打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Python 数据挖掘 工具包整理
连接器与io
数据库
类别PythonR
MySQLmysql-connector-python(官方)RMySQL
Oraclecx_OracleROracle
MongoDBpymongoRMongo, rmongodb
ODBCpyodbcRODBC
IO类
类别PythonR
excelxlsxWriter, pandas.(from/to)_excel, openpyxlopenxlsx::read.xlsx(2), xlsx::read.xlsx(2)
csvcsv.writerread.csv(2), read.table
jsonjsonjsonlite
图片PILjpeg, png, tiff, bmp
统计类
描述性统计
类别PythonR
描述性统计汇总scipy.stats.descirbesummary
均值scipy.stats.gmean(几何平均数), scipy.stats.hmean(调和平均数), numpy.mean, numpy.nanmean, pandas.Series.meanmean
中位数numpy.median, numpy.nanmediam, pandas.Series.medianmedian
众数scipy.stats.mode, pandas.Series.mode未知
分位数numpy.percentile, numpy.nanpercentile, pandas.Series.quantilequantile
标准差scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.Series.stdsd
方差numpy.var, pandas.Series.varvar
变异系数scipy.stats.variation未知
协方差numpy.cov, pandas.Series.covcov
(Pearson)相关系数scipy.stats.pearsonr, numpy.corrcoef, pandas.Series.corrcor
峰度scipy.stats.kurtosis, pandas.Series.kurte1071::kurtosis
偏度scipy.stats.skew, pandas.Series.skewe1071::skewness
直方图numpy.histogram, numpy.histogram2d, numpy.histogramdd未知
回归
类别PythonR
普通最小二乘法回归(ols)statsmodels.ols, sklearn.linear_model.LinearRegressionlm,
广义线性回归(gls)statsmodels.glsnlme::gls, MASS::gls
假设检验
类别PythonR
t检验statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_relt.test
Pearson相关系数检验scipy.stats.pearsonrcor.test
时间序列
类别PythonR
ARstatsmodels.ar_model.ARar
ARIMAstatsmodels.arima_model.arimaarima
VARstatsmodels.var_model.var未知
SVM(支持向量机)
类别PythonR
支持向量分类器(SVC)sklearn.svm.SVCe1071::svm
非支持向量分类器(nonSVC)sklearn.svm.NuSVC未知
线性支持向量分类器(Lenear SVC)sklearn.svm.LinearSVC未知
基于临近
类别PythonR
k-临近分类器sklearn.neighbors.KNeighborsClassifier未知
半径临近分类器sklearn.neighbors.RadiusNeighborsClassifier未知
临近重心分类器(Nearest Centroid Classifier)sklearn.neighbors.NearestCentroid未知
贝叶斯
类别PythonR
朴素贝叶斯sklearn.naive_bayes.GaussianNBe1071::naiveBayes
多维贝叶斯(Multinomial Naive Bayes)sklearn.naive_bayes.MultinomialNB未知
伯努利贝叶斯(Bernoulli Naive Bayes)sklearn.naive_bayes.BernoulliNB未知
决策树
类别PythonR
决策树分类器sklearn.tree.DecisionTreeClassifiertree::tree, party::ctree
决策树回归器sklearn.tree.DecisionTreeRegressortree::tree, party::tree
随机森林分类器sklearn.ensemble.RandomForestClassifierrandomForest::randomForest, party::cforest
随机森林回归器sklearn.ensemble.RandomForestRegressorrandomForest::randomForest, party::cforest
聚类
类别PythonR
kmeansscipy.cluster.kmeans.kmeanskmeans::kmeans
分层聚类scipy.cluster.hierarchy.fcluster(stats::)hclust
关联规则
类别PythonR
apriori算法apriori(可靠性未知,不支持py3), PyFIM(可靠性未知,不可用pip安装)arules::apriori
FP-Growth算法fp-growth(可靠性未知,不支持py3), PyFIM(可靠性未知,不可用pip安装)未知
神经网络
类别PythonR
神经网络neurolab.net, keras.*nnet::nnet, nueralnet::nueralnet
深度学习keras.*不可靠包居多以及未知
文本基本操作
类别
PythonR
tokenizenltk.tokenize(英), jieba.tokenize(中)tau::tokenize
stemnltk.stemRTextTools::wordStem, SnowballC::wordStem
stopwordsstop_words.get_stop_wordstm::stopwords, qdap::stopwords
中文分词jieba.cut, smallseg, Yaha, finalseg, geniusjiebaR
TFIDFgensim.models.TfidfModel未知
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
NumPy、pandas、Matplotlib…8个Python库从安装到应用(附代码)
第二热门语言:从入门到精通,Python数据科学简洁教程
Python数据分析、挖掘常用工具
最新顶尖数据分析师必用的15大Python库(上)
大数据测试学习笔记之Python工具集
数据科学必备统计基础用Python描述你的数据的正确姿势
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服