R语言常用包分类
- 格式:docx
- 大小:17.10 KB
- 文档页数:4
基本包和函数R语音里面不同模型,参数type取值也不同。
例如,可能取值有prob、posterior、raw(朴素贝叶斯)、probability(请参考使用包的帮助文档确定),type="class"表示结果为分类。
mice包中的mice(data, m)函数:通过链式方程产生多个虚值。
data为数据框或包含不完整数据的矩阵,缺省值为NA;m为多重插补数,默认为5。
(随机森林)R语言plyr等包合并、排序、分析数据并编制香农-威纳指数常用包:1、caret包中的train(formula, data, method, metirc, trControl, tuneGrid, preProcess)函数(不同调谐参数的预测模型):设置一个网格的调整参数的一些分类和回归例程,适合每个模型,并计算基于重采样的性能测量。
method指定分类或回归模型的字符串;metric指定将用于选择的最佳模型的概要度量的字符串;trControl定义该函数行为值的列表;tuneGrid可能调整值的数据框;preProcess为指定的预处理参数。
caret包中的trianControl(method, number, repeats, selectionFunction)函数:训练控制参数。
method为重采样方法,有boot/boot632/cv/repeatedcv/LOOCV/LGOCV/none/oob/adaptive_cv/adaptive_boot/adaptive_L GOCV;number为重采样的迭代次数;repeats为几重交叉验证;selectionFunction选择最佳调整参数的函数。
caret包中的findCorrelation(x, cutoff)函数:确定高度相关变量。
x为相关系数矩阵;cutoff 成对相关系数绝对值的截止值。
caret包中的rfeControl(functions, method, number)函数:控制特征选择算法。
R语言常用计量分析包R语言在数据分析领域非常受欢迎,拥有许多功能强大的计量分析包。
以下是一些常用的R语言计量分析包:1. Statistics(统计学)包:这是R语言的核心包,提供了许多基本的统计分析函数,如均值、方差、相关系数、回归分析等。
2. ggplot2包:ggplot2是一个强大的绘图包,基于"Grammar of Graphics"理念。
它可以用来绘制各种类型的图表,包括散点图、折线图、柱状图、箱线图等,具有高度的可定制性。
3. dplyr包:dplyr是一个数据处理包,提供了一套简洁、一致并且高效的函数,可以进行数据的筛选、汇总、变换等操作。
它的功能十分强大,使得数据清洗和整理更加简单。
4. tidyr包:tidyr是另一个数据处理包,专用于数据的整理和重构。
它可以将数据从"宽"格式转换成"长"格式,或者反之。
tidyr与dplyr可以很好地结合使用,帮助用户进行数据清洗和整理。
5. car包:car是一个用于进行统计分析和线性回归建模的包。
它提供了许多有用的函数和工具,如偏回归图、影响统计量、残差图等。
car包还包含了许多统计量和假设检验的函数。
6.MASS包:MASS是一个在统计学中广泛使用的包,提供了大量的统计分析和数据建模函数。
这些函数包括线性回归、主成分分析、广义线性模型、聚类分析等。
7. forecast包:forecast包是一个用于时间序列分析和预测的包。
它提供了许多方法和函数,如ARIMA模型、指数平滑、动态回归等。
forecast包非常适用于需要分析和预测时间序列数据的用户。
8. lme4包:lme4是一个用于拟合线性混合效应模型的包。
它可以处理具有随机和固定效应的数据,提供了高度灵活的模型拟合方法。
9. survival包:survival是用于生存分析的包,可用于评估与时间相关的事件(如死亡、失业等)的影响因素。
R语言在主成分分析中的应用及效果评估主成分分析(Principal Component Analysis, PCA)是一种常用的多元统计分析方法,用于降低数据维度并提取数据中的主要信息。
R语言作为一种广泛使用的统计分析工具,提供了许多函数和包来执行主成分分析,并且易于使用和灵活性强。
本文将介绍R语言在主成分分析中的应用,并对其效果进行评估。
一、R语言中的主成分分析函数和包R语言中有多个函数和包可用于执行主成分分析。
其中,常用的包括:1. stats包中的prcomp()函数:用于执行主成分分析并计算主成分的分数、载荷和方差解释比例。
2. FactoMineR包:提供了一套完整的主成分分析工具,包括基本的主成分分析、多组主成分分析和分组主成分分析等。
3. PCA包:提供了一些专门用于主成分分析的函数,并且可以进行图形化展示和结果解释。
通过使用这些函数和包,可以方便地进行主成分分析,并对结果进行进一步的分析和解释。
二、主成分分析在数据降维中的应用主成分分析主要用于数据降维,即将高维度的数据映射到低维度的空间中,以便更好地理解数据和进行可视化。
通过主成分分析,可以得到主成分分数,即每个样本对应的主成分值,可以用于表示原始数据样本在主成分空间中的位置。
此外,主成分载荷可用于解释主成分的含义,即每个原始变量在主成分中的权重。
通过选择适当数量的主成分,可以实现数据的有效降维,减少变量间的相关性,并更好地理解数据。
三、主成分分析的效果评估方法评估主成分分析的效果主要包括以下几个方面:1. 方差解释比例:主成分分析中,每个主成分的方差解释比例可以用于评估主成分分析结果的质量。
方差解释比例表示每个主成分所占的方差比例,比例越高则说明该主成分能够较好地解释原始数据的变异性。
2. 主成分载荷:主成分载荷反映了原始变量在主成分中的权重。
通过分析主成分载荷,可以确定哪些变量对于某个主成分有最大贡献,从而更好地理解主成分分析的结果。
R语言数据分析全面解析数据分析是当今数字时代中的一项重要技能,它在各个行业中都扮演着至关重要的角色。
而R语言作为一种强大的数据分析工具,被越来越多的人所关注和使用。
本文将对R语言数据分析进行全面解析,从安装到基本语法,再到常用库和实际案例,以帮助读者更全面地了解和运用R语言进行数据分析。
第一部分:R语言概述首先,我们来了解一下R语言的基本概念和特点。
R语言是一种自由、功能强大且可扩展的统计计算和绘图软件,它是由新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼在1995年所创建的。
R语言的特点包括:开源免费、跨平台、易于学习、丰富的数据分析功能等。
它通过命令行进行操作,也可以通过图形界面进行交互操作。
第二部分:安装R语言在正式开始学习R语言之前,我们首先要完成R语言的安装。
R语言的官方网站提供了Windows、macOS和Linux等多个平台的安装包,可以根据自己的操作系统下载并安装对应的版本。
安装完成后,打开R语言的命令行界面,就可以开始使用了。
第三部分:R语言基础语法R语言的基础语法相对简单,但是熟练掌握它对于进行数据分析至关重要。
首先,我们来了解一下R语言的数据类型,如数值型、字符型、逻辑型等。
然后,学习基本的运算符和控制语句,如算术运算符、关系运算符、函数的定义与调用等。
此外,还需要了解R语言的数据结构,如向量、矩阵、数组、数据框等。
第四部分:常用R包介绍R语言的强大之处在于它丰富的扩展包,通过安装和加载相应的包,可以实现更多高级的数据分析功能。
在这一部分,我们将介绍一些常用的R包。
例如,ggplot2包可以帮助用户实现精美的数据可视化,dplyr包提供了强大的数据处理函数,caret包则是用于机器学习和模型训练的利器。
第五部分:实际案例分析最后,我们通过一个实际案例来展示R语言在数据分析中的应用。
例如,我们可以选择一个销售数据集,通过加载所需的R包和编写相应的代码,对数据进行清洗、探索性分析和建模。
【R】R语⾔常⽤包汇总⼀、⼀些函数包⼤汇总时间上有点过期,下⾯的资料供⼤家参考基本的R包已经实现了传统多元统计的很多功能,然⽽CRNA的许多其它包提供了更深⼊的多元统计⽅法,下⾯要综述的包主要分为以下⼏个部分:1)多元数据可视化(Visualising multivariate data)绘图⽅法 基本画图函数(如:pairs()、coplot())和 lattice包⾥的画图函数(xyplot()、splom())可以画成对列表的⼆维散点图,3维密度图。
car 包⾥的scatterplot.matrix()函数提供更强⼤的⼆维散点图的画法。
cwhmisc包集合⾥的cwhplot包的pltSplomT()函数类似pair()画散点图矩阵,⽽且可以在对⾓位置画柱状图或密度估计图。
除此之外,scatterplot3d包可画3维的散点图,aplpack包⾥bagplot()可画⼆变量的boxplot,spin3R()可画可旋转的三维点图。
misc3d包有可视化密度的函数。
YaleToolkit包提供许多多元数据可视化技术,agsemisc也是这样。
更特殊的多元图包括:aplpack包⾥的faces()可画Chernoff’s face;MASS包⾥的parcoord()可画平⾏坐标图(矩阵的每⼀⾏画⼀条线,横轴表⽰矩阵的每列); graphics包⾥的stars()可画多元数据的星状图(矩阵的每⼀⾏⽤⼀个星状图表⽰)。
ade4包⾥的mstree()和vegan包⾥的spantree()可画最⼩⽣成树。
calibrate包⽀持双变量图和散点图,chplot包可画convex hull图。
geometry包提供了和qhull库的接⼝,由convexhulln()可给出相应点的索引。
ellipse包可画椭圆,也可以⽤plotcorr()可视化相关矩阵。
denpro包为多元可视化提供⽔平集树形结构(level set trees)。
【收藏】R数据分析常用包与函数2016-09-26R语言作为入门槛较低的解释性编程语言,受到从事数据分析,数据挖掘工作人员的喜爱,在行业排名中一直保持较高的名次(经常排名第一),下面列出了可用于数据分析、挖掘的R包和函数的集合。
1、聚类常用的包:fpc,cluster,pvclust,mclust基于划分的方法: kmeans, pam, pamk, clara基于层次的方法: hclust, pvclust, agnes, diana基于模型的方法: mclust基于密度的方法: dbscan基于画图的方法: plotcluster, plot.hclust基于验证的方法: cluster.stats2、分类常用的包:rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,survival决策树: rpart, ctree随机森林: cforest, randomForest回归, Logistic回归, Poisson回归: glm, predict, residuals生存分析: survfit, survdiff, coxph3、关联规则与频繁项集常用的包:arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则DRM:回归和分类数据的重复关联模型APRIORI算法,广度RST算法:apriori, drmECLAT算法:采用等价类,RST深度搜索和集合的交集:eclat4、序列模式常用的包:arulesSequencesSPADE算法:cSPADE5、时间序列常用的包:timsac时间序列构建函数:ts成分分解: decomp, decompose, stl, tsr6、统计常用的包:Base R, nlme方差分析: aov, anova假设检验: t.test, prop.test, anova, aov线性混合模型:lme主成分分析和因子分析:princomp7、图表条形图: barplot饼图: pie散点图: dotchart直方图: hist箱线图boxplotQQ图: qqnorm, qqplot, qqlineBi-variate plot: coplot树图: rpartParallel coordinates: parallel, paracoor, parcoord热图, contour: contour, filled.contour其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot, assocplot, mosaicplot8、数据操作缺失值:na.omit变量标准化:scale变量转置:t抽样:sample其他:aggregate, merge, reshape。
r中的sentiment analysisR中的情感分析一、引言情感分析是一种自然语言处理技术,它能够自动识别文本中所表达的情感,并对其进行分类。
在社交媒体时代,情感分析的应用越来越广泛,包括政治选举、产品评价、新闻报道等。
R语言作为一种强大的统计分析工具,也提供了丰富的包和工具来实现情感分析。
本文将介绍如何使用R进行情感分析。
二、数据准备在进行情感分析之前,我们需要准备一些文本数据。
可以从网上下载一些公开的数据集,或者自己创建一些数据。
确保数据集中的文本是正确的,并且没有语法错误和拼写错误。
三、安装和加载必要的包在R中进行情感分析,我们需要使用一些专门的包。
其中最常用的包包括“tm”和“SnowballC”。
可以通过以下命令安装和加载这些包:```rinstall.packages("tm“Corpus”类来构建文本语料库。
可以将准备好的文本数据加载到语料库中。
可以使用“VectorSource”类来创建文本向量,并将其添加到语料库中。
还可以使用“Sentence”类来对文本进行分句处理。
```rcorpus <- Corpus(VectorSource(text_data))```五、文本预处理在进行情感分析之前,需要对文本进行预处理,包括去除停用词、词干化、词形还原等。
可以使用R中的“tm”包提供的函数来完成这些操作。
例如,可以使用“removePunctuation”、“tolower”和“tolower_words”函数将文本转换为小写并移除标点符号。
```rpreprocessed_corpus <- preprocess(corpus, stopwords = TRUE)```六、创建词典和模型情感分析的关键是建立一个情感词典和一个机器学习模型。
可以使用R中的“sentiment”包来创建情感词典和模型。
该包提供了多种情感分析算法,包括基于机器学习的方法和基于规则的方法。
1、聚类∙常用的包:fpc,cluster,pvclust,mclust∙基于划分的方法: kmeans, pam, pamk, clara∙基于层次的方法: hclust, pvclust, agnes, diana∙基于模型的方法: mclust∙基于密度的方法: dbscan∙基于画图的方法: plotcluster, plot.hclust∙基于验证的方法: cluster.stats2、分类∙常用的包:rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,survival∙决策树: rpart, ctree∙随机森林: cforest, randomForest∙回归, Logistic回归, Poisson回归: glm, predict, residuals∙生存分析: survfit, survdiff, coxph3、关联规则与频繁项集∙常用的包:arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则DRM:回归和分类数据的重复关联模型∙APRIORI算法,广度RST算法:apriori, drm∙ECLAT算法:采用等价类,RST深度搜索和集合的交集:eclat 4、序列模式∙常用的包:arulesSequences∙SPADE算法:cSPADE5、时间序列∙常用的包:timsac∙时间序列构建函数:ts∙成分分解: decomp, decompose, stl, tsr6、统计∙常用的包:Base R, nlme∙方差分析: aov, anova∙密度分析: density∙假设检验: t.test, prop.test, anova, aov∙线性混合模型:lme∙主成分分析和因子分析:princomp∙方差分析对应的是Kruskal-Wallis秩和检验(R: kruskal.test) T检验对应的是Wilcoxon符号秩和检验(R: wilcox.test)7、图表∙条形图: barplot∙饼图: pie∙散点图: dotchart∙直方图: hist∙密度图: densityplot∙蜡烛图, 箱形图boxplot∙QQ (quantile-quantile) 图: qqnorm, qqplot, qqline∙Bi-variate plot: coplot∙树: rpart∙Parallel coordinates: parallel, paracoor, parcoord∙热图, contour: contour, filled.contour∙其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,assocplot, mosaicplot∙保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png 8、数据操作∙缺失值:na.omit∙变量标准化:scale∙变量转置:t∙抽样:sample∙堆栈:stack, unstack∙其他:aggregate, merge, reshape9、与数据挖掘软件Weka做接口∙RWeka: 通过这个接口,可以在R中使用Weka的所有算法。
R语言常用计量分析包CRAN任务视图:计量经济学线形回归模型(Linear regression models)线形模型可用stats包中lm()函数通过OLS来拟合,该包中也有各种检验方法用来比较模型,如:summary() 和anova()。
lmtest包里的coeftest()和waldtest()函数是也支持渐近检验(如:z检验而不是检验,卡方检验而不是F检验)的类似函数。
car包里的linear.hypothesis()可检验更一般的线形假设。
HC和HAC协方差矩阵的这些功能可在sandwich包里实现。
car和lmtest包还提供了大量回归诊断和诊断检验的方法。
工具变量回归(两阶段最小二乘)由AER包中的ivreg()提供,其另外一个实现sem包中的tsls()。
微观计量经济学(Microeconometrics)许多微观计量经济学模型属于广义线形模型,可由stats包的glm()函数拟合。
包括用于选择类数据(choice data)的Logit和probit模型,用于计数类数据(count data)的poisson模型。
这些模型回归元的值可用effects获得并可视化。
负二项广义线形模型可由MASS包的glm.nb()实现。
aod包提供了负二项模型的另一个实现,并包含过度分散数据的其它模型。
边缘(zero-inflated)和hurdle计数模型可由pscl包提供。
多项响应(Multinomial response):特定个体协变量(individual-specific covariates)多项模型只能由nnet包中multinom()函数提供。
mlogit包实现包括特定个体和特定选择(choice-specific)变量。
多项响应的广义可加模型可由VGAM包拟合。
针对多项probit模型的贝叶斯方法由MNP包提供,各种贝叶斯多项模型(包括logit和probit)在bayesm包中可得。
【R语言】必学包之dplyr包R包dplyr可用于处理R内部或者外部的结构化数据,相较于plyr 包,dplyr专注接受dataframe对象, 大幅提高了速度,并且提供了更稳健的数据库接口。
同时,dplyr包可用于操作Spark的dataframe。
本文只是基础的dplyr包学习笔记,所以并不会讨论一些高级应用,或者与data.table包的性能比较。
1. 数据集类型转换tbl_df()可用于将过长过大的数据集转换为显示更友好的 tbl_df 类型。
使用dplyr包处理数据前,建议先将数据集转换为tbl对象。
语法: tbl_df(data)举例 1:[plain] view plain copyprint?1.#data.frame类型数据集2.class(mtcars)3.#转换为tbl_df类型4.ds <- tbl_df(mtcars)5.#转换为data.frame类型6.df <- as.data.frame(ds)2. 筛选: filterfilter() 和slice()函数可以按给定的逻辑条件筛选出符合要求的子数据集, 类似于base::subset() 函数,但代码更加简洁, 同时也支持对同一对象的任意个条件组合(表示AND时要使用&或者直接使用逗号),返回与.data相同类型的对象。
原数据集行名称会被过滤掉。
语法: filter(.data, ...)举例 1:[plain] view plain copyprint?1.#过滤出cyl == 8的行2.filter(mtcars, cyl == 8)3.filter(mtcars, cyl < 6)4.#过滤出cyl < 6 并且 vs == 1的行5.filter(mtcars, cyl < 6 & vs == 1)6.filter(mtcars, cyl < 6, vs == 1)7.#过滤出cyl < 6 或者 vs == 1的行8.filter(mtcars, cyl < 6 | vs == 1)9.#过滤出cyl 为4或6的行10.filter(mtcars, cyl %in% c(4, 6))语法: slice(.data, ...)slice() 函数通过行号选取数据。
R语言常用计量分析包CRAN任务视图:计量经济学线形回归模型(Linear regression models)线形模型可用stats包中lm()函数通过OLS来拟合,该包中也有各种检验方法用来比较模型,如:summary() 和anova()。
lmtest包里的coeftest()和waldtest()函数是也支持渐近检验(如:z检验而不是检验,卡方检验而不是F检验)的类似函数。
car包里的linear.hypothesis()可检验更一般的线形假设。
HC和HAC协方差矩阵的这些功能可在sandwich包里实现。
car和lmtest包还提供了大量回归诊断和诊断检验的方法。
工具变量回归(两阶段最小二乘)由AER包中的ivreg()提供,其另外一个实现sem包中的tsls()。
微观计量经济学(Microeconometrics)许多微观计量经济学模型属于广义线形模型,可由stats包的glm()函数拟合。
包括用于选择类数据(choice data)的Logit和probit模型,用于计数类数据(count data)的poisson模型。
这些模型回归元的值可用effects获得并可视化。
负二项广义线形模型可由MASS包的glm.nb()实现。
aod包提供了负二项模型的另一个实现,并包含过度分散数据的其它模型。
边缘(zero-inflated)和hurdle计数模型可由pscl包提供。
多项响应(Multinomial response):特定个体协变量(individual-specific covariates)多项模型只能由nnet包中multinom()函数提供。
mlogit包实现包括特定个体和特定选择(choice-specific)变量。
多项响应的广义可加模型可由VGAM包拟合。
针对多项probit模型的贝叶斯方法由MNP包提供,各种贝叶斯多项模型(包括logit和probit)在bayesm包中可得。
R语言层次聚类分析层次聚类分析是一种常用的聚类分析方法,常用于对数据进行分类和群组划分。
该方法通过计算数据点间的相似度或距离矩阵,将数据点聚集为不同的群组或类别。
层次聚类分析的优势在于可以通过可视化结果来直观地理解数据的结构和组织。
层次聚类方法可以分为两类:凝聚式和分裂式。
凝聚式层次聚类方法从每个数据点作为单独的类别开始,然后将它们合并成越来越大的类别,直到所有数据点都被合并为一个类别。
而分裂式层次聚类方法则是从所有数据点作为一个类别开始,然后逐步将其中的数据点划分为不同的类别,直到每个数据点都被划分到一个单独的类别中。
在R语言中,可以使用不同的包来实现层次聚类分析。
最常用的包包括`hclust`、`agnes`和`dendextend`。
其中,`hclust`包提供了凝聚式层次聚类的函数,`agnes`包提供了凝聚式层次聚类的函数,并提供了更多的选项和功能,`dendextend`包则提供了对层次聚类结果的可视化和扩展功能。
以下是一个基本的层次聚类分析的示例:```R#安装和加载相关的包install.packages("cluster")library(cluster)#创建数据集set.seed(123)x <- matrix(rnorm(60), ncol = 3)#计算数据点间的欧氏距离dist_matrix <- dist(x)hc <- hclust(dist_matrix)#绘制层次聚类结果的树状图plot(hc)```在这个例子中,我们首先创建了一个包含3个变量的数据集,其中包含了60个数据点。
然后使用`dist`函数计算了数据点间的欧氏距离,得到了距离矩阵。
接下来,我们使用`hclust`函数进行层次聚类分析,得到了一个聚类结果的树状图。
最后,使用`plot`函数对树状图进行可视化。
除了这个基本示例之外,还可以使用不同的参数和选项来进一步定制层次聚类分析。
r语言代数运算包
R语言是一种流行的统计分析和数据可视化编程语言,它具有丰富的包和库来支持各种代数运算。
其中一些常用的代数运算包包括:
1. "base" 包,R语言的基本包中包含了许多代数运算所需的函数和操作符。
这些函数包括基本的加减乘除运算、幂运算、对数运算、三角函数等。
2. "Matrix" 包,这个包提供了在R中进行矩阵运算所需的函数和工具。
它支持矩阵的创建、转置、乘法、求逆、特征值分解等操作,非常适合进行线性代数方面的运算。
3. "pracma" 包,这个包提供了许多高级的数值计算和数学函数,包括矩阵分解、特征值计算、插值、微分方程求解等。
它对于进行复杂的代数运算和数值计算非常有用。
4. "Rcpp" 包,这个包允许在R中调用C++代码,从而可以利用C++的高效性能进行代数运算,特别是对于大规模数据的运算来说,这个包非常有用。
5. "gmp" 包,如果需要进行大整数或大浮点数的高精度计算,
这个包提供了高精度的算术运算函数,可以满足对于精度要求较高
的代数运算需求。
以上列举的包只是R语言中支持代数运算的众多包中的一部分,每个包都有其特定的优势和适用范围。
在实际的数据分析和数学建
模中,根据具体的需求和问题,选择合适的包来进行代数运算是非
常重要的。
希望以上信息能够帮助你更好地了解R语言中的代数运
算包。
r横截面空间计量
横截面空间计量是空间计量学的一个分支,主要研究横截面数据
(即同一时间点或短时间内的不同个体或区域的数据)的空间依赖
性和空间异质性。
在R语言中,可以使用一些特定的包和函数来进
行横截面空间计量的分析。
以下是一些常用的R包和函数:
1.spdep包:用于空间权重矩阵的生成和空间统计分析,包括全局
和局部的空间自相关分析、空间权重矩阵的可视化等。
常用的函数包括lw()(生成空间权重矩阵)、moran()(计算莫兰指数)
等。
2.sp包:用于空间数据的读取、处理和可视化,包括点、线、面
等类型的空间数据。
常用的函数包括readGDAL()(读取地理数
据)、spplot()(绘制地图)等。
3.rgdal包:用于读写地理信息系统(GIS)格式的数据,包括
Shapefile、GeoJSON等格式。
常用的函数包括readOGR()(读
取Shapefile格式数据)、writeOGR()(写入Shapefile格式数据)等。
4.raster包:用于栅格数据的处理和分析,包括遥感影像、数字高
程模型等。
常用的函数包括raster()(读取栅格数据)、extract()(提取栅格数据)等。
5.rgdal和raster包中还有一些函数可以用于空间插值、空间回归
分析等,如ginterp()(全局插值)、gstat()(全局统计)、lsei()(局部空间回归)等。
以上是一些常用的R包和函数,具体使用方法可以参考相关文档和
教程。
R的应用领域包介绍 By R-FoxAnalysis of Pharmacokinetic Data 药物(代谢)动力学数据分析网址:/web/views/Pharmacokinetics.html维护人员:Suzette Blanchard版本:2008-02-15翻译:R-fox, 2008-04-12药物(代谢)动力学数据分析的主要目的是用非线性浓度时间曲线(concentration time curve)或相关的总结(如曲线下面积)确定给药方案(dosing regimen)和身体对药物反应间的关系。
R基本包里的nls()函数用非线性最小二乘估计法估计非线性模型的参数,返回nls类的对象,有 coef(),formula(), resid(),print(), summary(),AIC(),fitted() and vcov()等方法。
在主要目的实现后,兴趣就转移到研究属性(如:年龄、体重、伴随用药、肾功能)不同的人群是否需要改变药物剂量。
在药物(代谢)动力学领域,分析多个个体的组合数据估计人群参数被称作群体药动学(population PK)。
非线性混合模型为分析群体药动学数据提供了自然的工具,包括概率或贝叶斯估计方法。
nlme包用Lindstrom和Bates提出的概率方法拟合非线性混合效应模型(1990, Biometrics 46, 673-87),允许nested随机效应(nested random effects),组内误差允许相关的或不等的方差。
返回一个nlme类的对象表示拟合结果,结果可用print(),plot()和summary() 方法输出。
nlme对象给出了细节的结果信息和提取方法。
nlmeODE包组合odesolve包和nlme包做混合效应建模,包括多个药动学/药效学(PK/PD)模型。
面版数据(panel data)的贝叶斯估计方法在CRAN的Bayesian Inference任务列表里有所描述(/web/views/Bayesian.html)。
R贝叶斯包分类介绍(R task view of Bayesian)翻的很烂, 请各位指正, 一定参考原文啊./web/views/Bayesian.html下面是翻译.=========一般模型==================arm包: 包括使用lm,glm,mer,polr等对象进行贝叶斯推断的R函数BACCO: 随机函数的贝叶斯分析. 包含3个子包: emulator, calibrator, and approximator, 进行贝叶斯估计和评价计算机程序.bayesm: 市场与微经济分析模型的许多贝叶斯推断函数. 模型包括线性回归, 多项式logit, 多项式probit, 多元probit, 多元混合normals(包括聚类), 密度估计-使用有限混合正态模型与Dirichlet先验过程, 层次线性模型, 层次多元logit, 层次负二项回归模型, 线性工具变量模型(linear instrumental variable models).bayesSurv: 生存回归模型的贝叶斯推断.DPpackage: 贝叶斯非参数和半参数模型. 现在还包括密度估计, ROC曲线分析, 区间一致数据, 二项回归模型, 广义线性模型和IRT类型模型的半参数方法.MCMCpack: 特定模型的MCMC模拟算法, 广泛用于社会和行为科学. 拟合很多回归模型的R函数. 生态学模型推断. 还包括一个广义Metropolis采样器, 适合任何模型.mcmc: 随机行走Metropolis算法, 对于连续随机向量.==========特殊模型和方法=============AdMit: 拟合适应性混合t分布拟合目标密度使用核函数.bark: 实现(Bayesian Additive Regression Kernels)BayHaz: 贝叶斯估计smooth hazard rates, 通过Compound Poisson Process (CPP) 先验概率. bayesGARCH: 贝叶斯估计GARCH(1,1) 模型, 使用t分布.BAYSTAR: 贝叶斯估计threshold autoregressive modelsBayesTree: implements BART (Bayesian Additive Regression Trees) by Chipman, George, and McCulloch (2006).BCE: 从生物注释数据中估计分类信息.bcp: a Bayesian analysis of changepoint problem using the Barry and Hartigan product partition model. BMA:BPHO: 贝叶斯预测高阶相互作用, 使用slice 采样技术.bqtl: 拟合quantitative trait loci (QTL) 模型.可以估计多基因模型, 使用拉普拉斯近似. 基因座内部映射(interval mapping of genetic loci).bim: 贝叶斯内部映射, 使用MCMC方法.bspec: 时间序列的离散功率谱贝叶斯分析cslogistic: 条件特定的logistic回归模型(conditionally specified logistic regression model)的贝叶斯分析.deal: 逆运算网络分析: 当前版本覆盖离散和连续的变量, 在正态分布下.dlm: 贝叶斯与似然分析动态信息模型. 包括卡尔曼滤波器和平滑器的计算, 前向滤波后向采样算法.EbayesThresh: thresholding methods 的贝叶斯估计. 尽管最初的模型是在小波下开发的, 当参数集是稀疏的, 用户也可以受益.eco: 使用MCMC方法拟合贝叶斯生态学推断in two by two tablesevdbayes: 极值模型的贝叶斯分析.exactLoglinTest: log-linear models 优度拟合检验的条件P值的MCMC估计.HI: transdimensional MCMC 方法几何途径, 和随机多元Adaptive Rejection Metropolis Sampling. G1DBN: 动态贝叶斯网络推断.Hmisc内的gbayes()函数, 当先验和似然都是正态分布, 导出后验(且最优)分布, 且当统计量来自2-样本问题.geoR包的krige.bayes()函数地理统计数据的贝叶斯推断, 允许不同层次的模型参数的不确定性. geoRglm 包的binom.krige.bayes() 函数进行贝叶斯后验模拟, 二项空间模型的空间预测. MasterBayes: MCMC方法整合家谱数据(由分子和形态数据得来的)lme4包的mcmcsamp()函数信息混合模型和广义信息混合模型采样.lmm: 拟合信息混合模型, 使用MCMC方法.MNP: 多项式probit模型, 使用MCMC方法.MSBV AR: 估计贝叶斯向量自回归模型和贝叶斯结构向量自回归模型.pscl: 拟合item-response theory 模型, 使用MCMC方法, 且计算beta分布和逆gamma分布的最高密度区域RJaCGH: CGH微芯片的贝叶斯分析, 使用hidden Markov chain models. 正态数目的选择根据后验概率, 使用reversible jump Markov chain Monte Carlo Methods 计算.sna: 社会网络分析, 包含函数用于从Butt's贝叶斯网络精确模型, 使用MCMC方法产生后验样本. tgp: 实现贝叶斯treed 高斯过程模型: 一个空间模型和回归包提供完全的贝叶斯MCMC后验推断, 对于从简单线性模型到非平稳treed高斯过程等都适合.Umacs: Gibbs采样和Metropolis algorithm的贝叶斯推断.vabaye1Mix: 高斯混合模型的贝叶斯推断, 使用多种方法.=Post-estimation tools=====BayesValidate: 实现了对贝叶斯软件评估的方法.boa: MCMC序列的诊断, 描述分析与可视化. 导入BUGS格式的绘图. 并提供Gelman and Rubin, Geweke, Heidelberger and Welch, and Raftery and Lewis 诊断. Brooks and Gelman 多元收缩因子. coda: (Convergence Diagnosis and Output Analysis) MCMC的收敛性分析, 绘图等. 可以轻松导入WinBUGS, OpenBUGS, and JAGS 软件的MCMC输出. 亦包括Gelman and Rubin, Geweke, Heidelberger and Welch, and Raftery and Lewis 诊断.mcgibbsit: 提供Warnes and Raftery MCGibbsit MCMC 诊断. 作用于mcmc对象上面.ramps: 高斯过程的贝叶斯几何分析, 使用重新参数化和边际化的后验采样算法.rv: 基于模拟的随机变量类, 后验模拟对象可以方便的作为随机变量来处理.scapeMCMC: 处理年龄和时间结构的人群模型贝叶斯工具. 提供多种MCMC诊断图形, 可以方便的修改参数===========学习贝叶斯的包===================BaM: Jeff Gill's book, "Bayesian Methods: A Social and Behavioral Sciences Approach, Second Edition" (CRC Press, 2007). 伴随的包Bolstad: 此书的包. Introduction to Bayesian Statistics, by Bolstad, W.M. (2007). 的包LearnBayes: 学习贝叶斯推断的很多的函数. 包括1个,2个参数后验分布和预测分布, MCMC算法来描述分析用户定义的后验分布. 亦包括回归模型, 层次模型. 贝叶斯检验, Gibbs采样的实例.========其它软件与R的接口==========bayesmix: JAGS 软件, 贝叶斯混合模型.BRugs: windows 系统下的OpenBUGS 接口.R2WinBUGS 提供windows和linux的WinBUGS 的接口.rbugs: 支持OpenBUGS 的linux接口(LinBUGS)rjags, R2jags, and runjags: 都提供Just Another Gibbs Sampler (JAGS) 接口gR: BUGS引擎的图形接口部分.。
1、聚类
∙常用的包:fpc,cluster,pvclust,mclust
∙基于划分的方法: kmeans, pam, pamk, clara
∙基于层次的方法: hclust, pvclust, agnes, diana
∙基于模型的方法: mclust
∙基于密度的方法: dbscan
∙基于画图的方法: plotcluster, plot.hclust
∙基于验证的方法: cluster.stats
2、分类
∙常用的包:
rpart,party,randomForest,rpartOrdinal,tree,marginTree,
maptree,survival
∙决策树: rpart, ctree
∙随机森林: cforest, randomForest
∙回归, Logistic回归, Poisson回归: glm, predict, residuals
∙生存分析: survfit, survdiff, coxph
3、关联规则与频繁项集
∙常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和
关联规则
DRM:回归和分类数据的重复关联模型
∙APRIORI算法,广度RST算法:apriori, drm
∙ECLAT算法:采用等价类,RST深度搜索和集合的交集:eclat 4、序列模式
∙常用的包:arulesSequences
∙SPADE算法:cSPADE
5、时间序列
∙常用的包:timsac
∙时间序列构建函数:ts
∙成分分解: decomp, decompose, stl, tsr
6、统计
∙常用的包:Base R, nlme
∙方差分析: aov, anova
∙密度分析: density
∙假设检验: t.test, prop.test, anova, aov
∙线性混合模型:lme
∙主成分分析和因子分析:princomp
∙方差分析对应的是Kruskal-Wallis秩和检验(R: kruskal.test) T检验对应的是Wilcoxon符号秩和检验(R: wilcox.test)
7、图表
∙条形图: barplot
∙饼图: pie
∙散点图: dotchart
∙直方图: hist
∙密度图: densityplot
∙蜡烛图, 箱形图boxplot
∙QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
∙Bi-variate plot: coplot
∙树: rpart
∙Parallel coordinates: parallel, paracoor, parcoord
∙热图, contour: contour, filled.contour
∙其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,
assocplot, mosaicplot
∙保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png 8、数据操作
∙缺失值:na.omit
∙变量标准化:scale
∙变量转置:t
∙抽样:sample
∙堆栈:stack, unstack
∙其他:aggregate, merge, reshape
9、与数据挖掘软件Weka做接口
∙RWeka: 通过这个接口,可以在R中使用Weka的所有算法。
10.人工神经网络:nnet
11.支持向量机SVM:e1071
12:核函数:kernlab
13.随机森林randomforest:randomForest
14.制作分位箱图:Hmisc
15.绘制图形:qplot,ggplot2,。