意愿的统计分析模块。
更新频率高和开发周期短 R不仅开发周期短而且更新速度也很快。
除了标准包以外可使用的扩展包不仅种类繁多而且更新迅速、更新频率高。
互动性强。
R具有很强的互动性它不仅实时的在命令行窗口中显示输入命令的错误而且还可以记忆并重现使用者所使用过的命令便于进行命令的修改和重复执行。
另外在输出显示方面除了图形信息输出时是新建窗口以外其余的结果输出将与命令输入共用一个窗口进一步增强了界面信息的可读性和延续性。
良好的可接入性 经过不断的完善R已经和其它编程语言如C、Java、perl等和数据库如Oracle、SQL、MySQL等有了良好的交互接口。
完整的数据统计分析 R拥有一系列完整的统计分析方法可以进行连贯而又系统的数据分析操作如可以进行全面的参数分析和非参数分析操作求出任何分析下某点所对应的概率密度函数、分布函数值以及任意分位点值等等。
强大的数组和矩阵的处理 R具有完整的数组和矩阵计算操作符数组和矩阵的运算功能强大。
强大的图形功能 R具有很强的图形功能不仅可以进行常用统计图的制作和显示而且可以将输出的图形保存成JPG、BMP、PNG的等主流的图片格式或另存为PDF文件格式。
另外还可以作用于多个图形设备。
2.2 R与三种主流商业统计分析软件S-Plus、SAS、SPSS的比较 提到统计分析软件我院大多数科研工作者首先想到的是主流的商业统计分析软件如SPSS、SAS和S-Plus等。
下面我们将从先进性、易用性、开放性和可扩展能力、数据获取能力和成本、性价比等诸多方面比较一下R与这三种主流商业统计分析软件之间的不同之处。
1、与S-Plus的比较 正如文中第二小节开始所提及的R和S-Plus同是基于S语言的具体实现所以R和S-Plus在语法上可以说是如出一辙也正因如此至今仍有不少人将R视为是S-Plus免费版本的衍生。
先进性R和S-Plus因基于同一语言——S语言而具有了语言基础上的先进性是统计分析与数据可视化语言中最符合现代软件标准的计算语言。
可扩展能力由于独特的架构和开放性使得R和S-Plus具有了良好的可扩展能力。
易用性因为比较契合现今主流的代码开发习惯所以R和S-Plus不仅学习周期短而且具有较好的易用性。
第七届2009两岸三院信息技术与应用交流研讨会论文报告集 152 函数实际处理方面虽然R和S-Plus很相似但在函数function方面仍存在细微的差别如某些函数的变量处理范围。
另外在随机数产生方面R要较S-Plus灵活。
数据获取成本方面R和S-Plus在数据获取能力方面差异不大但在数据获取成本上由于S-Plus为需要付费购买的商业型统计分析软件其数据库接口是集成在核心软件之内的无须另外支付购买费用。
而R则是通过程序包package的形式对外发布使用者可以通过R网站或其镜像CRANthe Comprehensive Archive Network免费获取所以S-Plus的数据获取成本较R要高。
2、与SASStatistical Analysis System统计分析系统的比较 数据存储管理和操作能力方面 SAS因其独特的软件架构使之具有了较强的数据存储管理和操作能力尤其见长于海量数据的操作和处理。
R虽然也可以进行数据的存储和操作但在大数据量的情况下通常会因为消耗了大量的系统资源而显得处理速度较慢所以R在数据存储管理方面是稍逊于SAS的。
开放性和可扩展能力SAS虽然可以通过批处理的功能来保持其统计分析功能的开放性并基于IML和Tookit模块为使用者提供了一定程度的可扩展能力但是SAS中功能强大的各个模块是预先实现并固化在系统中的使用者根本不可能对它们进行更改或新增。
而R作为源代码开放的自由软件很多第三方开发的分析模块可以很容易的加入其中所以其开放性和可扩展能力是较SAS强的。
易用性方面SAS提供命令行和菜单两种操作形式即使是初学者也可以通过assist模块用鼠标来完成一般的统计分析操作。
而R基本上以命令行方式的操作界面为主即使是要打开html格式的帮助文件也要先运行相关的命令因此对初学者来说多少有些无从下手的感觉所幸可以从网上获取不少R的学习资料和第三方教程。
数据获取能力和成本方面SAS中各类数据库的接口不仅各自独立提供而且价格不菲。
相比较之下R的各类数据库接口是可以免费获取的。
性价比方面