Positron:下一代R和python数据分析IDE

Page content

Positron:下一代R和python数据分析IDE by 基因学苑

前几天看到Y叔推文《R语言的N种打开方式》,在里面看到了R新的IDE-Positron,这个IDE是Posit公司推出的新一代数据分析IDE,于是下载研究了一下,果然有很多好用的地方,这次内容我们就来介绍一下这个最新的IDE。



有了Rstudio,为什么还要新的Positron

熟悉R的人应该都用过Rstudio,这是一款非常好用的R集成开发环境(IDE),经过10多年的发展完善,现在已经是非常成熟的产品了,非常好用,也是我最喜欢的IDE。在Rtudio中使用R分析数据非常好用,包括一些R的扩展功能,Rmarkdown,Quarto,Shiny等支持都非常好。虽然Rstudio现在也能通过扩展包reticulate支持python的运行,但是依然不是很好用,语法很怪异,非常不稳定。

如果需要同时使用R和python,那么就需要一种新的IDE,这就是Positron。

图1 Positron用户界面,既像vscode,又像Rstudio


如果你现在只使用R语言,那么还是推荐使用Rstudio,而且Posit还是会对Rstudio继续支持和更新,毕竟Posit公司现在主要商业产品都是基于Rstudio构建的。

Positron目前还是开发版,有很多不完善的地方。但是强烈推荐大家去尝试一下,折腾一下。


为什么是vscode?

vscode从2018年在我们培训的时候就被选为推荐的文本编辑器,这与其很多优秀的性能是分不开的。而Positron就是基于vscode开发的,如果你使用过vscode,在上手Positron将非常容易,而且vscode的很多特性在Positron中都支持的。它并不是给vscode套个壳,通过插件功能支持R,而是要将rstudio的很多重要功能都迁移到vscode中,在Positron中同时支持R和python的数据分析。

图2 同时支持R,python以及Jupyter文件

截止到现在,仅使用vscode一款软件,既可以完成之前很多软件的功能。
1、远程SSH连接服务器,替代xshell,termius的功能;
2、运行R,替代Rstudio;
3、运行python,替代PyCharm;
4、运行Jupyter,替代Jupyter Notebook,JupyterLab;
5、远程查看PDF,html,替代rstudio-server;
现在vscode最弱的就是sftp功能,不能想filezilla那么好用,虽然有一些插件,但这些sftp并不是很方便,只能通过数据,不能自由的上传和下载文件,希望未来微软官方能开发一个插件,实现sftp的功能。

Positron与vscode + 插件?

之前我们有介绍如何在vscode中配置R分析环境,python数据分析环境,以及二者的远程开发环境。通过vscode的插件功能实现这些功能。不过还是有很多缺点。

1、配置起来相对繁琐,对于新手有很大的挑战;尤其是远程开发环境;

2、python环境相对完善,可以很好地运行python编程以及jupyter数据分析;

3、vscode的R环境不是很好,比如不支持R常用快键键,不支持赋值操作符(<-)以及管道操作符(|> )快键键,不方便预览数据,不方便查看绘图等,虽然这些可以通过插件实现,但实现效果并不如Rstudio方便;

使用Positron,无需配置大量的插件,只需要在系统中安装R和python即可开箱即用,而且实现效果更好。

图3 运行R代码


如果我们通过Anaconda来管理R和python环境,那么仅需Positron + Anaconda两个软件就可以轻松配置数据分析环境。

(Anaconda是另外一家提供数据分析解决方案的公司,和Positron是竞争关系啊)

图4 运行python代码


不过目前Positron还属于开发版,例如还不支持SSH功能,后面支持了SSH ,远程开发就更Happy了。



图 5 运行jupyter文件
Ark Kernel

为了在jupyter中更好的运行R,Posit专门开发了一个Ark内核引擎,可以在R代码传入到Juypter中下运行。

图6 ark内核可以实现rstudio的代码提示和自动补齐功能

Box Imports

这个功能不知道该如何翻译,功能就是可以直接查看R函数的源代码,

图7 查看R函数


快捷键

Positron保留了Rstudio中的一些快捷键,可以实现无缝衔接。

Control + Enter: 运行当前Jupyter Cell代码块

Shift + Enter: 运行当前Juypter Cell块,光标跳转到下一个Cell
C: 赋值当前cell
X: 剪切当前 cell
V: 粘贴 cell
D: 删除 cell
Command/Control + P: 不同文件之间切换

图 8 使用快捷键运行Jupyter Cell


数据窗口

数据框查看窗口与Rstudio中类似,可以可视化数据框,并实现一些简单的排序筛选功能。

图9 查看数据框

绘图窗口

绘图窗口可以直接查看绘图结果,与Rstudio相似,而且新增了一些功能,例如可以将历史绘图通过小窗口显示,方便比较几次绘图变化。

图10 绘图窗口


Variable Inspector

Variable Inspector用来显示变量数据结构,对于一些复杂数据结构的变量,可以直接在这里展示出来。

图11 查看变量数据结构


目前,我们正进行《基因学苑VIP课程第四季》的招生活动,想学习最新最全面的生物数据分析技能,欢迎报名。

基因学苑生物信息VIP课程(第4季)开始报名




原文链接