影子叩

搜索
夜间模式◐

再见 Excel?推荐这款集成 Python 的电子表格神器
[工作效率] · fall · 发布于 · 2020-07-26 · 518 次点击 · 复制地址

倔强青铜Ⅲ   fall  · 2020-07-26 17:01:00 · 显示全部楼层 · 阅读
前端时间感到处理 Python 或者 R 语言处理过 Excel 中数据,来回的导入导出 Excel 数据特别的繁琐,感觉 Excel 顶部工具或者函数不太好用,于是想用代码来处理事情,加速工作效率。

如果是 Python + Excel 会是什么样的体验那?

所以,喵哥今天就给大家推荐 Grid Studio 这个项目。Grid Studio 是一个基于 Web 的电子表格应用程序,其最大的特点是集成了 Python 语言,作为交互方式。

Grid Studio 最厉害的地方在于解决表格数据处理中散乱的工作流。例如R studio 和 Excel 等多个工具间来回操作。也正因为集成了 Python,只需少量的几行代码,即可完成非常复杂的表格数据处理。

20200726165620.png
安装

在本地安装Grid studio非常简单:

1. Clone the repository with this command:    git clone https://github.com/ricklamers/gridstudio2. Run the bash script (on windows use e.g. Git Bash) with this command:    cd gridstudio && ./run.sh3. Go to http://127.0.0.1:8080 in your browser. Note! Username: admin password: admin

注意:如果您使用的是Windows,请确保共享驱动器https://docs.docker.com/docker-for-windows/#shared-drives

注意:在linux上,您可能需要运行(对于第2步):

因为Docker需要sudo访问权限才能运行。

使用

读、写

Python 集成的核心是对电子表格的读写接口,它可以在电子表格的数据和 Python 进程中的数据之间建立一个高性能的连接。

可以用以下方式在表格中写入数据:

sheet("A1:A3", [1, 2, 3])

用以下这种方式从表格中读取数据:

my_matrix = sheet("A1:A3")

你可以通过这种简单而高效的方式直接在表格中读取或写入数据,以自动化数据输入、提取、可视化等过程。

编写定制化表格函数

虽然通过一个简单的接口完成读写非常灵活,但有时编写可以直接调出的定制化函数也很重要。

除了 AVERAGE、SUM、IF 这些默认函数外,你可能还需要其他函数。

def UPPERCASE(a):    return str(a).uppercase()

写完这行代码后,在表格中调出该函数,就像调用常规函数一样。

利用 Python 生态

通过利用 Python 生态中各种强大的软件包,我们能立即访问到当前最优的数据科学工具,因此也能快速访问到强大的模型,例如线性回归和 支持向量机等。
23668458-4fd7d1c5d3a69103.jpg
因为本身 Grid studio 主要就是处理表格数据,那么将它们作为特征可以快速调用 SVM 等模型,从而探索隐藏在这些数据背后的特征。

数据可视化

在数据科学中,很常见的一个任务就是可视化数据,这样才能获得关于数据的「先验知识」。通过集成交互式绘图库 Plotly.js 和 Python 标准可视化库 Matplotlib,Grid studio 目前已经内置了高级绘图功能。如下所示我们可以在向量表格格式上使用高级绘图功能:
20200726165731.png
最后

Grid studio 的作者是 Rick Lamers,现在有9位维护者,已经维护了一年多。Grid studio 在 Github 上共收获了7.8k Star。受到广大消费者的喜欢,用户越来越多。

回复

使用道具 举报

倔强青铜Ⅱ   745504091  · 2020-07-26 17:01:00 来自手机 · 显示全部楼层
对于大佬要求自由度高,队伍对于小白,上手是不是更难了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表