如果我问你一个问题--你用电子表格吗?
,我马上就会得到肯定的回答。它显示了电子表格在日常业务操作中是多么流行和有用。如果你是一名分析师,那么电子表格是无价的。你可能已经在你的作品中使用了Excel和Google工作表。您很有可能已经多次将EXCEL表格读入R。但是,你有没有想过把谷歌表格读成R?如果还没有,也值得一试。
Google Sheet入门
你一定听说过Google Sheet。它就像Excel一样。它将允许您组织、编辑和分析不同类型的数据。但是,与Excel不同的是,Google Sheets是一个基于网络的电子表格程序,它鼓励协作。
这将自动与您的Google帐户,Google Drive及其其他服务(如Google文档和幻灯片)同步。在google sheets中,你不需要每次都保存。它提供了一个自动保存功能,这将更新工作表后,每一个活动。是不是很酷?
如果我们谈到界面,Google Sheets将在Excel之后进行合理的修改。您可以自由共享工作表以进行任何协作。大多数情况下,这将使我们的工作变得轻松,因为多人可以实时处理床单。
我认为关于Google Sheet的信息已经足够了,让我们潜入一些令人兴奋的事情吧!
在R中阅读Google Sheet
您可以使用包**‘googlesheets4’** 阅读R中的Google Sheets数据。该程序包将允许您使用R进入工作表。
首先,您需要在R中安装**‘googlesheets4’** 包,然后必须加载库才能继续。
1#Install the required package
2install.packages('googlesheets4')
1#Load the required library
2library(googlesheets4)
那很好。我们的**‘googlesheets4’** 库现在可以从Google Sheet中提取数据了。
1.设置授权
你不能马上从google sheets中[读取数据](/community/tutorials/read-a-file-in-r)。由于Gsheets是基于网络的电子表格,它们将与您的谷歌邮件相关联。因此,您必须允许R访问Google表单。
你可以使用read.csv或read.table这样的函数将[read data](/community/tutorials/read-a-file-in-r)读入R。但是,在这里你不需要提到文件类型。你所需要的就是从浏览器中复制谷歌表格链接,粘贴到这里,然后运行代码。
运行下面的代码后,您可以看到用于进一步处理的界面。
1#Read google sheets data into R
2x <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')
1Is it OK to cache OAuth access credentials in the folder
2
31: Yes
42: No
您必须选择选项1:是以继续进行授权过程。
作为第一步,如果您有多个G帐户登录,它将要求您继续使用您的帐户,如下所示。
- 您必须选择您的帐户授权R访问G表。这一过程之后是多次授权。你必须允许R在所有这些步骤中。
- 在下图中,您将看到您正在向TidyVerse API授予的权限。点击
允许
** ,你就完成了。
- 授权成功后,可以看到完成消息。
- 之后,您将在R直播间看到授权成功的消息,如下图所示。
2.将数据读入R
很好,您已经完成了授权过程,并成功地进行了授权。现在让我们看看如何将数据从Google Sheet读取到R中。
1#Reads data into R
2df <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')
3
4#Prints the data
5df
1# A tibble: 1,000 x 20
2 months_loan_dura~ credit_history purpose amount savings_balance employment_leng~
3 <chr> <dbl> <chr> <chr> <dbl> <chr>
4 1 < 0 DM 6 critic~ radio~ 1169 unknown
5 2 1 - 200 DM 48 repaid radio~ 5951 < 100 DM
6 3 unknown 12 critic~ educa~ 2096 < 100 DM
7 4 < 0 DM 42 repaid furni~ 7882 < 100 DM
8 5 < 0 DM 24 delayed car (~ 4870 < 100 DM
9 6 unknown 36 repaid educa~ 9055 unknown
10 7 unknown 24 repaid furni~ 2835 501 - 1000 DM
11 8 1 - 200 DM 36 repaid car (~ 6948 < 100 DM
12 9 unknown 12 repaid radio~ 3059 > 1000 DM
1310 1 - 200 DM 30 critic~ car (~ 5234 < 100 DM
14# ... with 990 more rows, and 14 more variables: installment_rate <chr>,
15# personal_status <dbl>, other_debtors <chr>, residence_history <chr>,
16# property <dbl>, age <chr>, installment_plan <dbl>, housing <chr>,
17# existing_credits <chr>, default <dbl>, dependents <dbl>, telephone <dbl>,
18# foreign_worker <chr>, job <chr>
在这里您可以看到,R如何使用**‘READ_SHEET’** 函数从Google Sheet读取数据。
我也在这里添加了一个框架,供您参考/理解。
- 一旦你设置了账号,这将是一场非常容易的游戏。
3.使用Sheet ID将Google Sheets读入R
不需要复制工作表链接即可读取数据。您只能复制工作表ID,并且可以将其与 read_sheet 函数一起使用。它将像往常一样读取数据。
如果您不知道Sheet ID,我已经添加了Sheet链接,并且我已经用颜色突出显示了标签Sheet ID 。您可以复制此ID,也可以遵循相同的过程。
Https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE /edit# gid=0
您可以找到下面讨论的代码。
1#Reads the data with Sheet ID into R
2df <- read_sheet('1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE')
3
4#Prints the data
5df
该代码将给出相同的输出,即数据。我在整个插图中都使用了信用数据。您可以将任何数据用于此目的。我希望从现在开始,把谷歌表格读成R对你来说不是一个问题。
结束语
几乎所有组织都使用Google Sheet进行业务运营和数据处理。作为一名分析师或R用户,如果你知道如何使用Google Sheets和R就好了。这是一个非常简单的方法,你可以在你的数据和Sheet ID/link上实践这一点。我希望你学到了一些东西,可以节省你的工作时间。这就是现在的一切,祝你快乐!
更多内容阅读: R documentation