R 中的独特() 函数用于消除或删除 vector 中存在的重复值或行,例如 data frame,或 matrix。
独特()函数在EDA(Exploratory Data Analysis)中发现了其重要性,因为它直接识别并消除数据中的重复值。
在本文中,我们将释放R编程中独特()函数的各种应用。
获得独特价值观的想法
好吧,在进入主题之前,最好知道背后的想法,在这种情况下,它是独特的值,独特的函数将通过消除重复数来返回独特的值。
图表告诉你,独特的函数会寻找重复,并消除返回独特的值。
R 中 Unique() 函数的语法
** 独特: ** 独特() 函数用于识别和消除数据中存在的重复数。
1unique(x)
何处:
X = 它可以是矢量、数据框架或矩阵。
R 中唯一() 函数的简单示例
如果您有一个具有重复值的矢量,那么通过独特() 函数,您可以轻松地删除使用单行代码的矢量。
让我们看看它是如何工作的......
1#An input vector having duplicate values
2df<-c(1,2,3,2,4,5,1,6,8,9,8,6)
3
4#elimnates the duplicate values in the vector
5unique(df)
1Output = 1 2 3 4 5 6 8 9
在上面的图像中,您可以观察到,输入矢量有许多重复值。
将该矢量转移到独特函数后,它会消除所有重复值,并只返回如上所示的独特值。
在矩阵中找到独特值
现在,我们将找到矩阵中存在的重复值,并使用独特函数消除它们。
为此,我们必须首先创建一个由具有重复值的n
行和列的矩阵。
要创建一个矩阵,运行下面的代码。
1#creates a 6 x 4 matrix having 24 elements
2df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
1[,1] [,2] [,3] [,4]
2[1,] 1 2 3 4
3[2,] 5 6 7 8
4[3,] 9 10 11 12
5[4,] 13 14 15 16
6[5,] 17 18 19 20
7[6,] 1 2 3 4
正如你可以很容易地看到的那样,最后一行是完全重复的. 您所需要做的就是使用 unique() 函数,消除这些重复值。
1#removes the duplicate values
2unique(df)
1[,1] [,2] [,3] [,4]
2[1,] 1 2 3 4
3[2,] 5 6 7 8
4[3,] 9 10 11 12
5[4,] 13 14 15 16
6[5,] 17 18 19 20
啊啊!
所有在矩阵中存在的重复值都被独特函数删除,它返回了一个只有独特值的矩阵。
查找数据框架中的唯一值
到目前为止,我们一直在研究矢量和矩阵,通过消除重复计数来提取独特值。
在本节中,让我们专注于获取数据框中存在的独特值。
要创建数据框,运行下面的代码。
1#creates a data frame
2> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
3
4#dataframe
5Class_data
1Student Age Gender
21 Naman 22 Male
32 Megh 23 Female
43 Mark 24 Male
54 Naman 22 Male
65 Megh 23 Female
76 Mark 24 Male
这是具有如上所示的重复数的数据框,让我们应用独特的函数来摆脱此处存在的重复值。
1unique(Class_data)
1Student Age Gender
21 Naman 22 Male
32 Megh 23 Female
43 Mark 24 Male
这个独特的函数通过消除重复值来返回数据框中存在的所有独特值。
同样,通过使用 R 中的 unique() 函数,您可以轻松地获得数据中存在的独特值。
查找特定列的独特值
是的,如果您需要从特定列中获取唯一值,而不是数据集,怎么办?
不要担心,使用独特()函数,我们也可以从特定列中获取独特值,如下所示。
1#creates a data frame
2> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
3
4#dataframe
5Class_data
1Student Age Gender
21 Naman 22 Male
32 Megh 23 Female
43 Mark 24 Male
54 Naman 22 Male
65 Megh 23 Female
76 Mark 24 Male
好吧,我正在使用我们在最后一节中使用的相同的数据框架,以便更容易理解。
让我们使用单一函数来消除重复值。
1unique(Class_data$Student)
1Output = "Naman" "Megh" "Mark"
同样,我们也可以在年龄或性别列中获得独特的值。
1unique(Class_data$Gender)
1"Male" "Female"
查找独特值的长度
在本节中,我们将获得数据中的独特值的计数. 这个应用程序更有用来更好地了解您的数据,并为进一步分析做好准备。
1#importing the dataset
2datasets::BOD
1Time demand
21 1 8.3
32 2 10.3
43 3 19.0
54 4 16.0
65 5 15.6
76 7 19.8
好,我们在这里使用 BOD 数据集. 让我们先找到唯一的值,然后是计数。
1#returns the unique value
2unique(BOD$demand)
1Output = 8.3 10.3 19.0 16.0 15.6 19.8
好了,现在我们有 BOD 数据集中的需求列中存在的独特值。
现在,我们很好地去寻找独特价值的计数。
1#returns the length of unique values
2length(unique(BOD$demand))
1Output = 6
包装上
在 R 中,独特() 函数对于 EDA (Exploratory Data Analysis) 来说非常有价值。
它有助于您更好地了解您的数据以及特定计数。
本文介绍了 unique() 函数的多个应用程序和使用案例。 Happy analyzing!!!
** 更多阅读:** R 文档