Die unique()-Funktion in R

Die Die unique()-Funktion in R wird verwendet, um doppelte Werte oder Zeilen in einem Vektor, einem Datenrahmen oder einer Matrix zu eliminieren oder zu löschen.

Die Funktion unique() hat ihre Bedeutung in der EDA (Exploratory Data Analysis), da sie direkt doppelte Werte in den Daten identifiziert und eliminiert.

Verstehen der Anwendung der unique()-Funktion in R

In diesem Artikel werden wir die verschiedenen Anwendungen der Unique()-Funktion in der R-Programmierung vorstellen. Lasst uns starten!!!

Die Idee, einzigartige Werte zu erhalten

Nun, bevor wir in das Thema einsteigen, ist es gut, die dahinter stehende Idee zu kennen. In diesem Fall sind es einzigartige Werte. Die Unique-Funktion gibt die einzigartigen Werte zurück, indem sie die doppelten zählt.

Die unique()-Funktion in R

Das Diagramm zeigt Ihnen, dass die Unique-Funktion nach Duplikaten sucht und diese eliminiert, um die einzigartigen Werte zurückzugeben. In den folgenden Abschnitten kommen viele Illustrationen auf Sie zu, um Ihnen etwas Gutes beizubringen.

Die Syntax der unique()-Funktion in R

Unique: Die Funktion unique() wird verwendet, um doppelte Zählungen in den Daten zu identifizieren und zu eliminieren.


Wo:

X = Es kann ein Vektor, ein Datenrahmen oder eine Matrix sein.

Ein einfaches Beispiel für die Unique()-Funktion in R

Wenn Sie einen Vektor haben, der doppelte Werte enthält, können Sie diese mit Hilfe der Funktion unique() mit einer einzigen Codezeile eliminieren.

Lassen Sie uns sehen, wie es funktioniert…

#Ein Eingabevektor mit doppelten Werten
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)

#eliminiert die doppelten Werte im Vektor 
unique(df)
Output = 1 2 3 4 5 6 8 9


In der obigen Illustration können Sie beobachten, dass der Eingabevektor viele doppelte Werte hat.

Nachdem wir diesen Vektor durch die Funktion unique geleitet haben, eliminiert sie alle doppelten Werte und gibt nur die einzigartigen Werte zurück, wie oben gezeigt.

Finden der einzigartigen Werte in einer Matrix

Nun werden wir doppelte Werte in einer Matrix finden und diese mit der Funktion unique eliminieren.

Dazu müssen wir zuerst eine Matrix mit ’n‘ Zeilen und Spalten erstellen, die doppelte Werte enthält.

Um eine Matrix zu erstellen, führen Sie den folgenden Code aus.

#erstellt eine 6 x 4 Matrix mit 24 Elementen 
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
      [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20
[6,]    1    2    3    4


Wie Sie leicht erkennen können, ist die letzte Zeile vollständig dupliziert. Alles, was Sie tun müssen, ist, mit der Funktion unique() diese doppelten Werte zu eliminieren.

#entfernt die doppelten Werte
unique(df)
       [,1] [,2] [,3] [,4]
[1,]    1    2    3     4
[2,]    5    6    7     8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20


YaY!

Sie haben es geschafft! Alle doppelten Werte in der Matrix wurden durch die Funktion unique entfernt, und es wurde eine Matrix mit ausschließlich einzigartigen Werten zurückgegeben.

Finden der einzigartigen Werte im Datenrahmen

Bis jetzt haben wir an Vektoren und Matrizen gearbeitet, um die einzigartigen Werte durch Eliminierung der doppelten Zählungen zu extrahieren.

In diesem Abschnitt konzentrieren wir uns darauf, die einzigartigen Werte im Datenrahmen zu erhalten.

Um einen Datenrahmen zu erstellen, führen Sie den folgenden Code aus.

#erstellt einen Datenrahmen
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#Datenrahmen
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male


Dies ist der Datenrahmen, der die doppelten Zählungen wie oben gezeigt enthält. Lassen Sie uns die Funktion unique anwenden, um den doppelten Wert hier zu beseitigen.

unique(Class_data)
   Student Age  Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male


Wow! Die Funktion unique gab alle einzigartigen Werte im Datenrahmen zurück, indem sie die doppelten Werte eliminierte.

So können Sie mit der Funktion unique() in R ganz einfach die einzigartigen Werte in den Daten erhalten.

Finden der einzigartigen Werte einer bestimmten Spalte

Ja, was ist, wenn Sie die einzigartigen Werte aus einer bestimmten Spalte anstelle des gesamten Datensatzes erhalten möchten?

Keine Sorge, mit der Funktion unique() können wir auch die einzigartigen Werte aus einer bestimmten Spalte erhalten, wie unten gezeigt.

#erstellt einen Datenrahmen
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#Datenrahmen
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male


Okay, ich nehme denselben Datenrahmen, den wir in den letzten Abschnitten für ein leichteres Verständnis verwendet haben.

Lassen Sie uns die Funktion unique verwenden, um doppelte Werte zu beseitigen.

unique(Class_data$Student)
Output = "Naman" "Megh"  "Mark" 


Auf die gleiche Weise können wir auch die einzigartigen Werte in den Spalten Alter oder Geschlecht erhalten.

unique(Class_data$Gender)
"Male"   "Female"

Ermittlung der Anzahl einzigartiger Werte

In diesem Abschnitt werden wir die Anzahl der einzigartigen Werte in den Daten ermitteln. Diese Anwendung ist nützlich, um Ihre Daten besser zu verstehen und sie für weitere Analysen vorzubereiten.

#Importieren des Datensatzes

datasets::BOD
    Zeit  Nachfrage
1    1     8.3
2    2    10.3
3    3    19.0
4    4    16.0
5    5    15.6
6    7    19.8

Nun, wir verwenden hier den BOD-Datensatz. Lassen Sie uns zuerst die einzigartigen Werte finden, gefolgt von ihrer Anzahl.

#gibt den einzigartigen Wert zurück
unique(BOD$demand)
Output = 8.3  10.3 19.0  16.0  15.6  19.8

Okay, jetzt haben wir die einzigartigen Werte in der Spalte ‚Nachfrage‘ im BOD-Datensatz.

Jetzt können wir die Anzahl der einzigartigen Werte ermitteln.

#gibt die Länge der einzigartigen Werte zurück
length(unique(BOD$demand))
Output =  6

Zusammenfassung

Die unique()-Funktion in R ist besonders wertvoll im Bereich der EDA (Explorative Datenanalyse).

Sie hilft Ihnen, ein besseres Verständnis Ihrer Daten zu erlangen, einschließlich spezifischer Zählungen.

Dieser Artikel hat Ihnen die vielfältigen Anwendungen und Einsatzmöglichkeiten der unique()-Funktion in R vorgestellt. Viel Spaß bei der Analyse!!!

Kostenlosen Account erstellen

Registrieren Sie sich jetzt und erhalten Sie Zugang zu unseren Cloud Produkten.

Das könnte Sie auch interessieren: