Content

1 Verstehen der Anwendung der unique()-Funktion in R
2 Die unique()-Funktion in R
3 Zusammenfassung

Vijona

2. Dezember 2024

Die unique()-Funktion in R

Die Die unique()-Funktion in R wird verwendet, um doppelte Werte oder Zeilen in einem Vektor, einem Datenrahmen oder einer Matrix zu eliminieren oder zu löschen.

Die Funktion unique() hat ihre Bedeutung in der EDA (Exploratory Data Analysis), da sie direkt doppelte Werte in den Daten identifiziert und eliminiert.

Verstehen der Anwendung der unique()-Funktion in R

In diesem Artikel werden wir die verschiedenen Anwendungen der Unique()-Funktion in der R-Programmierung vorstellen. Lasst uns starten!!!

Die Idee, einzigartige Werte zu erhalten

Nun, bevor wir in das Thema einsteigen, ist es gut, die dahinter stehende Idee zu kennen. In diesem Fall sind es einzigartige Werte. Die Unique-Funktion gibt die einzigartigen Werte zurück, indem sie die doppelten zählt.

Die unique()-Funktion in R

Das Diagramm zeigt Ihnen, dass die Unique-Funktion nach Duplikaten sucht und diese eliminiert, um die einzigartigen Werte zurückzugeben. In den folgenden Abschnitten kommen viele Illustrationen auf Sie zu, um Ihnen etwas Gutes beizubringen.

Die Syntax der unique()-Funktion in R

Unique: Die Funktion unique() wird verwendet, um doppelte Zählungen in den Daten zu identifizieren und zu eliminieren.

Copy Code


unique(x)

Wo:

X = Es kann ein Vektor, ein Datenrahmen oder eine Matrix sein.

Ein einfaches Beispiel für die Unique()-Funktion in R

Wenn Sie einen Vektor haben, der doppelte Werte enthält, können Sie diese mit Hilfe der Funktion unique() mit einer einzigen Codezeile eliminieren.

Lassen Sie uns sehen, wie es funktioniert…

Copy Code


#Ein Eingabevektor mit doppelten Werten
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)

#eliminiert die doppelten Werte im Vektor 
unique(df)
Output = 1 2 3 4 5 6 8 9

In der obigen Illustration können Sie beobachten, dass der Eingabevektor viele doppelte Werte hat.

Nachdem wir diesen Vektor durch die Funktion unique geleitet haben, eliminiert sie alle doppelten Werte und gibt nur die einzigartigen Werte zurück, wie oben gezeigt.

Finden der einzigartigen Werte in einer Matrix

Nun werden wir doppelte Werte in einer Matrix finden und diese mit der Funktion unique eliminieren.

Dazu müssen wir zuerst eine Matrix mit ’n‘ Zeilen und Spalten erstellen, die doppelte Werte enthält.

Um eine Matrix zu erstellen, führen Sie den folgenden Code aus.

Copy Code


#erstellt eine 6 x 4 Matrix mit 24 Elementen 
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
      [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20
[6,]    1    2    3    4

Wie Sie leicht erkennen können, ist die letzte Zeile vollständig dupliziert. Alles, was Sie tun müssen, ist, mit der Funktion unique() diese doppelten Werte zu eliminieren.

Copy Code


#entfernt die doppelten Werte
unique(df)
       [,1] [,2] [,3] [,4]
[1,]    1    2    3     4
[2,]    5    6    7     8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20

YaY!

Sie haben es geschafft! Alle doppelten Werte in der Matrix wurden durch die Funktion unique entfernt, und es wurde eine Matrix mit ausschließlich einzigartigen Werten zurückgegeben.

Finden der einzigartigen Werte im Datenrahmen

Bis jetzt haben wir an Vektoren und Matrizen gearbeitet, um die einzigartigen Werte durch Eliminierung der doppelten Zählungen zu extrahieren.

In diesem Abschnitt konzentrieren wir uns darauf, die einzigartigen Werte im Datenrahmen zu erhalten.

Um einen Datenrahmen zu erstellen, führen Sie den folgenden Code aus.

Copy Code


#erstellt einen Datenrahmen
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#Datenrahmen
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Dies ist der Datenrahmen, der die doppelten Zählungen wie oben gezeigt enthält. Lassen Sie uns die Funktion unique anwenden, um den doppelten Wert hier zu beseitigen.

Copy Code

unique(Class_data) Student Age Gender 1 Naman 22 Male 2 Megh 23 Female 3 Mark 24 Male

Wow! Die Funktion unique gab alle einzigartigen Werte im Datenrahmen zurück, indem sie die doppelten Werte eliminierte.

So können Sie mit der Funktion unique() in R ganz einfach die einzigartigen Werte in den Daten erhalten.

Finden der einzigartigen Werte einer bestimmten Spalte

Ja, was ist, wenn Sie die einzigartigen Werte aus einer bestimmten Spalte anstelle des gesamten Datensatzes erhalten möchten?

Keine Sorge, mit der Funktion unique() können wir auch die einzigartigen Werte aus einer bestimmten Spalte erhalten, wie unten gezeigt.

Copy Code


#erstellt einen Datenrahmen
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#Datenrahmen
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Okay, ich nehme denselben Datenrahmen, den wir in den letzten Abschnitten für ein leichteres Verständnis verwendet haben.

Lassen Sie uns die Funktion unique verwenden, um doppelte Werte zu beseitigen.

Copy Code


unique(Class_data$Student)
Output = "Naman" "Megh"  "Mark"

Auf die gleiche Weise können wir auch die einzigartigen Werte in den Spalten Alter oder Geschlecht erhalten.

Copy Code


unique(Class_data$Gender)
"Male"   "Female"

Ermittlung der Anzahl einzigartiger Werte

In diesem Abschnitt werden wir die Anzahl der einzigartigen Werte in den Daten ermitteln. Diese Anwendung ist nützlich, um Ihre Daten besser zu verstehen und sie für weitere Analysen vorzubereiten.

#Importieren des Datensatzes

Copy Code

datasets::BOD Zeit Nachfrage 1 1 8.3 2 2 10.3 3 3 19.0 4 4 16.0 5 5 15.6 6 7 19.8

Nun, wir verwenden hier den BOD-Datensatz. Lassen Sie uns zuerst die einzigartigen Werte finden, gefolgt von ihrer Anzahl.

Copy Code


#gibt den einzigartigen Wert zurück
unique(BOD$demand)
Output = 8.3  10.3 19.0  16.0  15.6  19.8

Okay, jetzt haben wir die einzigartigen Werte in der Spalte ‚Nachfrage‘ im BOD-Datensatz.

Jetzt können wir die Anzahl der einzigartigen Werte ermitteln.

Copy Code


#gibt die Länge der einzigartigen Werte zurück
length(unique(BOD$demand))
Output =  6

Zusammenfassung

Die unique()-Funktion in R ist besonders wertvoll im Bereich der EDA (Explorative Datenanalyse).

Sie hilft Ihnen, ein besseres Verständnis Ihrer Daten zu erlangen, einschließlich spezifischer Zählungen.

Dieser Artikel hat Ihnen die vielfältigen Anwendungen und Einsatzmöglichkeiten der unique()-Funktion in R vorgestellt. Viel Spaß bei der Analyse!!!

Quelle: digitalocean.com

Jetzt 200€ Guthaben sichern

Registrieren Sie sich jetzt in unserer ccloud³ und erhalten Sie 200€ Startguthaben für Ihr Projekt.

Jetzt loslegen

Das könnte Sie auch interessieren:

Moderne Hosting Services mit Cloud Server, Managed Server und skalierbarem Cloud Hosting für professionelle IT-Infrastrukturen

Wie Sie Unit-Tests in Flask durchführen – Ein umfassender Leitfaden

Python, Tutorial

vor 2 Wochen

Vijona9 Juli um 11:53 Uhr Wie Sie Unit-Tests in Flask durchführen Tests sind ein wesentlicher Bestandteil des Softwareentwicklungsprozesses, um sicherzustellen, dass der Code wie erwartet funktioniert und fehlerfrei ist. In Python…

Celery in Python: Asynchrone Tasks und Hintergrundprozesse einfach umsetzen

Python, Tutorial

vor 3 Wochen

Vijona8 Juli um 18:36 Uhr Einführung in Celery: Asynchrone Task-Queue für Python Celery ist eine verteilte Aufgaben- oder Job-Queue, die auf asynchroner Nachrichtenübermittlung basiert. Sie ermöglicht es Python-Anwendungen, Hintergrundprozesse entweder sofort…

Apache Airflow: Workflow-Orchestrierung erklärt

Python, Tutorial

vor 1 Monat

Vijona25 Juni um 13:48 Uhr Apache Airflow: Workflow-Orchestrierung für Datenpipelines Moderne datengetriebene Organisationen arbeiten mit Pipelines, die Informationen erfassen, umwandeln, anreichern und von einem System in ein anderes übertragen. Solche Datenpipelines…

FEATURED PRODUCTS

Kubernetes

ccloud³

Managed Server

Cloud GPU

S3 Object Storage

COMPUTE

MANAGED

STORAGE

NETWORKING

MANAGEMENT TOOLS

BACKUPS & SNAPSHOTS

WEBSITE-HOSTING

HOUSING

FEATURED INDUSTRIES

Enterprise

Saas-Hosting

Startup

INDUSTRIES

MEHR INDUSTRIES

FEATURED USE CASES

Linux-Hosting

VMware Migration

Docker Hosting

USE CASES

MEHR USE CASES

RESSOURCES

Help Center

Trust Center

Glossar

Tutorials

MEHR CENTRON

MEHR INFOS

Anbieter-Vergleiche

centron vs. Hetzner

centron vs. IONOS

centron vs. Azure

GPU Produkt-Vergleiche

GPU - centron vs. Hetzner

GPU - centron vs. IONOS

GPU - centron vs. OVHcloud

Kubernetes Produkt-Vergleiche

Bald verfügbar!

FEATURED PRODUCTS

Kubernetes

ccloud³

Managed Server

Cloud GPU

S3 Object Storage

COMPUTE

MANAGED

STORAGE

NETWORKING

MANAGEMENT TOOLS

BACKUPS & SNAPSHOTS

WEBSITE-HOSTING

HOUSING

FEATURED INDUSTRIES

Enterprise

Saas-Hosting

Startup

INDUSTRIES

MEHR INDUSTRIES

FEATURED USE CASES

Linux-Hosting

VMware Migration

Docker Hosting

USE CASES

MEHR USE CASES

RESSOURCES

Help Center

Trust Center

Glossar

Tutorials

MEHR CENTRON

MEHR INFOS

Anbieter-Vergleiche

centron vs. Hetzner

centron vs. IONOS

centron vs. Azure