Content

Vijona

2. Dezember 2024

Verwendung der StandardScaler()-Funktion zur Standardisierung von Python-Daten

In diesem Artikel konzentrieren wir uns auf die Verwendung einer der wichtigsten Vor-Verarbeitungstechniken in Python – die Standardisierung mit der StandardScaler()-Funktion.

Lassen Sie uns beginnen!

Notwendigkeit der Standardisierung

Bevor wir zur Standardisierung kommen, verstehen wir zuerst das Konzept des Skalierens.

Das Skalieren von Merkmalen ist ein wesentlicher Schritt beim Modellieren von Algorithmen mit Datensätzen. Die Daten, die normalerweise für das Modellieren verwendet werden, werden auf verschiedene Weise gewonnen, wie zum Beispiel:

Fragebögen
Umfragen
Forschung
Scraping usw.

Die so erhaltenen Daten enthalten Merkmale verschiedener Dimensionen und Skalen. Verschiedene Skalen der Datenmerkmale beeinflussen das Modellieren eines Datensatzes nachteilig.

Dies führt zu einer voreingenommenen Vorhersage in Bezug auf Fehlklassifizierungsfehler und Genauigkeitsraten. Daher ist es notwendig, die Daten vor dem Modellieren zu skalieren.

Das ist der Moment, in dem die Standardisierung ins Spiel kommt.

Standardisierung ist eine Skalierungstechnik, bei der die Daten skalenfrei gemacht werden, indem die statistische Verteilung der Daten in das folgende Format umgewandelt wird:

Mittelwert – 0 (null)
Standardabweichung – 1

Standardisierung

Mit dieser Methode werden die gesamten Datensätze auf einen Mittelwert von null und eine Einheitsvarianz skaliert.

Lassen Sie uns nun versuchen, das Konzept der Standardisierung in den nächsten Abschnitten umzusetzen.

Python sklearn StandardScaler()-Funktion

Die Python sklearn-Bibliothek bietet uns die StandardScaler()-Funktion, um die Datenwerte in ein Standardformat zu standardisieren.

Syntax:

Copy Code


object = StandardScaler()
object.fit_transform(data)

Nach der obigen Syntax erstellen wir zunächst ein Objekt der StandardScaler()-Funktion. Anschließend verwenden wir fit_transform() zusammen mit dem zugewiesenen Objekt, um die Daten zu transformieren und zu standardisieren.

Hinweis: Die Standardisierung ist nur auf Datenwerte anwendbar, die einer Normalverteilung folgen.

Standardisierung von Daten mit der StandardScaler()-Funktion

Sehen Sie sich das folgende Beispiel an!

Copy Code


from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
 
dataset = load_iris()
object= StandardScaler()
 
# Aufteilen der unabhängigen und abhängigen Variablen
i_data = dataset.data
response = dataset.target
 
# Standardisierung 
scale = object.fit_transform(i_data) 
print(scale)

Erklärung:

Importieren Sie die erforderlichen Bibliotheken. Wir haben die Sklearn-Bibliothek importiert, um die Funktion StandardScaler zu verwenden.
Laden Sie den Datensatz. Hier haben wir den IRIS-Datensatz aus der sklearn.datasets-Bibliothek verwendet.
Setzen Sie ein Objekt auf die Funktion StandardScaler().
Trennen Sie die unabhängigen und die Zielvariablen wie oben dargestellt.
Wenden Sie die Funktion mit der Funktion fit_transform() auf den Datensatz an.

StandardScaler() Funktion für Python-Daten: Wie anwenden?

Quelle: digitalocean.com

Jetzt 200€ Guthaben sichern

Registrieren Sie sich jetzt in unserer ccloud³ und erhalten Sie 200€ Startguthaben für Ihr Projekt.

Jetzt loslegen

Das könnte Sie auch interessieren:

Moderne Hosting Services mit Cloud Server, Managed Server und skalierbarem Cloud Hosting für professionelle IT-Infrastrukturen

Wie Sie Unit-Tests in Flask durchführen – Ein umfassender Leitfaden

Python, Tutorial

vor 3 Wochen

Vijona9 Juli um 11:53 Uhr Wie Sie Unit-Tests in Flask durchführen Tests sind ein wesentlicher Bestandteil des Softwareentwicklungsprozesses, um sicherzustellen, dass der Code wie erwartet funktioniert und fehlerfrei ist. In Python…

Celery in Python: Asynchrone Tasks und Hintergrundprozesse einfach umsetzen

Python, Tutorial

vor 3 Wochen

Vijona8 Juli um 18:36 Uhr Einführung in Celery: Asynchrone Task-Queue für Python Celery ist eine verteilte Aufgaben- oder Job-Queue, die auf asynchroner Nachrichtenübermittlung basiert. Sie ermöglicht es Python-Anwendungen, Hintergrundprozesse entweder sofort…

Apache Airflow: Workflow-Orchestrierung erklärt

Python, Tutorial

vor 1 Monat

Vijona25 Juni um 13:48 Uhr Apache Airflow: Workflow-Orchestrierung für Datenpipelines Moderne datengetriebene Organisationen arbeiten mit Pipelines, die Informationen erfassen, umwandeln, anreichern und von einem System in ein anderes übertragen. Solche Datenpipelines…

FEATURED PRODUCTS

Kubernetes

ccloud³

Managed Server

Cloud GPU

S3 Object Storage

COMPUTE

MANAGED

STORAGE

NETWORKING

MANAGEMENT TOOLS

BACKUPS & SNAPSHOTS

WEBSITE-HOSTING

HOUSING

FEATURED INDUSTRIES

Enterprise

Saas-Hosting

Startup

INDUSTRIES

MEHR INDUSTRIES

FEATURED USE CASES

Linux-Hosting

VMware Migration

Docker Hosting

USE CASES

MEHR USE CASES

RESSOURCES

Help Center

Trust Center

Glossar

Tutorials

MEHR CENTRON

MEHR INFOS

Anbieter-Vergleiche

centron vs. Hetzner

centron vs. IONOS

centron vs. Azure

GPU Produkt-Vergleiche

GPU - centron vs. Hetzner

GPU - centron vs. IONOS

GPU - centron vs. OVHcloud

Kubernetes Produkt-Vergleiche

Bald verfügbar!

FEATURED PRODUCTS

Kubernetes

ccloud³

Managed Server

Cloud GPU

S3 Object Storage

COMPUTE

MANAGED

STORAGE

NETWORKING

MANAGEMENT TOOLS

BACKUPS & SNAPSHOTS

WEBSITE-HOSTING

HOUSING

FEATURED INDUSTRIES

Enterprise

Saas-Hosting

Startup

INDUSTRIES

MEHR INDUSTRIES

FEATURED USE CASES

Linux-Hosting

VMware Migration

Docker Hosting

USE CASES

MEHR USE CASES

RESSOURCES

Help Center

Trust Center

Glossar

Tutorials

MEHR CENTRON

MEHR INFOS

Anbieter-Vergleiche

centron vs. Hetzner

centron vs. IONOS

centron vs. Azure