Pandas-Tutorial

So geht Datenanalyse mit Python

16.04.2024
Von 
Serdar Yegulalp schreibt für unsere US-Schwesterpublikation Infoworld.

Visualisierungsgrundlagen mit Pandas und Matplotlib

Geht es darum, Daten zu visualisieren, kommt in den meisten Fällen eine weitere Bibliothek zum Einsatz - beispielsweise Matplotlib. Diese Library können Sie auch verwenden, um Datenvisualisierungen direkt aus Pandas heraus zu erstellen. Um die einfache Matplotlib-Erweiterung für Pandas zu verwenden, stellen Sie zunächst sicher, dass Sie Matplotlib installiert haben:

pip install matplotlib

Werfen wir nun noch einmal einen Blick auf die Beispieldaten - und hier auf die durchschnittliche, jährliche Lebenserwartung der Weltbevölkerung:

global_yearly_life_expectancy = df.groupby('year')['lifeExp'].mean()

print(global_yearly_life_expectancy)

| year

| 1952 49.057620

| 1957 51.507401

| 1962 53.609249

| 1967 55.678290

| 1972 57.647386

| 1977 59.570157

| 1982 61.533197

| 1987 63.212613

| 1992 64.160338

| 1997 65.014676

| 2002 65.694923

| 2007 67.007423

| Name: lifeExp, dtype: float64

So erstellen Sie aus diesem Datensatz eine einfache Visualisierung:

import matplotlib.pyplot as plt

global_yearly_life_expectancy = df.groupby('year')['lifeExp'].mean()

c = global_yearly_life_expectancy.plot().get_figure()

plt.savefig("output.png")

Das zugehörige Diagramm wird in einer Datei im aktuellen Arbeitsverzeichnis als output.png gespeichert. Die Achsen und andere Labels im Diagramm lassen sich manuell setzen. Diese Methode eignet sich auch gut für schnelle Exporte. (fm)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.