web-dev-qa-db-de.com

Seaborn load_dataset

Ich versuche mit Seaborn ein gruppiertes Boxplot nach dem Beispiel zum Laufen zu bringen.

Ich kann das obige Beispiel zum Laufen bringen, jedoch die Zeile:

tips = sns.load_dataset("tips")

wird überhaupt nicht erklärt. Ich habe die Datei tips.csv gefunden, aber ich finde anscheinend keine ausreichende Dokumentation darüber, was load_dataset speziell tut. Ich habe versucht, eine eigene CSV zu erstellen und diese zu laden, aber es hat keinen Erfolg. Ich habe auch die Tips-Datei umbenannt und es hat noch funktioniert ... 

Meine Frage lautet also:

Wo sucht load_dataset eigentlich nach Dateien? Kann ich das tatsächlich für meine eigenen Boxplots verwenden? 

EDIT: Ich habe es geschafft, meine eigenen Boxplots mit meiner eigenen DataFrame zum Laufen zu bringen, aber ich frage mich immer noch, ob load_dataset für mehr als mysteriöse Tutorialbeispiele verwendet wird.

36
Arsibalt

load_dataset sucht nach Online-CSV-Dateien unter https://github.com/mwaskom/seaborn-data . Hier ist der docstring:

Laden Sie ein Dataset aus dem Online-Repository (erfordert Internet).

Parameter


name: str Name des Datensatzes (name. Csv auf https://github.com/mwaskom/seaborn-data ). Sie können eine Liste von .__ erhalten. verfügbare Datensätze mit: func: get_dataset_names

kws: dikt, optional An pandas.read_csv übergeben

Wenn Sie diesen Online-Datensatz ändern oder Ihre eigenen Daten eingeben möchten, müssen Sie wahrscheinlich pandas verwenden. load_dataset gibt tatsächlich ein Pandas DataFrame Objekt zurück, das Sie mit type(tips) bestätigen können.

Wenn Sie bereits eigene Daten in einer CSV-Datei mit dem Namen tips2.csv erstellt und am selben Speicherort wie Ihr Skript gespeichert haben, laden Sie sie nach der Installation von Pandas folgendermaßen ein:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')
49
selwyth

Nur um die Antwort von 'selwyth' hinzuzufügen.

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)

Nachdem Sie diese Schritte erfolgreich ausgeführt haben, funktioniert das Plotten jetzt tatsächlich so.

Angenommen, Sie möchten ein Balkendiagramm zeichnen.

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

Das funktioniert eigentlich bei jeder Verschwörung in Seaborn.

Darüber hinaus sind wir nicht berechtigt, unseren eigenen Datensatz zu Seaborn Git hinzuzufügen.

3
Sahil Nagpal

Laden Sie alle csv-Dateien (gezippt) herunter, die für Ihr Beispiel von hier verwendet werden sollen.

Extrahieren Sie die Zip-Datei in ein lokales Verzeichnis und starten Sie Ihr jupyter-Notizbuch aus demselben Verzeichnis .. _. Führen Sie die folgenden Befehle in jupyter-Notizbuch aus:

import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')

du bist gut, jetzt mit deinem Beispiel zu arbeiten!

0
raahool007