Ich versuche mit Seaborn ein gruppiertes Boxplot nach dem Beispiel zum Laufen zu bringen.
Ich kann das obige Beispiel zum Laufen bringen, jedoch die Zeile:
tips = sns.load_dataset("tips")
wird überhaupt nicht erklärt. Ich habe die Datei tips.csv gefunden, aber ich finde anscheinend keine ausreichende Dokumentation darüber, was load_dataset speziell tut. Ich habe versucht, eine eigene CSV zu erstellen und diese zu laden, aber es hat keinen Erfolg. Ich habe auch die Tips-Datei umbenannt und es hat noch funktioniert ...
Meine Frage lautet also:
Wo sucht load_dataset
eigentlich nach Dateien? Kann ich das tatsächlich für meine eigenen Boxplots verwenden?
EDIT: Ich habe es geschafft, meine eigenen Boxplots mit meiner eigenen DataFrame
zum Laufen zu bringen, aber ich frage mich immer noch, ob load_dataset
für mehr als mysteriöse Tutorialbeispiele verwendet wird.
load_dataset
sucht nach Online-CSV-Dateien unter https://github.com/mwaskom/seaborn-data . Hier ist der docstring:
Laden Sie ein Dataset aus dem Online-Repository (erfordert Internet).
Parameter
name: str Name des Datensatzes (
name
. Csv auf https://github.com/mwaskom/seaborn-data ). Sie können eine Liste von .__ erhalten. verfügbare Datensätze mit: func:get_dataset_names
kws: dikt, optional An pandas.read_csv übergeben
Wenn Sie diesen Online-Datensatz ändern oder Ihre eigenen Daten eingeben möchten, müssen Sie wahrscheinlich pandas verwenden. load_dataset
gibt tatsächlich ein Pandas DataFrame
Objekt zurück, das Sie mit type(tips)
bestätigen können.
Wenn Sie bereits eigene Daten in einer CSV-Datei mit dem Namen tips2.csv erstellt und am selben Speicherort wie Ihr Skript gespeichert haben, laden Sie sie nach der Installation von Pandas folgendermaßen ein:
import pandas as pd
tips2 = pd.read_csv('tips2.csv')
Nur um die Antwort von 'selwyth' hinzuzufügen.
import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)
Nachdem Sie diese Schritte erfolgreich ausgeführt haben, funktioniert das Plotten jetzt tatsächlich so.
Angenommen, Sie möchten ein Balkendiagramm zeichnen.
sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.
Das funktioniert eigentlich bei jeder Verschwörung in Seaborn.
Darüber hinaus sind wir nicht berechtigt, unseren eigenen Datensatz zu Seaborn Git hinzuzufügen.
Laden Sie alle csv-Dateien (gezippt) herunter, die für Ihr Beispiel von hier verwendet werden sollen.
Extrahieren Sie die Zip-Datei in ein lokales Verzeichnis und starten Sie Ihr jupyter-Notizbuch aus demselben Verzeichnis .. _. Führen Sie die folgenden Befehle in jupyter-Notizbuch aus:
import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')
du bist gut, jetzt mit deinem Beispiel zu arbeiten!