web-dev-qa-db-de.com

"CSV-Datei existiert nicht" - Pandas Dataframe

Ich lerne gerade Pandas für die Datenanalyse und habe einige Probleme beim Lesen einer csv-Datei im Atom-Editor. 

Wenn ich den folgenden Code ausführen:

import pandas as pd 

df = pd.read_csv("FBI-CRIME11.csv")

print(df.head())

Ich bekomme eine Fehlermeldung, die mit endet 

OSError: Datei b'FBI-CRIME11.csv 'ist nicht vorhanden

Hier ist das Verzeichnis zur Datei: /Users/alekseinabatov/Documents/Python/"FBI-CRIME11.csv ".

Wenn ich versuche, es so auszuführen:

df = pd.read_csv(Users/alekseinabatov/Documents/Python/"FBI-CRIME11.csv")

Ich bekomme einen anderen Fehler:

NameError: Name 'Benutzer' ist nicht definiert

Ich habe dieses Verzeichnis auch in den Editor-Einstellungen in das Feld "Project Home" gestellt, obwohl ich nicht ganz sicher bin, ob es einen Unterschied macht.

Ich wette, es gibt einen einfachen Weg, damit es funktioniert. Ich würde mich sehr über Ihre Hilfe freuen! 

8
Aleksei Nabatov

Hast du es versucht?

df = pd.read_csv("Users/alekseinabatov/Documents/Python/FBI-CRIME11.csv")

oder vielleicht

df = pd.read_csv('Users/alekseinabatov/Documents/Python/"FBI-CRIME11.csv"')

(Wenn der Dateiname Anführungszeichen hat)

11
arutaku

Einfach auf den Dateinamen verweisen

df = pd.read_csv("FBI-CRIME11.csv")

funktioniert normalerweise nur, wenn sich die Datei im selben Verzeichnis wie das Skript befindet.

Wenn Sie Windows verwenden, stellen Sie sicher, dass Sie den Pfad zur Datei wie folgt angeben:

PATH = "C:\\Users\\path\\to\\file.csv"
4
BartDur

Hatte ein Problem mit dem Pfad, stellt sich heraus, dass Sie das erste "/" angeben müssen, damit es funktioniert! Ich verwende VSCode/Python unter macOS

3
Adnane

Auf Jupyter Notebook zu sein es funktioniert nur für mich mit dem relativen Pfad. Zum Beispiel:

df = pd.read_csv ('file.csv')

Aber zum Beispiel in vscode muss ich den vollständigen Pfad angeben:

df = pd.read_csv ('/home/code/file.csv')
1
user3403899

Ich hatte auch das gleiche Problem, das ich gelöst habe:

dataset = pd.read_csv('C:\\Users\\path\\to\\file.csv')
1
İrem Şahin

Ihnen fehlt "/" vor Benutzern. Ich gehe davon aus, dass Sie eine MAC-Schätzung anhand der Dateinamen verwenden. Ihr Stammverzeichnis ist "/".

1
broken_arrow

In meinem Fall habe ich .csv vom Ende entfernt. Ich benutze Ubuntu.

pd.read_csv("/home/mypc/Documents/pcap/s2csv")
0
Kunal C

Ich hatte das gleiche Problem, aber es geschah, weil meine Datei "geo_data.csv.csv" hieß. Neuer Laptop zeigte keine Dateierweiterungen an, daher war das Namensproblem in Windows Explorer nicht sichtbar. Sehr dumm, ich weiß, aber wenn diese Lösung für Sie nicht funktioniert, versuchen Sie das :-)

0
George

Was für mich funktioniert hat: 

import csv
import pandas as pd
import os

base =os.path.normpath(r"path")



with open(base, 'r') as csvfile:
    readCSV = csv.reader(csvfile, delimiter='|')
    data=[]
    for row in readCSV:
        data.append(row)
    df = pd.DataFrame(data[1:],columns=data[0][0:15])
    print(df)


This reads in the file , delimit by |, and appends to list which is converted to a pandas df (taking 15 columns)
0
Chris Marsh

Führen Sie den Befehl "pwd" zuerst in cli aus, um die Richtung Ihres aktuellen Projekts zu ermitteln, und fügen Sie dann den Namen der Datei zu Ihrem Pfad hinzu!

0
DragoRoff

Versuche dies 

import os 
cd = os.getcwd()
dataset_train = pd.read_csv(cd+"/Google_Stock_Price_Train.csv")
0
Brett Young

Stellen Sie sicher, dass Ihre Quelldatei im CSV-Format gespeichert ist. Ich habe alle Schritte des Hinzufügens des vollständigen Pfads zu der Datei ausprobiert, einschließlich des Löschens der Kopfzeile = 0 und Hinzufügen von Skiprows = 0, aber nichts funktioniert, da ich die Excel-Datei (Datendatei) im Arbeitsmappenformat und nicht im CSV-Format gespeichert habe. Prüfen Sie daher zunächst die Dateierweiterung.

0
monica

Adnanes Antwort hat mir geholfen.

Hier ist mein vollständiger Code auf Mac, hoffe das hilft jemandem. Alle meine CSV-Dateien werden in/Users/lionelyu/Documents/Python/Python Projects/gespeichert.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.style.use('ggplot')

path = '/Users/lionelyu/Documents/Python/Python Projects/'

aapl = pd.read_csv(path + 'AAPL_CLOSE.csv',index_col='Date',parse_dates=True)
Cisco = pd.read_csv(path + 'Cisco_CLOSE.csv',index_col='Date',parse_dates=True)
ibm = pd.read_csv(path + 'IBM_CLOSE.csv',index_col='Date',parse_dates=True)
amzn = pd.read_csv(path + 'AMZN_CLOSE.csv',index_col='Date',parse_dates=True)
0
Lionel Yu

Ändern Sie einfach den CSV-Dateinamen. Sobald ich es für mich geändert habe, hat es gut funktioniert. Zuvor habe ich data.csv angegeben und dann in CNC_1.csv geändert.