web-dev-qa-db-de.com

Warum zeigt PyPi keine Download-Statistiken mehr an?

Es war so praktisch, eine Vorstellung davon zu bekommen, ob das Paket beliebt ist oder nicht (selbst wenn seine Beliebtheit der Grund für einen "Import" -Fall in einem anderen beliebten Paket ist). Aber jetzt sehe ich diese Information aus irgendeinem Grund nicht.

Ein Beispiel: https://pypi.python.org/pypi/blist

Warum haben sie dieses nützliche Ding ausgeschaltet?

53
d-d

Wie in dieser mail.python.org-Artikel zu sehen ist, wurden die Download-Statistiken entfernt, da sie nicht aktualisiert wurden und zu schwierig zu reparieren wären.

Donald Stufft, der Autor des Artikels, führte diese Gründe auf:

Es gibt zahlreiche Gründe für ihre Entfernung/Ablehnung, von denen einige:

  • Technisch schwierig mit dem neuen CDN zu arbeiten
    • Das CDN wird an die PSF gespendet, und die gespendete Schicht bietet keinerlei Protokollzugriff
    • Die Umgehung des Problems, keinen Protokollzugriff zu haben, würde den Nutzen des CDN erheblich verringern
  • Sehr ungenau
    • Eine Reihe von Dingen verhindert, dass die Anzahl der Downloads ungenau wird. Einige davon sind:
      • pip-Download-Cache
      • Interne oder inoffizielle Spiegel
      • Pakete, die nicht auf PyPI gehostet werden (zu Vergleichszwecken)
      • Mirrors oder inoffizielle Grab-Skripte, die zu überhöhten Zählern führen (Zuletzt schaute ich, dass 25% der Downloads von einem bekannten Mirroring-Skript stammten).
  • Nicht besonders nützlich
    • Nur weil ein Projekt viel heruntergeladen wurde, heißt das noch lange nicht, dass es gut ist
    • Nur weil ein Projekt nicht oft heruntergeladen wurde, heißt das noch lange nicht, dass es schlecht ist
48

Ich habe gerade https://pepy.tech/ freigegeben, um die Downloads eines Pakets anzuzeigen. Ich habe die Daten von BigQuery verwendet, damit Sie das gleiche Ergebnis erhalten :-)

66
petrusqui

Kürzlich habe ich herausgefunden, dass Sie die Datenbank Big Query von PyPI abfragen können, die zur PSF-Stiftung beigetragen hat Link .

Außerdem habe ich einen Blog-Beitrag geschrieben, wie Sie diese Informationen abrufen können, wenn Sie einen Blick darauf werfen möchten.

23
kiran.koduru

Das Programm pypinfo ist ein Python3-Befehlszeilenprogramm für BigQuery, das über pip installiert werden kann. Wenn Sie die Anmeldeinformationen (eine JSON-Datei) einrichten, sollten Sie in der Lage sein, Folgendes zu schreiben:

$ pypinfo -d 1825 blist year
Served from cache: False
Data processed: 250.31 GiB
Data billed: 250.31 GiB
Estimated cost: $1.23

| download_year | download_count |
| ------------- | -------------- |
|         2,017 |        443,067 |
|         2,016 |        391,816 |
|         2,018 |         57,689 |

Einige Informationen zur Datenerfassung finden Sie unter https://packaging.python.org/guides/analyzing-pypi-package-downloads/

8