こんにちは、Habr!
JetBrainsチームによるDataloreが連絡を取り合っています。Jupyterノートブックを使用して公開されている数百万のGithubリポジトリの分析結果を共有したいと思います。ラップトップをダウンロードして、間違いなく最も人気のあるデータサイエンスツールの現在の状況をもう少し数値的に把握しました。
UCサンディエゴのデザインラボチームの調査に触発され、2019年10月と2020年10月の2回Jupyterラップトップをダウンロードしました。
2年前、パブリックドメインには123万台のラップトップがありました。2020年10月には、ラップトップの数が8倍に増え、972万個のファイルをダウンロードすることができました。このデータセットを公開しました-ダウンロード手順は投稿の最後にあります。
Datalore . Datalore — Jupyter- , JetBrains. , , Datalore.
, . , @JBDatalore contact@datalore.jetbrains.com.
.
data science
R Julia , Python Jupyter-.
, Bash, MatLab Scilab, , , , : Scala, C++ Java.
. , , “nan”.
Python 2 Python 3 2018, 2019 2020 .
|
|
Python 2 |
Python 3 |
Other languages |
2018 |
52,5% |
43,8% |
3,7% |
2019 (JetBrains Datalore) |
18,1% ( 1029 K) |
72,6% ( 4128 K) |
9,3% ( 529 K) |
2020 (JetBrains Datalore) |
11,8% ( 1154 K, +125 K 2019) |
79,3% ( 7710 K, +3582 K 2019) |
10,8% ( 1050 K, +521 K 2019) |
, Python 3, 2019 87%, Python 2 — 12%.
, Python R, :
data science
Datalore , Python-. Jupyter-.
, 60% Numpy, 47% Pandas Matplotlib.
:
:
PyTorch TensorFlow
, PyTorch TensorFlow.
, PyTorch , TensorFlow.
, Keras TensorFlow , Fast.ai PyTorch . , TensorFlow, , , , .
|
|
TensorFlow |
Keras |
PyTorch |
Fastai |
2019 (JetBrains Datalore) |
321 K |
231 K |
110 K |
19 K |
2020 (JetBrains Datalore) |
430 K (+34%) |
367 K(+59%) |
253 K(+130%) |
25 K(+32%) |
( , Python 3.6 ):
71,90% Markdown.
42,13% output.
12,34% LaTex.
19,77% HTML.
20,63% Markdown.
Markdown Jupyter-. 50% 4 Markdown 14 .
Markdown- :
. , 25 000 , 95% 465 :
. , 42% . 10% 8 .
Jupyter-
Jupyter- — . , . Jupyter- , 36% Jupyter- , . . .
, Markdown- . , , , , , .
Jupyter- , data science.
, . , , Datalore-.
:
:
(3 ). Datalore-.