数年前、私は機械学習とデータ分析に簡単に興味を持ち、完全な初心者の観点からこの素晴らしい世界に没頭することについての短いシリーズを書きました。
何か新しいことを学ぶときによくあることですが、私は本当に自分の「自転車」を作りたかったのです。残念ながら、私は数学とプログラミングについてあまり知らないので、私自身のデータセットが「自転車」の役割の候補になりました。
その瞬間から2年以上が経過し、今では私の小さな経験を皆さんと共有することができました。
この記事では、自己収集データのいくつかの潜在的なソース(あまり人気のないものを含む)を検討し、このプロセスで少なくともいくつかの利点を見つけようとします。

目次:
パートI:はじめに
パートII:データソース
パートIII:メリットはありますか?
パートIV:結論
パートI:はじめに
導入部から、私はデータ分析と機械学習の第一人者ではないことをすでに推測しているでしょう。オープンデータの出所を探す分野のパイオニアとは言い難い。したがって、この記事はグッドプラクティスに関するものではなく、独自のデータセットを作成するというアイデアを思いついた場合に備えて、「手のひら」を解消することに関するものです。
.
, « » , « » .
II:
.
. .
Kaggle. Kaggle .
, - , .
.
« » 2010- , - 2015 .
.
, , :

.
. , API .
, .
( ), .
, « » , :
,
. . .
. , .
. , . 2016 2020 GitHub.
, -, .
III: ?
. , .
, :
- Python ( ) . , - .
- , .
- . , . , , .
- , . , , «», . , , , .
- , - .
IV:
, «», , .
, , : « », .
.
- , .
