👨🏾‍🤝‍👨🏼 🚣🏽 🧛 2020年にデータサイエンティストのために何を読むべきか 🕍 🏵️ 👩‍❤️‍👩

この投稿では、データ改訂管理とデータ科学者と機械学習エンジニア間のコラボレーションのためのコミュニティおよびWebプラットフォームであるDAGsHubの共同創設者およびCTOからのデータサイエンスに関する洞察の抜粋を共有します。選択には、Twitterアカウントから、探しているものを正確に知っている人を対象とした本格的なエンジニアリングブログまで、さまざまなソースが含まれます。カットの下の詳細。

著者から：

あなたはあなたが食べるものであり、知識労働者としてあなたは良い情報提供の食事を必要とします。私が最も有用または魅力的だと思うデータサイエンス、人工知能、および関連技術に関する情報源を共有したいと思います。これがあなたにも役立つことを願っています！

2分間の論文

最新のニュースに追いつくのに適したYouTubeチャンネル。チャンネルは頻繁に更新され、プレゼンターはカバーされているすべてのトピックに伝染性の熱意と前向きな姿勢を持っています。AIだけでなく、コンピューターグラフィックスやその他の視覚的に魅力的なトピックに関する興味深い作業も取り上げることを期待してください。

ヤニックはYouTubeチャンネルで、深層学習における有意義な研究を技術的に詳細に説明しています。自分で研究を読む代わりに、重要な記事をより深く理解するために、そのビデオの1つを見る方が速くて簡単なことがよくあります。説明は、数学を無視することなく、そして三本の松で迷子になることなく、記事の本質を伝えます。ヤニックはまた、研究が互いにどのように比較されるか、結果をどれほど真剣に受け止めるか、より広い解釈などについての彼の見解を共有しています。初心者（または非学術的実践者）が自分でこれらの発見に到達することはより困難です。

Distill.pub

彼ら自身の言葉で：

機械学習の研究は、明確で、ダイナミックで、活気に満ちている必要があります。そして、Distillは研究を支援するために作成されました。

Distillは、機械学習の研究を行ったユニークな出版物です。記事は、読者がトピックをより直感的に理解できるように、見事な視覚化で宣伝されています。空間的思考と想像力は、機械学習とデータサイエンスのトピックを理解するのに非常にうまく機能する傾向があります。対照的に、従来の出版物のフォーマットは、その構造が厳格で、静的で乾燥しており、時には「数学的」である傾向があります。Distillの作成者の1人であるChrisOlahも、GitHubですばらしい個人ブログを管理しています。それは長い間更新されていませんが、それでも深層学習のトピックに関してこれまでに書かれた最高の説明のコレクションのままです。特に、LSTMの説明は私を大いに助けました！

ソース

セバスチャンルーダー

Sebastian Ruderは、主にニューラルネットワークと自然言語のテキスト分析の交差点について、非常に有益なブログとニュースレターを書いています。彼はまた、科学会議で研究者やプレゼンターに多くのアドバイスを提供します。これは、学界にいる場合に非常に役立ちます。セバスチャンの記事は通常、レビューの形であり、特定の分野における現代の研究と方法の状態を要約して説明しています。これは、記事がすぐに自分の方向性を知りたい開業医にとって非常に役立つことを意味します。セバスチャンもツイートします。

アンドレイ・カルパティ

アンドレイ・カルパティは紹介する必要はありません。地球上で最も有名な深層学習研究者の1人であることに加えて、彼はサイドプロジェクトとしてarxiv sanitypreserveのような広く使用されているツールを作成しています。数え切れないほどの人々がcs231nの彼のスタンフォードコースを通してこの分野に参入しました、そしてあなたは神経ネットワークを学ぶための彼のレシピを知ることは役に立つでしょう。また、テスラが現実の世界で大規模に機械学習を適用しようとするときに克服しなければならない現実の課題についての彼の話を見ることをお勧めします。スピーチは有益で、印象的で、冷静です。直接MLに関する記事に加えて、アンドレイKarpatiができます良い生活のヒントのために野心的な科学者。TwitterとGithubでAndrewを読んでください。

ユーバーエンジニアリング

Uberのエンジニアリングブログは、その規模と幅に感銘を受け、人工知能を含む多くのトピックをカバーしています。Uberのエンジニアリング文化について私が特に気に入っているのは、オープンソースを使って非常に興味深く価値のあるプロジェクトを急ピッチで作成する傾向があることです。ここではいくつかの例を示します。

ルートヴィヒ
h3
反応-vis
aresdb
そして、リストはどんどんと続きます...帽子を脱いで、ユーバー

OpenAIブログ

意見の相違はさておき、OpenAIブログは間違いなく美しいです。時々、ブログはOpenAIの規模でのみ来ることができる深い学習についてのコンテンツとアイデアを投稿します：仮想の深い二重降下現象。OpenAIチームは投稿頻度が低い傾向がありますが、それは重要です。

ソース

Taboolaブログ

Taboolaブログは、この投稿の他の情報源ほどよく知られていませんが、ユニークだと思います。著者は、「通常の」ビジネスの製造にMLを適用しようとすると、非常にありふれた現実の問題について書いています。世界チャンピオン、「私のモデルが誤った自信を持って物事を予測していることをどうやって知ることができますか？」これらの問題は、この分野で働くほとんどすべての人に関連しており、より主流のAIトピックよりも報道が少ないですが、これらの問題に適切に取り組むには、依然として世界クラスの才能が必要です。幸いなことに、Taboolaにはこの才能と、他の人も学ぶことができるようにそれについて書く意欲と能力の両方があります。

Twitterに加えて、Redditには、研究、ツール、または群衆の知恵に夢中になることほど良いものはありません。

AIの状態

投稿は毎年発行されますが、情報が非常に密集しています。このリストの他のソースと比較して、これは技術者以外のビジネスマンにとってよりアクセスしやすいものです。私がこのレポートで気に入っているのは、ハードウェア、研究、ビジネス、さらには地政学の進歩を鳥瞰的な視点から結び付けて、業界と研究がどこに向かっているのかをより全体的に把握しようとしていることです。利益相反について読むために、必ず最後から始めてください。

ポッドキャスト

率直に言って、ポッドキャストは技術的なトピックについて学ぶのには不向きだと思います。結局のところ、彼らはトピックを説明するために音を使用するだけであり、データサイエンスは非常に視覚的な分野です。ポッドキャストは、後でより深い調査を行ったり、哲学的な議論を行ったりする理由を与える傾向があります。ただし、ここにいくつかのガイドラインがあります。

LexFriedmanが人工知能の分野の著名な研究者と話しているときのポッドキャスト。フランソワ・ショレットとのエピソードは特に良いです！
データエンジニアリングポッドキャスト。新しいデータインフラストラクチャツールについて聞いてうれしいです。

素晴らしいリスト

ここでは注意する必要はありませんが、探しているものがわかっているときに役立つリソースが増えています。

ツイッター

, , — Twitter. .
— . -. , , . , , .
fast.ai, .
ML Github, .
Kerasの作成者であるFrançoisCholletは現在、インテリジェンスとは何か、そしてそれをテストする方法についての理解を更新しようとしています。
GoogleBrainのHardmaruリサーチ

サイエンティスト。

結論

元の投稿は、リストに載せないのは残念なことですが、著者が優れたコンテンツのソースを見つけたときに更新される可能性があります。新しい情報源をお勧めしたい場合は、Twitterで彼をフォローしてください。DAGsHubはAdvocate [approx。transl。データサイエンスの公務員]なので、データサイエンスで独自のコンテンツを作成する場合は、投稿の作成者に自由に書いてください。

推奨されるソースを読み、HABRプロモーションコードを使用して自分自身を成長させると、バナーに示されている割引にさらに10％を得ることができます。

その他のコース

2020年にデータサイエンティストのために何を読むべきか