5つのステップでデータサイエンスプロジェクトのユニークなアイデアを生み出す

おそらく、データサイエンスプロジェクトの最も難しい部分は、独創的でありながら実現可能なアイデアを思いつくことです。そのようなアイデアを探している専門家は、簡単に「データセットの罠」に陥る可能性があります。彼は、既存のデータセットを調べて、興味深い新しいアイデアを考え出すことに何時間も費やしています。しかし、このアプローチには1つの問題があります。事実、既存のデータセット(KaggleGoogle DatasetsFiveThirtyEightを使用)のみを見る人は、調査するデータセットが焦点を当てているタスクの小さなセットだけを見ると、創造性が制限されます。



興味のあるデータセットを調べたいことがあります。すでに無数のモデルが作成されているKaggleのデータに基づいて成功したモデルを構築した場合、実用的な価値はありませんが、少なくとも新しいことを学ぶことができます。しかし、データサイエンティストは、世界に真の利益をもたらすことができる、新しい、ユニークなものを作成しようと努力する人々です。







どのようにして新しいアイデアを生み出しますか?この質問に対する答えを見つけるために、私は自分の経験と創造性研究の結果を組み合わせました。これにより、5つの質問を作成することができ、その回答が新しいアイデアを見つけるのに役立ちました。ここでは、私が提案した手法のおかげで見つかったアイデアの例も示します。ここに提示された質問への回答を検索すると、新しいアイデアを生み出す道を歩み、創造的な可能性を最大限に活用できるようになります。その結果、データサイエンスプロジェクトに実装できる新しい独自のアイデアが得られます。



1.なぜ新しいプロジェクトに取り組み始めたいのですか?



新しいプロジェクトを始めることを考えるとき、あなたは頭の中に意図や目標を持っています。まず、データサイエンスの分野で別のプロジェクトを作成する理由についての質問に対する答えを見つける必要があります。目標としている目標の概要を大まかに把握しておくと、アイデアを見つけることに集中するのに役立ちます。それで、あなたが何のためにプロジェクトを作成しようとしているのかを考えてください。ここにいくつかのオプションがあります:



  • これは、潜在的な雇用主に紹介するポートフォリオプロジェクトです。
  • これは、概念、モデル、または探索的データ分析に関する記事のドラフトです。
  • これはあなたが何かを練習することを可能にするプロジェクトです。たとえば、自然言語処理、データの視覚化、一次データ処理、特定の機械学習アルゴリズムについて話すことができます。
  • これは、このリストに記載されていない非常に特別なプロジェクトです。


2.私の興味と経験はどの分野ですか?



この質問について考える主な理由は3つあります。



  • まず、この分野で必要なスキルを説明するためにデータサイエンスで使用されるVenn図を思い出してください特定の分野の知識は、すべてのデータ科学者が持つべき重要な資産です。このデータが属するサブジェクトエリアが明確である場合にのみ、データを処理することによって特定の問題を解決することが可能です。それ以外の場合は、アルゴリズムが適用され、適切なプロファイルの実践者には不十分と思われる視覚化と予測が作成されます。そして、あなたがしていることが意味をなさないのなら、なぜそれをわざわざするのですか?
  • -, , , , . , . , . , , .
  • -, , , . , , - . 


例を挙げましょう。私が興味を持ち、経験を積んだ知識分野には、システムの環境的および社会経済的持続可能性、金融、大衆文化、自然言語処理が含まれます。これらのトピックに焦点を合わせると、私がすでに持っているものを活用するのに役立ちます。この知識のおかげで、何かに触発されて、実装できる新しいアイデアを思いつくことができるかどうかを判断します。



3.どのようにしてインスピレーションを見つけますか?



インスピレーションの主な源は読書です。アイデアを検索すると、さまざまな資料を読んで興味深いトピックを見つけることができます。



  • , , . , , . , WIRED , , Google . , . , Google.
  • . , . , GPT-2 , , , , , , . - ?
  • . , , Data Science, , . , NLP- «», , , . - ? , ? GPT-2.


他のインスピレーションの源について話すと、新しいアイデアにとらわれることなく、インスピレーションを日常生活の中に見つけることができます。質問に興味があるときはいつでも、データ操作技術を使用してその質問に答えることができるかどうかを考えてください。たとえば、私は最近、ボーイズの予告編に出くわし、IMDbでそれについて多くの肯定的なレビューを見つけました。 「テレビ番組の暴力的なシーン数が時間の経過とともに増加しているという確認はありますか?」私は自分自身に尋ねました。 「暴力的なテレビ番組を楽しむ視聴者は増え続けていますか?」私は続けました。興味のあることがあれば、少し時間を取って関連データを調べてください。



上記のインスピレーションの源からプロジェクトのアイデアをどのように生み出しますか?神経科学者は、アイデアの生成に関連する3つの異なる心理的プロセスを特定しました。



  • 既存のアイデアを組み合わせて新しいアイデアを作成できます(組み合わせの創造性)。たとえば、さまざまなプロジェクトがAirbnbに投稿されたレンタルオファーを分析しました。不動産市場の分析を目的としたプロジェクトがあります。これらのアイデアを組み合わせると、Airbnbのおかげで特定の都市の住宅価格が上昇しているかどうかという質問に対する答えを探すことができます。
  • , ( ). , -, , , . , , - .
  • - , ( ). — . . . : , , .


4. ?



研究の一般的な方向性を決定したら、データサイエンスプロジェクトの形でアイデアを実装する方法を理解できるデータを検索する必要があります。これは、アイデアが成功するかどうかを判断する上で非常に重要です。このセクションのタイトルにある質問に答える際には、既存のデータストアに必要なものがある可能性を考慮する必要があります。必要なデータを自分で収集する必要がある場合があり、これによりタスクが複雑になります。したがって、データソースの概要は次のとおりです。





プロジェクトのアイデアを実装するのに役立つデータが見つからない場合は、アイデアを再定式化します。あなたが持っているデータを使用して実装できる元のアイデアからアイデアを取得してみてください。それまでの間、必要なデータが見つからない理由について自問してみてください。興味のある分野の何が問題になっていますか?あなたはそれについて何ができますか?これらの質問への回答だけでも、新しいデータサイエンスプロジェクトの出現につながる可能性があります。



5.見つかったアイデアは実現可能ですか?



だからあなたは素晴らしいアイデアを持っています!しかし、それを実装することは可能ですか?アイデア生成プロセスの手順をもう一度実行します。達成したいこと(質問番号1)について考えてください。選択した領域に興味がありますか。経験がある場合(質問番号2)、アイデアを実装するために必要なデータがありますか(質問番号4)。次に、次のことを決定する必要があります。アイデアを実装し、目標を達成するために必要なスキルがありますか。



このプロジェクトに費やす予定の時間などの要素を考慮することが重要です。あなたはおそらくあなたが選んだトピックについて博士論文を書くつもりはないでしょう。したがって、見つかったアイデアのフレームワーク内で実行するプロジェクトは、おそらく、その特定の部分にのみ影響します。多分それは何か新しいことを学ぶことだけで成り立つでしょう、あなたは将来その考えを実行する必要があります。



アイデアを生成するための上記の5つのステップを実行した後、目標の達成に費やすのと同じくらい多くの時間を費やして、答えることができ、答えたい質問があるはずです。



結果



  • . , , , . — , , , . — . , , .
  • - . . , - , . , . , , , , .
  • 最初からやり直すことを恐れないでください。何をするにしても、常に新しいことを学びます。コードを1行書くたびに、知識とスキルを練習して拡張します。見つかったアイデアを実装しても目標に近づかないことに気付いた場合、またはアイデアが実現不可能であることが判明した場合は、それを離れて先に進むことを恐れないでください。このアイデアを探すために費やした時間は失われません。アイデアの実施から得られるメリットを賢明に評価する必要があります。


ここで説明する方法を使用して、私は常にデータサイエンスプロジェクトの独創的なアイデアを見つけています。このテクニックがあなたにも役立つことを願っています。



データサイエンスプロジェクトの新しいアイデアをどのように探しますか?










All Articles