まあ、冗談でそれで十分です。みんなが笑って、怖がりすぎないことを願っています。しかし、待ってください、私たちはまだ終わっています。すべてのCommand + C入力に応答するようにシステムを構成することで、サイトで人々が何をしているかについてより多くの情報を得る機会があることに気づきました。Stack Overflowのすべてのコピーを2週間正常にキャプチャしました。これが、その結果です。
あなた一人じゃありません
Stack Overflowで質問ページを開いた人の4人に1人は、サイトにアクセスしてから最初の5分以内にそこから何かをコピーします。 3月26日から4月9日までの7,305,042件の投稿のうち、合計で40,623,987部をカウントしました。人々は、質問からの約10倍、コメントからの約35倍の頻度で回答からテキストをコピーします。コードのブロックは、付随するテキストの10倍の頻度でコピーされ、受け入れられた回答のない質問のページからコピーされると、驚くほどアクティブになります。
したがって、既成のコードを最初から作成するのではなくコピーすることを恥ずかしく思ったことがある場合は、良心を落ち着かせてください。誰かがあなたのすべての困難をすでに解決しているのに、なぜ車輪の再発明をするのですか?私たちはこれを再利用と呼びます-かつて他の誰かによって学ばれ、作成され、証明されたものが今あなたに役立つでしょう。そして、それは何も悪いことではありません。こうすることで、より速く学習し、より迅速にコードを実行し、心配する必要がなくなります。私たちのサイト全体は、知識の再利用の概念に基づいて構築されています-Stack Overflowコミュニティは、主にメンタリングへの利他的なアプローチで強力です。
巨人の肩の上に登り、彼らがあなたの前で学んだ教訓を借りて、新しく価値のあるものを作ることは完全に許されています。そうは言っても、バグやセキュリティホールを不注意に回避するためにコピーするときは、いくつかの実証済みの方法に従う価値があるので、ピースをつかんで貼り付ける前に、正しく取得するようにしてください。もちろん、一部のコードフラグメントはライセンスでのみ使用できることを忘れてはなりません。それ以外の場合は、コミュニティによって作成された作業から利益を得たいと考えているすべての人を完全にサポートします。
良心のきらめきなしに何年もの間StackOverflowからコードを取り除いてきた人として、コピーイベントが何百万もの人々に流れ始めたとき、私は驚きませんでした。もう1つ驚いたのは、この情報から得られたさまざまな質問に対する回答がいくつあるかということです。Stack Overflowから実際にコンテンツをコピーする人は何人いますか?コードまたは何か他のものだけをコピーしますか?受け入れられた回答で質問をより積極的にコピーしていますか?私たちの分析に方向性を与えるために、私のチームと私は私たちに興味のある質問のリストを作成しました。それはすべて単純な冗談から始まり、多くのことに光を当て、将来のプラットフォームの開発と改善に関する多くの議論に弾みをつけた真剣な研究になりました。
データ
自家製のWebトラッキングツールを使用して、ユーザーがサイトから何かをコピーするたびに記録するカスタムイベントを作成しました。これらのイベントのおかげで、タグ、コンテンツタイプ(質問、回答またはコメント、コードブロックまたはプレーンテキスト)、コピー者の評判、投稿の評価、地域、投稿のステータスなど、さまざまな特性を追跡することができました-承認されたかどうか。一般的に、コピーされたテキスト自体を除いて、ほとんどすべてを保存しました。
3月26日から4月9日までの2週間にわたってデータを収集しました。以下のすべての計算は、この期間のユーザーの行動に関連しています。
トップレベルの結果は、ずっと前に冗談のように聞こえたことを確認しました。StackOverflowでは、誰もがコピーしたことを実行します。また、行動の一種としてのコピーは、サイトトラフィックですでに特定されているのと同じパターンに従うこともすぐに確信しました。人々は平日、勤務時間中に最も積極的にコピーします。私たちのサイトが最も人気のある地域は、最も多くのコピーを提供します:アジア-33%、ヨーロッパ-30%、北アメリカ-26%。そして最後に、コピーユーザーの86%は匿名ユーザーです(つまり、評判はゼロです)。誰が、何を正確にコピーしているのかを詳しく調べ始めたとき、それはより面白くなりました。
高い評判は強いコピーと比較されますか?
まず、チェックしたかったのですが、評判の高いユーザーがコピーに最も積極的になるのでしょうか。
グラフから、ほとんどのコピーはレピュテーションのないユーザーによって行われていることがわかります。つまり、アカウントを作成するとすぐに1プラスになるため、匿名です。おそらく、これらのイベントのいくつかは、既存のアカウントにログインしていないユーザーの間で発生します。残念ながら、これはいかなる方法でも検証できません。
ユーザーの大部分はレピュテーションが低いため、データを正規化するために、グループごとの内訳を削除してみましょう。ここで、総部数ではなく、ユーザーあたりの部数に注目して、レピュテーションによって平均がどのように異なるかを見てみましょう。
この視覚化を調べると、次のパターンをたどることができます。評判が高まるにつれて、ユーザーあたりのコピー数は減少し始めます。相関関係は存在しますが、あまりはっきりしていません。そのため、評判の良いユーザーまたは悪いユーザーがより積極的にコピーしていることを完全に確信することはできません。まだスキルを開発している開発者は、評判が低く、学習プロセスをスピードアップできるリソースを探す傾向があります。彼らが知識を蓄積するにつれて、彼らは評判を築き、適切に調整されたソリューションを必要とするタスクに取り組み始めます-これらは常にStackOverflowにあるとは限りません。
受け入れられた回答はより頻繁にコピーされますか?
ここでの思考の流れは次のように構築されています。答えが受け入れられたので、それはおそらく最良であることを意味します。もしそうなら、それは倍のエネルギーでコピーされるべきです。ただし、統計を見ると、52.4%のケースで、受け入れられなかった回答がコピーされていることがわかります。ただし、平均値について話すと、回答が受け入れられた1つの一意の投稿の場合、コピーは7つあり、受け入れられないものは5つだけです。受け入れられなかった投稿はより多くのコピーを提供しますが、受け入れられた投稿は知識を再利用する同じプロセスをより積極的に開発します。
なお、原則として回答が得られない質問もあります。たとえば、 この答えを見てください:4,984のユニークユーザーが投票し、7,943が調査中にコピーされました。しかし、質問者は彼を受け入れませんでした。そして、彼は他の人も受け入れませんでした-おそらくこれは、彼が2010年以来サイトにまったく登場していないという事実に何らかの形で関連しています。しかし、他の多くの役立つ答えも同じ立場にあります。
上位の投稿はより積極的にコピーされていますか?
ですから、受け入れられた答えはコピーすることに利点はありませんが、高い評価は間違いなく効果があるはずですよね?確認しよう。
ご覧のとおり、1票から1000票までのグループの回答のカテゴリでは、すべてが非常にスムーズに進みます。ただし、質問の場合、コピーのほとんどは、評価が1から5の投稿で行われます。これは、最終的に応答が得られるまで、再投稿のためにコピーするためだと思います。
ユーザーの場合と同様に、サイトの投稿の大部分の評価はかなり低くなっています。正規化のために、投稿ごとに作成されるコピーの数を見てみましょう。
ここでは、評価とともにコピー数が増加していることがはっきりとわかります。そして、これは論理的です。コミュニティは、すでに良好なパフォーマンスを達成しているものをより積極的に取り入れます。
悪い評価の投稿をコピーする人はいますか?
しかし、否定的に評価された投稿を表す青い点はどうですか?誰も承認していないものをコピーするのはなぜですか?さて、結論にジャンプしないでください。 この答えを
見てください 。否定的な評価のすべての回答のうち、彼はコピーの最大数を収集しました-288、評価-2。このテキストを読むと、最も人気のある回答と同じように、合計29部と493部の評価で、より簡潔に表現されていることがわかります。部数の点で否定的な回答が出てこなかったとしても、ここでの「ナイアシル」の原則は明らかに有利に働いた。
最も頻繁にコピーされるタグは何ですか?
私が最も答えを知りたかったのはこの質問でした。残念ながら、調査の規模と利用可能なリソースの量のために、ネストされたタグを解析することはできませんでした。たとえば、htmlタグには、タグ| html | css |の組み合わせを持つ投稿は含まれません。
ほとんどの場合、コンテンツはサイトで最も人気がありアクティブなタグからコピーされましたが、これは驚くべきことではありませんでした。私の目を引いたのは1つだけです。Pythonは、トップ10の4つのタググループに同時に表示されます。それらのうちの3つはデータ分析に直接関連しています:| python | pandas |、| python | pandas | dataframe | および| python | matplotlib |。私自身もこのトピックに無関心ではないので、多くの人がこれらのツールを習得していることをとてもうれしく思います。
トップ10のタグ、投稿ごとのコピー数
合計コピー数が最も多いタグに加えて、コピーと投稿の比率が最も高いタグを計算したかったのです。投稿の最小しきい値を10に設定しました。ご覧のとおり、タグの詳細が多いほど、投稿ごとに収集されるコピーの数が多くなります。
最もコピーされた投稿は何ですか?
さて、それでは、多くの人の間で好奇心をかき立てるものに移りましょう。どの投稿が最も多くのコピーを取得しましたか?
コードブロックの回答
勝者は、3,497票と11,829部のPandasのDataFrameの行を反復処理する方法に対する回答でした 。 2013年に投稿され、今でも毎週何千人もの人々を救済し続けています。
プレーンテキストの回答
コードのないコンテンツに関しては、TypeErrorに関する投稿があり ます。this.getOptionsは、218票と1,570コピーの関数[クローズ]ではありません。確認する方法はありませんが、 `sass-loader @ 10.1.1`スニペットをコピーしていると思います。
コードブロックの
質問私たちの一番の質問は 、リンクのように機能するHTMLボタンを作成する方法です。 -2,147票と3,665部。
プレーンテキストの質問
最後に、最も人気のある非コードの質問は 、現在のブランチの先端がリモートのブランチの背後にあるため、更新が拒否されたというものでした-322票と261コピー。テキストにはコードブロックとしてフォーマットされていない多くのgitコマンドが含まれているため、問題があります。おそらく、それらはアクティブにコピーされます。しかし、コピーされたテキスト自体は保存しなかったので、誰も知ることはありません。
コメント(1)
StackOverflowは質問と回答だけではないことを覚えておくことが重要です。賢明なコメントが1つで十分な場合もあります。特に積極的にコピーされたものをいくつかご紹介します。
1つ目はサイト全体のコメントの中で絶対的なリーダーであり、 2つ目はダークホースです。5票しか集めていませんが、コピー数では6位です。