本日は、同社公式サイトのカタログに掲載されているレンタチェーン店(以下、レンタ)の酒類の分析(調査)に注目させていただきます。
計画、準備、サンプリング
なぜお酒とこの会社を選んだのですか?はい、すべてが非常に単純です-最初に頭に浮かんだこと(はい、それは起こります)とこのセグメントの大規模な品揃え。将来的には他社製品の分析もあると思います。しかし、ボトルの研究要素に戻りましょう。以前に会社のウェブサイト自体の構造を調査した結果、製品カタログは販売対象の場所と品揃えの変化に応じて動的であるという結論に達しました。モスクワの大型スーパーマーケットでサンプルを採取することが決定されました。もちろん、同社の酒類の品揃えに関する正確なデータがなければ、それが代表的なものであるとは言えませんが、それでもすべてが大丈夫だと信じています。POSごとにサイトのカタログにある製品のユニット数を調べたところ、ここでは平均して同じであることがわかりました。
分析ツール
senior data analyst - python 3+, pandas , BeautifulSoup, request, csv, lxml , seaborn, matplotlib, plotly , Anaconda, JupyterLab Jupyternotebook, google sheets( ) brain.
( !) - (). (python). - , - , - «» ( ). .
, , () . , 101 . Jupyter .
.csv , , .
, () . , ( ) “ ” , , , , . “” python . , strip() replace(), , ₽.
price \xa0 - , ( ). replace() astype(float) float .
describe() . 986.78 . , 631.59 .
c matplotlib , . 2400 , .
詳細な分析のために、plotlyライブラリから箱ひげ図を作成してみましょう。今、私たちは排出量の圧倒的な価値が2420ルーブルから始まることがわかります。そして最大のリリースは16209ルーブルのヘネシーXOコニャックでした。sort_value()メソッドを使用して、リボンで最も高価なアルコールの上位5つを見つけます。
価格と品揃えは動的であるため、すべてが毎日変化する可能性があることを思い出させてください。
ご清聴ありがとうございました。