データ分析に使用する言語は、最もハックニーで苦痛なトピックです。そのため、Netpeakの分析責任者で電報チャネルR4Marketingの作成者であるAlexei Seleznevと協力し、SQL演算子とR言語の動詞の比較を準備しました。利便性と移植性のために、カードで行いました。
TelegramチャネルとVKグループでは、プログラミングとデータ分析に関するさらに興味深い資料を毎日公開しています。おそらくあなたはあなた自身にとって何か面白いものを見つけるでしょう。
しかし、要点まで!
RとSQL
比較を行う前に最初に行うことは、基本的なSQLステートメントをブラッシュアップすることです。もちろん、皆さんはそれらを覚えていますが、突然...
DML(Data Manipulation Language)SELECTステートメントとそれに関連するすべてを検討します。
SELECTステートメント自体が、テーブルから選択するフィールドを管理します
FROM句は、選択が行われるテーブルを指します
WHERE句は、特定の列の値でテーブルをフィルタリングします
GROUP BYは、集計特性を計算するためのグループ化フィールドを指定します
ORDER BY演算子は、テーブルの行をいくつかの列の値で並べ替えます
, . R? - dplyr R ( ), .
dplyr ( tidyverse) , , :
, ,
dplyr tidy data
( %>%)
, SQL dplyr:
, , dplyr . - , :) , (.. dplyr - tidyverse) . :
Tidy data
tidy data. , 100% .
, , « »:
Data Analysis:
«» , «» -.
tidy datasets dplyr !
, tidy data .
%>%
, R - %>%. , , tidyverse.
- .
, - 2 : R, SQL, - . R - , - .