【SQL】Wikipedia data in BigQuery

Googleが運営するBigQueryにおいて、大量に収集されたWikipediaデータを取り扱うことが出来ます。SQLの指定方法を示します。

SELECT
  language,
  title,
  SUM(views) AS views
FROM
  `bigquery-samples.wikipedia_benchmark.Wiki10B`
WHERE
  title LIKE '%Google%'
GROUP BY
  language,
  title
ORDER BY
  views DESC;

結果は次の通りとなります。

en:英語 es:スペイン語

FROMを以下のように変更しても、クエリ結果は同じとなりました。

 `cloud-training-demos.wikipedia_benchmark.Wiki10B`

BigQueryで扱える公開データセットはかなり多くあるようで、Hakkyを読むことでその概要を知ることが出来ます。

コメント

タイトルとURLをコピーしました