heleth's blog

データサイエンスに関することを書いていきます

Google Professional Data Engineer 取得に向けたメモ

このページについて

GoogleProfessional Data Engineerの資格取得へむけて勉強することにしました。
このページには、勉強した内容のメモを残そうと思います。

テキストメモ

とりあえずは下記レポジトリのREADME.mdに記載

github.com

テキスト以外のメモ

README.mdに載せられない画像とかは適宜ここに貼る
f:id:daxida:20190209200746p:plain summary table for storage solutions of GCP (from coursera)

tweet数でふりかえる2018年紅白歌合戦

2018年の紅白歌合戦、みなさんはご覧になりましたか?

私は昨年よりも面白かったと感じましたが、みなさんはどうでしたでしょうか。
実際、視聴率は昨年よりやや改善したそうです。

2018紅白の出場者ラインナップは例年以上に豪華で
・ サザン・いきものがかり北島三郎のような大物の復活
・ 米津玄師・SuchmosAqoursなど約10組が初登場
など、話題に事欠きませんでした。

また、サブ出演・共演イベントが豊富にあり、知らない人が歌っていても飽きずに見ていられた点も良かった点ではないかと感じました。
特に大トリでの桑田さんとユーミン北島三郎の共演は、紅白でしか見られない超豪華な組み合わせでしたね!

そんな2018紅白について、放送時間中のtwitter投稿を集計・可視化してみました。

目次

準備

Twitter standard Search APIを使い、 2018紅白の放送時間である19:15 ~ 23:45に投稿されたtweetを取得しました。

上記の条件で計15万tweetを取得しました。

可視化

1. 出場者別 tweet

出場者別のtweet数をシンプルに可視化してみます。 f:id:heleth:20190103135351p:plain 1位:米津玄師
2位:刀剣男士
3位:Aqours
4位:松任谷由美
5位:サザンオールスターズ

うん..なんというか米津玄師すげぇって感じですね

もっと出場者同士で接戦になるかと思っていたのですが、
やはりというべきか若い世代に人気の出場者のtweet数が顕著に多くなっています。
むしろそんな中でユーミンが4位、サザンが5位につけているのは大健闘と言えるかもしれません。

tweet数の上位3組は初出場組であり、この3組を見るために紅白をつけた人ももしかすると多かったのかもしれません。

※ AKBやジャニーズのtweet数が少なすぎる気もしますが、

  • グループ名(例 AKB)ではなくアーティストの個人名(例 さっしー)を含むtweetは取得していない
    → グループユニットが不利
  • 「紅白」を含まないtweetは取得していない
    → 「まさか〇〇が紅白に!」という意外性の高かった出場者が有利
    という要因があるものと思われます。

2. 出場者別 tweet数推移

続いて、出場者別にtweet数の推移を可視化してみます。 f:id:heleth:20190103145832p:plain

各出場者とも、出番の時間帯に大きくtweet数が伸びています。

..やっぱり米津玄師がばけものですね

米津玄師は、自分の出番でのtweet数も圧倒的ですが、
作曲を手がけた「打ち上げ花火(DAOKO)」と「パプリカ(幕間のFoorin)」が流れた時間帯にも大きく伸びています。

他の出場者を見ると、出番の時間帯だけでなくサブ出演・共演のあった時間帯にもtweet数が伸びていることがわかります。

例えば、
ユーミン北島三郎:サザンと共演した23:40ごろ
・ 刀剣男士:山内惠介と共演した19:40ごろ
Aqours:裏トークに出演した21:20ごろ
にそれぞれtweetが伸びています。
特にユーミンに至っては、自身の出番よりサザンとの共演時間帯の方がtweetが多くなっています。
やっぱ最後のあのシーンは印象に残りますよね。

雑なまとめ

  • 米津玄師すごい
  • 2018紅白の初出場者や共演演出はtwitterでもちゃんと話題になっていた

最後に

分析に使用したソースコードGitHubで公開しています。
github.com

今回の可視化をするにあたっては、以下の記事のソースコードを大変参考にさせていただきました。 ありがとうございます。

www.analyze-world.com

ailaby.com