Google Professional Data Engineer 取得に向けたメモ
このページについて
GoogleのProfessional Data Engineerの資格取得へむけて勉強することにしました。
このページには、勉強した内容のメモを残そうと思います。
テキストメモ
とりあえずは下記レポジトリのREADME.mdに記載
テキスト以外のメモ
README.mdに載せられない画像とかは適宜ここに貼る
summary table for storage solutions of GCP
(from coursera)
tweet数でふりかえる2018年紅白歌合戦
2018年の紅白歌合戦、みなさんはご覧になりましたか?
私は昨年よりも面白かったと感じましたが、みなさんはどうでしたでしょうか。
実際、視聴率は昨年よりやや改善したそうです。
2018紅白の出場者ラインナップは例年以上に豪華で
・ サザン・いきものがかり・北島三郎のような大物の復活
・ 米津玄師・Suchmos・Aqoursなど約10組が初登場
など、話題に事欠きませんでした。
いよいよ今夜“平成最後の紅白”が最高のメンバーではじまります!
— NHK紅白歌合戦 (@nhk_kouhaku) December 31, 2018
【見どころタイムテーブル】を公開!是非ご活用下さい!
#NHK紅白 pic.twitter.com/8D0Vh4SyaI
また、サブ出演・共演イベントが豊富にあり、知らない人が歌っていても飽きずに見ていられた点も良かった点ではないかと感じました。
特に大トリでの桑田さんとユーミン・北島三郎の共演は、紅白でしか見られない超豪華な組み合わせでしたね!
そんな2018紅白について、放送時間中のtwitter投稿を集計・可視化してみました。
目次
準備
Twitter standard Search APIを使い、 2018紅白の放送時間である19:15 ~ 23:45に投稿されたtweetを取得しました。
- 本文やハッシュタグに「紅白」を含む
- 本文に出場者名を含む
- その際、「サザンオールスターズ」→「サザン」のような愛称を(可能な範囲で)考慮
上記の条件で計15万tweetを取得しました。
可視化
1. 出場者別 tweet数
出場者別のtweet数をシンプルに可視化してみます。
1位:米津玄師
2位:刀剣男士
3位:Aqours
4位:松任谷由美
5位:サザンオールスターズ
うん..なんというか米津玄師すげぇって感じですね
もっと出場者同士で接戦になるかと思っていたのですが、
やはりというべきか若い世代に人気の出場者のtweet数が顕著に多くなっています。
むしろそんな中でユーミンが4位、サザンが5位につけているのは大健闘と言えるかもしれません。
tweet数の上位3組は初出場組であり、この3組を見るために紅白をつけた人ももしかすると多かったのかもしれません。
※ AKBやジャニーズのtweet数が少なすぎる気もしますが、
- グループ名(例 AKB)ではなくアーティストの個人名(例 さっしー)を含むtweetは取得していない
→ グループユニットが不利 - 「紅白」を含まないtweetは取得していない
→ 「まさか〇〇が紅白に!」という意外性の高かった出場者が有利
という要因があるものと思われます。
2. 出場者別 tweet数推移
続いて、出場者別にtweet数の推移を可視化してみます。
各出場者とも、出番の時間帯に大きくtweet数が伸びています。
..やっぱり米津玄師がばけものですね
米津玄師は、自分の出番でのtweet数も圧倒的ですが、
作曲を手がけた「打ち上げ花火(DAOKO)」と「パプリカ(幕間のFoorin)」が流れた時間帯にも大きく伸びています。
他の出場者を見ると、出番の時間帯だけでなくサブ出演・共演のあった時間帯にもtweet数が伸びていることがわかります。
例えば、
・ユーミン・北島三郎:サザンと共演した23:40ごろ
・ 刀剣男士:山内惠介と共演した19:40ごろ
・ Aqours:裏トークに出演した21:20ごろ
にそれぞれtweetが伸びています。
特にユーミンに至っては、自身の出番よりサザンとの共演時間帯の方がtweetが多くなっています。
やっぱ最後のあのシーンは印象に残りますよね。
雑なまとめ
- 米津玄師すごい
- 2018紅白の初出場者や共演演出はtwitterでもちゃんと話題になっていた
最後に
分析に使用したソースコードはGitHubで公開しています。
github.com
今回の可視化をするにあたっては、以下の記事のソースコードを大変参考にさせていただきました。 ありがとうございます。