【結果編】推しのTwitterをテキストマイニングしてみた

外出自粛期間に推しTwitterテキストマイニングしてみましたので、【結果編】と【準備編】にわけて、紹介します。こちらは【結果編】です。

目次

Word Cloudで可視化してみた

RからTwitter APIを叩き、わーすた小玉梨々華さんのツイートをWord Cloudを使って可視化してみました。※Word Cloudでは頻出する単語ほど大きな文字で表示されます。

f:id:NURUME:20200624153122p:plain

小玉梨々華さんは「わーすた」というグループに所属していることもあり、伸ばし棒の「ー」がめちゃめちゃ突出して頻出してますね。

ファンとしては「アイス」「焼肉」「チョコ」などの食べ物系のワードが小玉さんっぽくて微笑ましい感じですね(笑)

※詳細は準備編に記載しますが、今回のWord Cloud可視化では「名詞」かつ「非独立でないもの」のみ取り出して可視化してます。また、抽出対象は2020年6月23日時点のすべてのツイート(3011件)としました。

品詞ごとにグラフ化してみた

品詞ごとに上位25位をグラフ化してみました。

  • 名詞をグラフ化

f:id:NURUME:20200624154431p:plain

伸ばし棒の「ー」以外だと「今日」「みんな」「ライブ」が上位でした。

ちなみに下から5番目の「しっぷ」というのは、いわゆる「湿布」の事ではなくて、わーすたのファンのことを「わーしっぷ」と呼ぶのですが、形態素解析時にMeCabがぶっちぎったせいで分離してますね。

  • 動詞をグラフ化

f:id:NURUME:20200624155553p:plain

4位の「食べる」に注目です!以上。

f:id:NURUME:20200624155849p:plain

ありがとう」が1位なのが嬉しいですね。この言葉はツイッターの中だけじゃなくて、ライブ、握手会、ブログ、番組などでもよく耳にする言葉で、ファンとしては「こちらこそありがとう」という感じなのですが、きちんと言葉にして伝えてくれるのはやっぱり嬉しいですね。

ちなみに、わーすたには「スーパーありがとう」という名曲がありますので、ついでに宣伝しておきます(笑) 

www.youtube.com

実施環境、所要時間

素人が適当にネットを見ながらテキストマイニングしてみたのですが、なかなか楽しい経験ができました。

もし、これからテキストマイニングをはじめてみたいという方がいらっしゃったら、まずは自分の興味のあるものを分析してみるのがいいかと思います。私のようにTwitterを分析してみてもいいですし、文学に興味があるなら著作権切れのテキストを分析してみるのもいいと思います。

参考程度に、今回の実施環境、所要時間、私のスペック等をメモ程度に記載しておきます。

  • 実施環境

iMac (27-inch, Late 2012)10.15.5・・・ちょっと古い、そろそろ買い替えたいです
macOS Catalina 10.15.5
R 4.0.1・・・pythonの方が流行りだと思いますが、過去にRっぽいものをつかってたのでこちらにしました
RStudio 1.3.959

MeCab 0.996

  • 所要時間

全部で3〜4日くらいかかりました。

テキストマイニングの手法をネットで調べるのに半日くらい。R、Rstudioのインストール、TwitterAPIの申請が半日くらい。RMeCabのインストール、ライブラリのインストール(ここでつまづいて結構時間がかかりました)、初回抽出までが1日くらい。抽出と分析の繰り返しで1〜2日くらいです。

  • 私のスペック

SE経験ありですが、コードはあまり書いたことは無いです。Linuxはちょっとだけ触ったことはある程度ですが、Rに類似したソフトの経験はありました(離散選択分析系のソフトウェア)。それほどプログラミング経験があるわけじゃなかったですが、なんとか形にはなりました。ただ、テキストマイニング系は正しく量産しながら効率的に分析するには、NGワード集の作成等のチューニングが一番の肝かつ時間がかかるところだと聞いてます。大変そうですよね。

自分でコードを書くのが難しい、だるいよーって人は以下のサービス「whotwi」でもTwitterを分析できますので、まずは試してみるといいかもです。自分の好きなアイドルさんやタレントさんのTwitterを分析してみると意外な発見があって面白いですよ!

ja.whotwi.com

最後に(わーすたの紹介)

  • わーすたの紹介

今回、テキストマイニングの対象とさせて頂いた小玉梨々華さんの所属するわーすたの紹介をさせてください。以下、公式HPからの引用です。

アーティスト名:「わーすた」(ざ・わーるど・すたんだーど)
英語表記:「The World Standard」
2015年に結成のデジタルネイティブ世代アイドル。
グループ名は「The World Standard」の略でメンバーは英語、スペイン語、中国語などの語学を勉強している。
現在まで、11か国の国でライブ出演するなど世界に照準を合わせ活動している。

wa-suta.world

わーすたavex所属のアイドルで、特徴としては、海外でのお仕事だったり、海外のファンが多いってことが挙げられます。また、ライブがスマホでの動画・写真撮影OKで、ファンによるライブ動画がたくさんアップロードされているのも特徴です。私もわーすたのファンになるまでは、アイドルを応援したことがなかったのですが、ライブ動画を沢山見ているうちに、ライブに行きたくなって、実際ライブに行ったら外国人の友だちができたりして、今ではオタクとして楽しい日々をすごしています。

最後に、推しの小玉梨々華さんの紹介を少しさせてください。

f:id:tws_kujirano:20200626144027j:plain

【名前】
小玉梨々華(こだまりりか)
【カラー】
パステルブルー
【誕生日】
2000年10月1日
【血液型】
A
【出身】
北海道
【身長】
161cm
【趣味】
アイスを食べる
【特技】
おえかき
【好きなアーティスト】
back number

2020年6月末日現在の写真とプロフィールですが、写真の衣装に「ありがとう」って書いてありまして、これが今回の感動詞の分析結果の最頻出ワードと一致していたので、嬉しかったですね!小玉さんには隠された特技がありまして、画伯と呼ばれているのですが、とっても素敵な絵をお描きになられるので、ぜひ検索してみてください!