MarMen

海をこよなく愛する大学生のかくブログです。

Twitterの#ハッシュタグ解析が面白い!!!#okinawa編

hashtag

はいさい!

なかなかブログのネタが思いつかず1年ぶりに書いています。

久しぶりすぎてなかなかすらすら書けない.......

 

前と変わらず、バイト・大学・サークルの毎日です

けど空いている時間は前と比べてだいぶ増えたので、またなにか

新しいことにチャレンジしたいと思っています。体動かす系のなにか!

 

時間がないのでやりたいときにできるような仕事を探すためにランサーズを眺めていると、「instagram自動投稿」や「メルカリ自動出品」,「Twitter 作業 代行」などの仕事がたくさんあることに気づきました。単価としてはやすいですが、チリも積もれば山となるです。

 

Pythonをずっと勉強していたので、このくらいPythonにやらせたらいいんじゃないかと思って作ってみようと思いました。

 

TwitterAPIがあって簡単そうだったので、やってみました。

tweepyをつかえばTwitterでの作業は全部できる!

tweepyの使い方はいろんなサイトで紹介されていて、思い出せないくらい探し回ったのでどのサイトが参考になったかは割愛します。

 

仕事の内容に必要なのは、特定のワードに関するツイートをしたアカウントのフォローワー数を獲得しある一定以上のフォローワー数がいるアカウントをリストにすること。

 

.followers_countと.searchを使えばすぐできました。ツイートを調べて、フォローワー数を獲得、if文を用いて条件分岐でさいごにIDとフォローワー数をエクセルに書き込んで終わり!

プログラムを動かせば、10秒もかからずできちゃいます。一件100円ちょっとなので、2分もあれば1000円稼げる!

 

他にもいろんなことができるらしくて、前からやってみたかったハッシュタグ解析をやってみました。

#okinawa,#tripを検索して、この2つのハッシュタグが付いているツイートにはほかにどんなハッシュタグが付いているか調べてみました。

 

.searchで調べて、2つのハッシュタグが付いているツイートの本文をすべて取得。そのツイートをpythonの文字列操作で「#」と半角スペースで囲まれている単語をリストに追加していく

 

ちなみにtweepyは調べれるツイートの数が限られているそうですが、ツイートのIDを操作したらそれよりもたくさん調べることができました。

それとステマや夜系のツイートは取得したくなかったので、検索の時点で省きました。

 

そしてCounterを使って、それぞれの単語がどれだけ出てきたかを調べる。

最後に可視化をしたかったので、WordCloudを使って画像にしてみました。

f:id:divertidoarticulo:20190625023254p:plain

なかなかいい感じにできましたが、ここで気づいたことは、「okinawa」や「沖縄」、「trip」、「旅行」などがり、検索語があってもあまり意味がないので、それらの単語を消したバージョンも作ってみました。

f:id:divertidoarticulo:20190625023524p:plain

結構いろんな単語がハッシュタグとしてつけられているようです。

玉泉洞」や「ひめゆりの塔」、「ビーチ」、「おきなわワールド」わかるとして

「しむじょう」、「むーむー」、「バンドゥビキニ」など全く意味わからない単語もあります。

6月なので、「梅雨」や「rain」などがあったり、前に記事にも書いた6・23の慰霊の日があったので「ひめゆりの塔」が入ってきているのかなーって感じです。

 

ちなみに知らない単語を調べてみました。

 

しむじょう・・・

沖縄そばやじゅーしー、じーまみーなどで有名な首里にあるご飯やさんらしいです

むーむー・・・

ハワイの女性の正装とされているゆったりしたドレスらしい。結婚式の正装とかに使われているのかなー

 


沖縄生まれのムームードレス、フレンチスリーブでゆったり着れます!赤地に白のハイビスカスfr05

 バンドゥビキニ・・・

ビキニの種類らしい。ビキニはビキニじゃないんだ......

 


OD企画 ビキニ 水着 体型カバー レディース バンドゥビキニ タンキニ 3点セット 大きいサイズ セパレート 水泳 海水浴 かわいい おしゃれ 温泉 セクシー

 知らない単語がでてきて、新しく知れるから楽しい!

 

今回はWordCloudを使って可視化しましたが、グラフなどを使って得られたデータを解析してみたいです。

 

「インスタ自動投稿」と「メルカリ自動出品」はすでにつくったので、近いうちに記事に書きたいと思います。

自分の中では、Twitterよりインスタのほうが若い人がたくさんしていて、ハッシュタグをたくさんつける感覚なのでインスタのハッシュタグ解析もしてみたいと思います。

 

そんなとこで今日はこの辺で!

今日の締めの言葉は、

「退屈なことはPythonにやらせよう」です!

 


退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング