“歌詞が似てる歌手”を可視化する! ヤフーの「アーティストクラスタリングチャート」で遊んでみた

難しそうなビッグデータの世界がちょっと身近になる感じ。

「Yahoo! JAPANビッグデータレポート」が、16万曲分の歌詞データをもとに国内アーティストの類似性を可視化したツール「アーティストクラスタリングチャート」と、その解説記事を公開しました。

このツールは、ヤフーが共同運営する「GYAO!」の歌詞サービスで提供される歌詞を解析。各アーティストの歌詞に含まれる特徴的な単語を抽出して、約500アーティスト間の類似性・関連性をマッピングするというもの。特徴的な単語というのは、たとえば歌詞における一人称・二人称のパターンなどを分析したりします。

歌詞から抽出された一人称・二人称の組み合わせパターンをランキング化したもの。(上記の解説記事中に掲載)
歌詞から抽出された一人称・二人称の組み合わせパターンをランキング化したもの。(上記の解説記事中に掲載)

歌詞の中で頻出するワードをたくさん集めていくと、歌詞が似ているアーティストが見えてきます。データ上で歌詞が近いアーティストを並べ、それを大きな輪のビジュアルにしたのが「アーティストクラスタリングチャート」。

160906_bigdata_12b
歌詞によるアーティスト類似ビジュアライズ「Artist Clustering」