2022年 M1グランプリの分析と戦略立案

2024/04/10M1グランプリ,R,データサイエンス,データ分析の活用

こんにちは。M1コンサルタントのKです。今年もM1の季節がやってきました。

昨年書いた記事が少しだけ反響ありましたので、今年もM1の結果分析と、優勝するための戦略について考えてみようと思います。(年末でドタバタしていて、記事書くの遅くなってしまってすみません。)

昨年と同様、準決勝の採点を元に分析を行っています。準決勝に進んだコンビの決勝戦への進み方を考え、本分析におけるKGIは決勝進出とします。(とはいえ、M1全体の勝ち方として共通する事も多いとは思います。)

本記事の内容

2021年の分析の振り返り

昨年の記事にて、

・上沼恵美子の点数・評価は、あまり気にしなくてよい。
・キーパーソンは、松本人志とナイツ塙。彼らの得点を上げようとする事が重要。具体的には、 「定番の漫才で、後半にボケを増やしていく」 事が重要。オール巨人・サンド富澤 の点数も、狙う価値はある。

という事を述べていました。
これを踏まえて、昨年の考察が今年についても言えるのか、また、昨年と今年で評価基準に何か変化はあったのか、という点も分析していきます。

分析の前に

まず昨年からの変更点として、昨年の審査員に入っていたオール巨人師匠・上沼恵美子の2名がいなくなり、代わりに山田邦子・博多大吉の2名が入っていました。 山田の評価については各所で物議を醸しているそうで、今回はそちらも定量的に深堀していきます。
ちなみに、2022年のM1のキャッチコピーは、「漫才を、塗り替えろ」だったようです。

基礎分析

まずは、基礎分析です。使うデータはこちらです。

ローデータは、こちらからダウンロードしてください。

基本統計量

利用するライブラリは以下です。前もってインストールしておいてください。

library(dplyr); library(tidyverse); library(ggplot2); library(psych); library(GGally); library(reshape2)

まずは基本統計量をいくつか指定して算出してみましょう。

describe(data) %>%
  data.frame() %>% 
  dplyr::select(min, median, mean, max, range, sd)
# 実行結果
           min median  mean max range        sd
山田        84   89.0  89.3  95    11  3.772709
博多大吉    90   92.0  92.2  96     6  1.873796
ナイツ塙    88   92.0  92.0  96     8  2.708013
サンド富澤  88   92.5  92.6  97     9  2.913570
立川志らく  88   94.5  93.5  98    10  3.566822
中川家礼二  89   93.0  93.1  97     8  2.884826
松本人志    86   91.5  91.2  96    10  3.425395
合計       616  647.0 643.9 667    51 16.828877

sd(標準偏差)の列を見てあげると、山田の評価の分散が、審査員の中で最大となっている事がわかります。「標準偏差が大きい」=「その人がつける得点の分散(ばらつき)が大きい」=「その人が好きな人には高得点、嫌いな人には底得点をつける」という解釈です。
山田の評価が目立っているという事は間違いなく、彼女に嫌われると低い得点を付けられてしまうので、嫌われたくはありません。彼女の評価が妥当なもの(全体の傾向を示しているもの)である場合には、なおさらです。後ほど見ていきましょう。

ダントツで標準偏差が小さいのが、博多大吉。彼には好かれたとしてもあまり高得点はもらえず、嫌われたとしてもそこまで低得点はつけられない。そのため、彼の得点を取りに行くのはコスパが悪いです。彼の評価はそこまで気にしなくて良いのではないでしょうか。

相関の可視化

各参加者同士の相関と、合計点との相関も見て見ましょう。

ggpairs(data)

実行結果は、下記です。


合計点との相関が特に高いのは、サンド富澤と中川家礼二。次いで、立川志らく・ナイツ塙・松本人志が続く形でした。
一番右の列を見ると、各審査員と合計点との相関係数が見れます。上に記載した5名と、山田・博多大吉の2名で、合計点との相関係数に大きな差がある事がわかります。山田・博多大吉の2名は、独自の評価基準が大きいようですね。

山田邦子の採点はおかしかったのか?

早速、気になっている人が最も多いであろうトピックに注目してみます。

ここまで見た基本統計量から、山田は、「評価の分散(標準偏差)が大きい審査員であり、その評価は合計点と大きくは連動していない」という事がわかりました。この時点で、山田の評価はあまり気にしなくてよいのではないかと考えられます。この点についてさらに確証を持つために、審査員をクラスタリングしてみましょう。

昨年の分析ではk-means法を用いてクラスタリングを行いました。今回もk-means法でも良かったのですが、結果が初期値に依存してしまう事、エルボー法でのクラスタ数決定が批判されている事、クラスタ数を変化させた時の解釈がしづらい事もあるので、別の方法を試してみます。

今回は、階層クラスタリングの手法であるウォード法を用いてみます。このクラスタリング手法のメリットは、初期値に依存しない事や、クラスタがどのような順番で別れていくかをグラフから読み取る事ができるので、解釈がしやすいという点にあります。

# 合計点列は削除した後、表側に審査員をもってきて標準化。
data_clustering <-
  t(data[,-8]) %>%
  scale()
# 階層クラスタリング実行
hc <- hclust(dist(data_clustering), "ward.D2")
plot(hc)        # デンドログラムを表示示

実行すると、下図が出力されます。

この図は、上から順番にクラスタが分類されていきます。具体的には、

クラスタ数を2つにする場合は、
クラスタ1:「山田」
クラスタ2:「松本人志・立川志らく・富澤・礼二・大吉・塙」
という別れ方になり、

クラスタ数を3つにする場合は、
クラスタ1:「山田」
クラスタ2:「松本人志」
クラスタ3:「立川志らく・富澤・礼二・大吉・塙」
という別れ方になります。

クラスタ数が3つの場合は、山田だけのクラスタ、松本人志だけのクラスタが構成されます。クラスタ数は3つが適切だとすると、彼ら2人は他の審査員とは異なる評価基準をもつ審査員であり、彼らの点数を上げる事は、合計点を上げる事に直結しづらいという事になります。特に山田は縦軸の距離がかなり大きな値であり、他の審査員の評価と大きく離れている事がわかります。(松本人志は他と大きく離れているという程ではないですね。)

本節の趣旨とは少しはずれますが、せっかくなので3クラスタの場合で各クラスタの特徴を見てみましょう。

#クラスタを保存
hc.clust <- cutree(hc, 3)
# 各クラスタの標準化後の平均点を保存
score_cluster <- aggregate(data_clustering, by=list(hc.clust), FUN=mean)
score_cluster <- score_cluster[,-1]
# 標準化後の得点で、芸人ごとの審査員平均を保存
mean_score <-
  c(apply(data_clustering, 2, mean)) %>%
  data.frame()
# 3グループ分のテーブルとして作成
mean_score[,2:3] <- mean_score
colnames(mean_score) <- c(paste0("cluster",1:3))
diff <- t(score_cluster) - mean_score          #(クラスタ平均 - 全体平均)
diff
# 実行結果
                     cluster1  cluster2    cluster3
カベポスター       -1.9561190   0.4252433   -0.17009730
真空ジェシカ        1.1184656   0.1615561   -1.92624627
オズワルド         -1.6718346   0.2786391   0.27863911
ロングコートダディ -0.1909821   0.2100803    -0.85941947
さや香             -1.9278557  0.4190991    -0.16763963
男性ブランコ       -1.9159171   0.2075577    0.87812865
ダイヤモンド       -1.5491933   0.4647580   -0.77459667
ヨネダ2000         -0.5065862  0.2026345   -0.50658622
キュウ             -0.9710083  0.5119862   -1.58892269
ウエストランド     -1.3858697   0.2897728   -0.06299408

各数値は、各コンビを特徴量として標準化した値を元に、クラスタに属している審査員がつけた標準化得点の平均と全審査員の標準化得点の平均(=0)の差分を取ったもので、「そのクラスタが、審査員全体と比較として、参加者をどのように評価していたかの値」です。
正の場合は、そのクラスタが審査員全体よりもそのコンビの事を高く評価している事になり、負の場合は逆の解釈です。値の絶対値が大きい程、全体平均との乖離が大きい事になります。

クラスタ1(山田)は、他の審査員と比較した時に、カベポスター・さや香・男性ブランコの評価が低いです。ほぼすべての値が負になっており、基本的には厳しめの評価を付けますが、真空ジェシカにだけは高得点を付けている事がわかります。
クラスタ2(松本人志)は、他の審査員と比較した時に、キュウ・ダイヤモンド・カベポスターを、高く評価しています。他のコンビも含めてすべての値が正になっているので、全体的に高得点を付けやすいクラスタである事がわかります。
クラスタ3(立川志らく・富澤・礼二・大吉・塙)は、他の審査員と比較した時に、真空ジェシカ・キュウの評価が低いです。高く評価しているのは、男性ブランコやオズワルドでした。このクラスタだけサンプル数が多いので当然ではありますが、正負どちらも値がでており、コンビ間の評価がばらけているクラスタになります。

少し話がそれましたが、本節の結論として山田の評価傾向・対策として言える事は、

合計点との相関は大きくないし、評価傾向も全体と離れている
・山田の評価は、ばらつきが大きいので目立ったが、あまり気にしなくて良い。山田の中では特に評価が高かった訳ではないさや香も、決勝ステージに進んでいる。
・他の審査員の評価がすごく高いコンビについて山田が低得点を出している事はなく、お笑いは一定わかっていそう。なので、嫌われて極端に低い点数をつけられる事も気にしなくて良い。(他の審査員に評価される事ができれば、自然と山田の低得点は避けられる。)

という形になります。評価は少し他の審査員と異なる部分はありますが、全体に悪影響を与える程ではないので、気にしなくて良いです。

キーパーソンは誰?

これまでの分析で、山田・博多大吉・松本人志の評価はあまり気にしなくて良いと結論付けました。
では、誰の評価を狙いに行くのがよいのでしょうか。

まず合計点との相関で言うと、サンド富澤中川家礼二の2人の相関が大きく、合計点と連動している傾向がありました。また、先程のクラスタリングでも、この2人は最も類似度が高い2人に位置付けられていました。

この2人の評価は、合計点と連動している2指標であり、この2指標も近い動きをしている。本分析における決勝進出というKGIに対して、適切なKPIになると考えました。
本分析では、キーパーソンをサンド富澤中川家礼二の2名と結論付け、彼らのコメントを元に今後の戦略を検討していきます。

採点の傾向は、昨年から変わったのか?

昨年の私の分析では、「定番の漫才で、後半にボケを増やしていく」事が重要だと結論づけていました。今年は、そのような漫才は評価されていたのでしょうか? また、傾向が変わったとすると、どんな漫才が評価をされていたのでしょうか?
本節ではそれを、キーパーソンとしたサンド富澤中川家礼二の発言を元にひも解いていきます。彼らの発言をほぼすべてまとめた上で、特徴的だったものを抽出しています。(参考として、昨年の分析において重要審査員と結論付けた松本人志・ナイツ塙の2名の今年の発言も載せています。)

サンド富澤中川家礼二松本人志・ナイツ塙
・構成がすばらしい。
・つかみから全部面白い。
・前半少し緊張していていつもと違った。
・王道でここまで爆発するのがすごい。
・最後に大きな笑いがもう1つあればあと1,2点プラスだった。
・前半が暗かった。最初から後半のような感じだったらもっと評価が高かった。
・掛け合いのある素晴らしい漫才。
・ハマる所とそうでない所が極端すぎた。
(松本人志)
・ボケに対するツッコミの声が大きくてバランスが良くない。
・スロースタートだけど後半ちゃんと取り戻す。
(ナイツ塙)
・強いボケが最初にもう一個あったらもう少し伸びたかも。

基本的には左の2列を見て頂ければよいのですが、やはり、「後半にボケが多くあって盛り上がる」という事は大事そうです。昨年から今年にかけて、採点の傾向は変わっていないでしょう。一方で、定番で後半にボケがあるというだけでは良くなさそうな事も伺えます。前半にも大きめの笑いがある事、掛け合いがあって笑いを取れている事も重要そうです。

最終決戦に進んだ、さや香やウエストランドは、「コンスタントに笑いを取りつつ、大きな笑いも前後半でしっかりと用意している」点が評価されていたのではないでしょうか。

まとめと戦略

本記事についてまとめます。

山田の評価は、合計点との相関は大きくなく、評価傾向も全体と離れていて、他の審査員と評価基準が異なっている。他の審査員も評価の高いコンビに低得点を付ける事はないので、彼女の評価は気にしなくて良い。

博多大吉は、嫌われても極端に低い点数にならないので、気にしなくて良い。

・キーとなる審査員は、サンド富澤中川家礼二。彼らの評価をもらう事が合計点を上げる事に繋がる。そのためには、「定番の漫才で、後半にボケを増やしていく」だけではなく、「コンスタントに笑いを取りつつ、大きな笑いを前後半でしっかりと用意している」事が重要。ちょっと条件多すぎるかな、、

今後の課題

今回は、審査員を攻略するための分析になりましたが、参加している芸人側を類型化するような分析もやってみたいと思いました。その際の変数は審査員の評価だけでは足りなそうなので、ボケの数・位置も変数として落とし込んだ方が良さそうです。

また、昨年の分析ではキーパーソンとして挙げていた松本人志・ナイツ塙が、今回の分析ではキーパーソンとして出てきませんでした。時系列性も加味したような分析をしてみたいと思う今日この頃です。

他にも数理的に検証して欲しい疑問などあれば、時間のある時に考えてみますので、是非コメントを頂けたら嬉しいです。

最後に、本記事ではM1コンサルタントとして偉そうに戦略を語っているだけになってしまっているので、来年は僕もエントリーして、口だけではない事を証明し、自身として分析の実験台になりたいです。

追記

M1の分析は毎年やってます。こちらから見てみてください。