食べログ百名店データから探る都道府県の得意料理

2024年1月6日データサイエンス,データ分析の活用,統計

「〇〇系は九州がうまい」「△△系なら北海道」といった具合で、いろんな都道府県で名物料理として広く知られている料理ジャンルがあると思います。それは地理的な特性を活かした産業に関連するものであったり、単純に最初に作ったのがその地域だったりと、さまざまな理由があると思います。

一方で、実は名産を持っているのにうまく認知させられてなかったり、名産と言わずとも美味しい店をたくさん抱えている都道府県があるはずではないでしょうか。

単純に、高い評価がされている店を探す情報源として食べログ百名店なるものがあります。

食べログユーザーから高い評価を集めた100店を、さまざまなジャンルごとに発表するグルメアワードです

https://award.tabelog.com/hyakumeiten

食べログは会社ページに書かれている通り、2023年8月時点でレストラン掲載数約85万、月間利用者数約9,139万人と圧倒的な数字を誇り、得点計算も不正対処やユーザ情報による重み付けなどを行なっているため、これが主張する「百名店」はそこそこ信頼できそうです。

そうであれば、百名店に掲載されている店の種類と数で地域ごとの名物料理(得意料理)を推測することも合理的ではないでしょうか。

しかし、単純に掲載数で得意料理であるかどうかを判断する場合、人口が多い地域が有利になり、人口が少ない地域を過小評価してしまいます。逆に、掲載数が少なくても人口が少なければ、「地理的に有利」「伝統がある」「観光地になっている」など、「得意」という言葉に沿うような状況であることが考えられます。

ということで、この記事では「ある都道府県における人口100万人あたりの食べログ百名店掲載数」をその都道府県の得意料理スコアと考え、隠れた得意料理を持っている都道府県を探っていこうと思います。

データについて

食べログ百名店では、料理ジャンルごとに高評価100店が集められていますが、ジャンル内の店の数が多ければEAST、WEST、東京それぞれ別にトップ100が掲載されています。この集計方法的に東京は他よりも多くの店が掲載されることになります。ジャンルはイタリアン、フレンチ、蕎麦など、食べログ側で設定された28種類です。データ収集に関しては「Pythonによるスクレイピング&機械学習 開発テクニック」を参考にしました。

都道府県&ジャンルごとの掲載数を確認

まず、単純に都道府県ごとに何軒くらいの百名店が掲載されているのかをみてみます。

図は「密度、箱ひげ図、サンプル点を見やすいように縦にばらつかせたもの」を同時にプロットしたものです。右にある異常な外れ値は東京で、大体の都道府県の掲載数が120以下くらいなのがわかります。

次に、都道府県&ジャンルごとの掲載数の棒グラフと、合計掲載数を地図上にマッピングした図をみてみます。

東京、大阪がが多すぎて他が潰れてしまっています。一旦みやすくするためにこの二つを除いて同じ図を表示してみます。

だいぶみやすくなりました。棒グラフをみると、香川のうどん、広島のお好み焼きが一際目立ちますね。

合計掲載数でいうと、愛知、神奈川、京都、兵庫が特に多く、逆に四国地方、中国地方は少し寂しいように見えます。また、一応全ての都道府県が最低1つは百名店を持っていることがわかります。

次に、人口を考慮するため「100万人あたりの掲載数」に変換した数字を使って、合計掲載数の棒グラフと地図を図示します。人口データはこちらのサイトを参考にしました。

こうすると東京を入れても他が潰れてしまうということもなくなり、みやすくなりました。

依然として東京、大阪、京都などは合計掲載数が多いですが、特に京都は100万人あたりで考えると大阪よりも多いということがわかります。また、今まででは見えてこなかった宮崎、秋田、石川、徳島が急上昇していることがわかります。そして、香川県は圧倒的うどん力により、人口を加味すると日本でもトップレベルの掲載数を誇ることになります。この時点で、少なくとも「香川といえばうどん」は名実ともに間違いなさそうです。

ジャンル別掲載数ランキングと地域の得意料理

単純に掲載数でランキングを作るとこんな感じになります。東京は集計方法的にひいきされているので除き、ジャンルは個人的に関心が強いものを選んでいます。ちなみに同着があれば順位を上に詰めてます。

ジャンル1位2位3位
焼肉大阪(37)愛知(28)兵庫(13)
うなぎ愛知、静岡(10)福岡、千葉(5)宮崎(5)
寿司北海道(30)福岡、大阪(26)愛知(21)
焼き鳥大阪(33)兵庫(15)福岡(12)
餃子兵庫(11)静岡(7)福岡(6)
とんかつ大阪、千葉(8)愛知(6)神奈川(5)
お好み焼き広島(26)大阪(20)兵庫(14)
そば大阪、長野(7)神奈川(5)静岡(4)
うどん香川(52)大阪(36)埼玉(20)
ステーキ・鉄板焼き兵庫(11)大阪(8)愛知(5)
フレンチ大阪(33)愛知(30)神奈川(17)
イタリアン愛知(33)大阪(21)神奈川(18)
ピザ神奈川(7)千葉、大阪(6)兵庫(5)
中国料理神奈川、大阪(29)兵庫(22)愛知(17)

やはり全体的に人口が多いところが上位に入りがちです。一方で、長野(そば)、広島(お好み焼き)、香川(うどん)、宮崎(うなぎ)など、人口がそれほど多くない地域でも有名なものだと掲載数も多いです。個人的には、「餃子」に栃木が入っていないのが意外でした。

では、この記事において地域の得意料理スコアを測る指標としてメインに使う「掲載数/100万人」で、東京こみでランキングを作り直してみます。小数点第一位までで順位を見てるので、↑と同様に同着は上に詰めてます。

ジャンル1位2位3位
焼肉宮崎(7.6)秋田(7.5)東京(7.1)
うなぎ宮崎(4.8)高知(3)静岡(2.8)
寿司石川(8.1)東京(7.1)秋田(6.5)
焼き鳥徳島(7.1)宮崎(5.7)東京(4.3)
餃子東京(3.4)栃木(3.1)高知(3)
とんかつ山梨、東京(2.5)鹿児島、千葉(1.3)京都、熊本(1.2)
お好み焼き広島(9.4)徳島(4.3)愛媛(3.1)
そば長野(3.5)島根(3)福井(2.7)
うどん香川(55.7)山梨(6.2)大阪(4.1)
ステーキ・鉄板焼き宮崎(3.8)佐賀(3.7)東京(2.5)
フレンチ東京(7.1)石川(5.4)京都(4.7)
イタリアン東京(7.1)京都、宮崎(6.7)秋田(6.5)
ピザ東京(2.4)群馬(2.1)宮崎(1.9)
中国料理東京(7.1)京都(5.5)徳島(4.3)

人口を加味すると一気に多様な地域が出てきました。香川のうどん力は異常であることがわかります。栃木も無事餃子で存在感を出せました。

また、宮崎があらゆるジャンルで登場していることがわかります。ジャンルは焼肉、うなぎ、焼き鳥、ステーキ・鉄板焼き、イタリアン、ピザと、「和食+イタリアン」といった具合です。特に焼肉、うなぎ、ステーキ・鉄板焼きは1位で、これは宮崎牛とうなぎ漁獲量が多いことが原因かと思います(うなぎ漁獲量全国1位の鹿児島がいないのが残念ですが)。意外なのはイタリアンとピザですね。聞いたこともありませんし、理由もよくわかりませんので、

隠れ得意料理1:宮崎のイタリアン、ピザ

とします。

次に徳島も色々と登場していることがわかります。焼き鳥1位をはじめ、お好み焼き、中国料理にも載っています。調べたところ、焼き鳥に関しては「阿波尾鶏」なる有名なブランド鶏があるようで、その影響かもしれません。ただ、他にも有名なブランド鶏をもつ地域がある中で、なぜ徳島が突出しているのかはわかりません。

お好み焼き、中国料理に関しては全くわかりません、特に中国料理は横浜中華街、元町中華街などを差し置いてランクイン。ということで、

隠れ得意料理2:徳島の焼き鳥、お好み焼き、中国料理

です。

あとは雑に、ぱっと見以外だったら列挙していく形式でまとめると以下の通りです。

隠れ得意料理3:高知のうなぎ

隠れ得意料理4:東京の餃子

隠れ得意料理5:秋田のイタリアン

隠れ得意料理6:群馬のピザ

以上、隠れ得意料理を列挙してみました。得意料理に限定せずとも、人数あたりの百名店掲載数が多い宮崎、秋田、石川、徳島あたりは、食に関して強く根付いた何かがあるのかもしれません。旅行の際はこれを参考にしてみようと思います。

おまけ:地理的に近ければ得意料理は似る?

「地理的に有利」みたいなのがあれば、得意料理パターンは場所が近ければ似るのではないかと思い、得意料理スコア(掲載数/100万人)でクラスタリングしてみました。

全ジャンルでクラスタリング

階層的クラスタリングにより地域をグルーピングします。クラスタリングとは、ある距離基準のもとで変数(今回でいえばジャンルごとの掲載数/人)が似ているサンプル(都道府県)を同じグループ(クラスタ)にまとめる手法です。

全ジャンルを使い、階層的クラスタリングを行った結果が次の図です。

適当にクラスタ間の距離が長そうな部分(13くらい)で切ってクラスタ数を4としました。ここで非常に注意なのが、デンドログラムの色と地図の色は対応していないため、場所を見てどのクラスタか判断してください(技術的にちょっと面倒だった)。

それぞれのクラスターの特徴を探るため、クラスタ別にジャンルごとの掲載数/100万人の平均値を見てみます。

クラスタ1:「なんでもある場所」、クラスタ2:「平均的地域」、クラスタ3:「隠れグルメ地域(宮崎&徳島)」、クラスタ4:「有名なグルメ地域」といった感じでグループ分けになりました。残念ながら地理的に近ければどうということは何も言えなそうです。

ジャンルを絞ってクラスタリング

↑の結果を踏まえ、ランキングに載せたジャンルに絞って再度クラスタリングをやってみます。

相変わらずクラスタを決める閾値は適当ですが、香川が孤立し、東京都宮崎がくっつきました。また、岐阜、長野、福井などからなる不思議なクラスタも形成されています。ジャンルごとの平均値を見てみましょう。

うどんが突出してるせいで見ずらかったので、右図ではうどんのみ削除しています。簡単な例として以下のような解釈ができるかと思います。

クラスタ1(長野、福井、岐阜など):そばクラスタ。その他はパッとしないが、長野-岐阜-福井がつながっているため、そば名店巡りができそう。

クラスタ2(大多数):平均的な地域で、半分くらいがこのクラスタに所属。

クラスタ3(東京、宮崎):トップレベルグルメクラスタ。上記のジャンルならなんでもあり、得意料理と言えるジャンルも多数存在。

クラスタ4(大阪、京都、兵庫、徳島):万能グルメクラスタ。クラスタ3のちょいしょぼい版みたいな感じ(あくまで人口あたりで考えると)。

クラスタ5(北海道、石川、福岡など):名産クラスタ。すでに広く知られている名産や料理が存在する。

クラスタ6(香川):圧倒的うどん県。その噂は伊達じゃなかった。

そばに関しては地理的に似ている部分もありましたが、全体としては微妙な感じです。あとは皆様の知見をいかし、好きなように解釈していけばいいと思います。

Follow me!