プロ野球のデータをPowerBIで分析してみた(3)

今のデータ↓↓↓

得点他の順位はいらんでしょう。シーズン中の監督変更情報もいらない。
とりあえずExcelを編集していきます。

セパほしいっすね。別シートにセパマスタを作ります。
列全部コピペ→テーブル書式の設定→重複の削除をします。

セパを入力(手動)。1リーグ時代とか全くわからんすなぁ。

ここまできて1リーグ時代とかリーグ再編の絡みで旧球団名が邪魔に。
現在の球団名に統一(イーグルスの前身が近鉄というのはかなり無理があるのでそこは分けました)

よくわからんので、以下の球団情報も消しました。ゴメンネ
西日本パイレーツ、西鉄軍、大洋軍、翼軍、東京セネタース、大和軍、黒鷲軍、イーグルス、名古屋金鯱軍

すっきりすっきり。次は監督の現役時代のポジション。
投手、内野手、外野手、捕手で分類します。複数ポジションやってた選手は先に出てくる方で。
同じように列張り付けて重複を削除、入力していきます。(辛かった)

プロ野球選手出身じゃない人もいました。ポジションわからん人もいました。大昔ですが。

前のデータに張り付けるのはちょっと大変なので、改めてリストを作り直しました。例によってスプレッドシートのインポート。

んで、PowerBIでリストを取り込んで、ペタペタやってたわけですが、順位での集計方法が「カウント」しかありません。

どうも全列テキスト形式での取り込みとなっているようです。データの形式を整数にしてみます。

うん、出ましたね。

んであーだこーだやりながらやった結果が以下のような感じ。


●左上:チームによる絞り込み。選択したチームの情報のみになります。

●中上:チームを絞りこまないとあまり意味ないですが、そのチームの順位のカウントです

●右上:これもチーム絞り込まないと意味ないです。年別の順位(赤線)、防御率(黒線)、打率(棒)です。右縦の数字が順位、防御率の数字なんですが、これ上を1位にしたかった。

●左下:優勝した監督の現役ポジションでカウントしています。

●中下:監督の現役ポジションでカウントしています。

●監督別の勝利数です。

それぞれのグラフからのフィルタも可能で、例えば星野仙一を選ぶと…

それぞれのグラフで該当する項目が強調表示されます。

楽しい。色んなデータ投入して遊びたくなりました。
大したことはしてませんが設定方法はまた後日。

にしても各グラフの上のキャプションどうにか変更できませんかねぇ。