レポート

アナリストレポート第23回
「自然言語処理を活用した野球の記事生成~AIと人間によるコンテンツ作り~」

2020年10月29日 野球

 データスタジアムでは、失点抑止に最適な球種・コースを提示するAIプロ野球週間先発予想、Baseball LABの「今日のプロ野球結果予想」で使用されている試合勝敗予想ツールなどをはじめ、さまざまなAIが稼働しています。

 前回のアナリストレポートでは「戦評を自動生成するAI」(以下、自動生成AI)の開発を成功させた秘訣についてお話ししました。今回はこの自動生成AIがどのように戦評を生成しているのかについてご紹介いたします。

■これまでの戦評の分析

 まずは、これまでに手作業で作成された戦評の分析を行いました。戦評は主に以下の4つの項目によって構成されています。

1.チームがどのように勝利したか
2.勝利に貢献した打者の打席結果
3.勝利に貢献した投手の成績
4.敗戦チームに関する記述

 自動生成AIは、これらの4項目についてそれぞれ生成を行い、編集およびチェック担当者へ渡す作業を担います。

■戦評生成の方針

 戦評はすべてルールベースに従って生成することとしました。これは、

1.当社がこれまで作成した戦評を大量に[1]保有していること
2.記述する出来事、野球の専門用語などを誤りなく生成すること

などが理由として挙げられます。

 戦評を自動生成するというタスクに取り掛かるにあたり、自然言語処理[2]分野における文章要約技術に着目しました。

 要約の作成には、主に以下の2つの方針が挙げられます。

1.抽出型:対象の文章から重要と思われる文や単語を抜き出す
2.抽象型:文章の意図を理解して抽象化した(別の)単語を用いて文をつくる

 これを野球に置き換え、試合中のすべての打席結果を要約の対象とする文章として捉えると、以下のように表現できます。

1.抽出型:試合結果に影響を与えたと考えられる打席結果を抜き出す
勝利のためには点を取ることが求められるため、「本塁打」や「適時打」といった得点シーンの打席結果が挙げられます。

2.抽象型:一連の試合の流れを理解して打席結果にない言葉を用いて文をつくる
得点の推移から表現できる「逆転」「勝ち越し」のような言葉や、その打席の得点によって勝利したときの「サヨナラ勝ち」などが挙げられます。

 ルールベースはこの2つの方針をもとに作成します。その際、「逆転」「勝ち越し」のような、普段人間が試合を見ている際に何げなく理解・表現している言葉もすべてルール化していきます[3]。戦評を生成する際には、すべての語句がルールに合致していることを確認します。この「語句が使用可能であることを確認する作業」は、これまでの人間の戦評作成作業においても重要で正確性が求められるものであり、自動生成によって大きく手間が省けた箇所の一つです。

■AIと人間の担当領域

 このようなアプローチを経て生成した戦評は、人間が編集およびチェックを行いファンのみなさまの元へ配信しています。

 先述したルールを用いて自動生成を行う際、実際に配信しているものよりも少し多めに文を生成するようにしています。これは、ルールを満たすいくつかの出来事のうち、自動生成AIがどれを記述するか、データから判断することが難しい場合があるためです。編集者はこうした場合で出来事を選択する役割のほか、文章同士の繋がりや規定の文字数に合わせた表現の変更の部分を担当しています。

 このように、人間の手を全く加えずに配信可能な戦評を生成することはまだまだ難しいものの、全体を通してみると1試合の戦評作成にかかる時間がおおよそ半分になるなどの効果が得られました。

■最後に

 今回は、

-手作業で作成されていた戦評の分析
-自動生成AIに戦評を生成させるための方針
-配信可能な戦評にするための人間の役割

についてご紹介いたしました。

 また、その結果、戦評作成作業にかかるコストが削減できたことをお話ししてきました。最後に、この開発を通して感じたことをお伝えしたいと思います。

 先述したルール作りの際には、これまで実際に戦評の執筆作業を手掛けていた担当者と何度もディスカッションを行いました。表現ごとに重要視しているデータを調査し、感覚的に使っていた表現を、データをもとに表現できるようにしていきました。そして生成した文を評価する作業を繰り返したことで、満足のいくものが生成できるようになったと感じています。

 こうした作業に協力していただいた担当者の皆さんに感謝すると同時に、今回のアナリストレポートを通して一人でも多くの方にAIを活用したスポーツのコンテンツ作りに興味をもっていただければ幸いです。

[1] 今回の自動生成AIには約3000試合分(約3年分)の戦評データを使用した。
[2] 日本語や英語など、人間が日常的に用いる言語(自然言語)をコンピュータに処理させる一連の技術。活用例として予測変換、機械翻訳などが挙げられる。
[3] 「逆転」の場合、「記述チームの攻撃回開始時にビハインド、かつ攻撃回終了時にリードである」と条件付けを行う。

最新記事

スポーツのコンテンツや見せ方でお困りの方、
チーム強化でお悩みの方、一緒に解決いたします。
ぜひ一度ご相談ください。

お問い合せ

アナリストトップ アナリスト紹介 レポート 育成講座

  • 採用情報
  • おしらせ
  • 掲載事例

ページトップヘ