カルチャー

2024/06/28

データサイエンティストの祭典を開催!
機械学習の腕を競う社内コンペで交流を活発化

データサイエンティストの祭典を開催!<br />機械学習の腕を競う社内コンペで交流を活発化

ビジネスの進化には欠かせないデータの利活用とそれを支えるデータ分析・機械学習。KDDIには、その専門知識を持ったデータサイエンティストたちが集ういくつもの社内コミュニティがあります。2024年3月1日には、コミュニティを超えた交流を目的とした「KDDI Data Summit 2024」を開催。データ分析の腕を競い合うコンペティションが行われ、データサイエンティストたちの活躍にスポットライトが当てられました。

目次

■インタビュイー略歴


三宅 祥徳

三宅 祥徳

経営戦略本部 Data&AIセンター データ統括グループ
「KDDI Data Summit 2024」の企画担当。
美嶋 勇太朗

美嶋 勇太朗

コア技術統括本部 情報セキュリティ本部 SSIRT部 DX推進グループ
社内コミュニティ「KgK」のリーダー。「KDDI Data Summit 2024」ではデータ分析コンペの設計および運営を担当。

コミュニティを超えた交流イベントを年に1回開催

三宅さん

KDDIのデータ利活用の現状と「KDDI Data Summit 2024」開催の経緯を教えてください。

美嶋:まず、KDDIでは幅広いサービスの意思決定にデータ分析・機械学習を取り入れています。例えば、携帯電話のネットワークを構築する機器に障害・異常が生じた際に、トラフィック量などのパフォーマンスデータを用いてAIが異常を検知しており、障害の大規模化を防いでいます。データ分析・機械学習の重要性は日々高まっており、その領域を担うデータサイエンティストの活躍の場も広がっているのです。

三宅:KDDIでは、大小さまざまな社内コミュニティが存在しています。データサイエンティストたちが参加するコミュニティも通常はそれぞれで活動していますが、コミュニティ間で交流し、ノウハウや意見の交換をしながら、その素晴らしさを社員に伝えようという気運が高まり、全社イベントとして2023年に「KDDI Data Summit」(以下、サミット)がスタートしました。2024年のサミットは4つのデータ分析コミュニティが中心となって3月1日に開催され、KDDIグループ会社を含めた約500名の社員が参加しました。

サミットの中でデータ分析コンペを実施した経緯を教えてください。

三宅:サミットでは、データサイエンティストにとってホットなトピックである「データ分析コンペ」「生成AI」「BIツール」の3テーマについて発表および交流が行われました。

2023年のサミットではデータ分析の初学者をターゲットとした発表を行い、参加者が1,000人を超えるほどの大盛況となりました。KDDIではジョブ型人事制度を導入し、データサイエンティスト領域の人材を積極的に採用しており、また、データ分析のコミュニティ活動も活発化している環境下にあります。そこから、KDDIグループ内のデータサイエンティストが腕を競い合う祭典を開催したら面白いのではという発想が生まれ、2024年は上級者も楽しめるイベントとしてデータ分析コンペを開催する運びとなりました。

そこで、社内でKaggleを活用したデータ分析コンペの開催実績があるコミュニティ「KDDI Group Kagglers」(以下、KgK)にコンペの設計から実施、審査までをオーガナイズしてほしいとKgKのリーダーである美嶋さんに依頼したのです。

世界的なプラットフォーム“Kaggle”を舞台に社内コンペを実施

三嶋さん

Kaggle とKgKの活動内容について教えてください。

美嶋:Kaggle は、データサイエンスや機械学習に関心を持つ人々が集まるデータ分析コンペティションのプラットフォームです。異なる題材のコンペが随時開催されており、コンペによっては世界から数千チームが参加することがあります。一方で、データ分析のナレッジやデータセットの共有、分析に関する高度な作業環境の提供なども行われており、データサイエンティストにとっては極めて有用なプラットフォームです。

KgKは、Kaggleをはじめとするデータ分析コンペに関心のある社員が集まるコミュニティです。現在、KDDIとグループ会社から約200名が参加し、コンペ参加報告会やコンペ関連記事の紹介などを行う隔週の定例会に加え、2022年から社内コンペを継続して実施しています。社内コンペ開催の意図は、データ分析の業務に携わっていないけれど、学生時代の研究や個人的な趣味で機械学習のスキルや知識を持っている社員にコミュニティに参加してもらいたいという思いがあるからです。今回のサミット内での開催で社内コンペの開催は3回目ですね。

今回のサミットでのコンペはどのような内容でしたか。

美嶋:Kaggleでは、限られたメンバーのみが参加できる「コミュニティ・コンペティション」が設定できるので、これをデータ分析の社内コンペに活用しました。コンペ期間は18日間です。

コンペのタスクは「市区町村ごとの2021年度平均所得」を導くモデルづくりです。総務省が公開する各市区町村の2020年以前の平均年収、面積、人口、男女比、生産年齢人口、企業数、農作物の生産量など公開されているオープンデータを基に、機械学習のモデルを構築し、その精度を競い合うタスクを設計しました。今回のコンペではデータ分析の初学者の方々にもぜひ参加してもらいたかったので、馴染みがあって、仮説を立てやすい平均所得というタスクにしました。

KgKには、「Kaggle Master」という称号を持つ極めて高いスキルを持ったメンバーが複数人在籍しています。私が設計したタスクを彼らに検証してもらい、きちんと精度が出ることを確認してから発表しました。加えて、今回のタスクに適した機械学習モデルのコードも考案・公開して、初学者の方でもトライしやすい環境を整えました。

三宅:私もコンペにエントリーしたのですが、どんな要素が平均年収に影響するかのイメージができたので取り組みやすく、さまざまなデータを組み合わせて機械学習のモデルを試しました。Kaggleは作ったモデルを投稿するとすぐに精度の判定が出るので、精度が上がるのが実感できてとても楽しかったです。

仲間と共に競い合い、知識を共有する切磋琢磨の場

イベントの様子

▲イベントの様子

エントリーの結果や表彰の内容を教えてください。

美嶋:参加チームは38組、参加者は46名に上りました。技術部門だけでなく、サービス、マーケティングといった幅広い部門、さらにはARISE Analyticsなどのグループ会社社員からの応募もありました。

三宅:データ分析コンペはプログラミングができないと参加が難しくとてもハードルが高いのですが、KDDIグループだけで50人弱が集まったことは非常に驚くべきことです。全社的なイベントとしての実施と社内への情報展開、そして、タスク設定の良さやコードの公開などKgKのコンペ事務局の対応も貢献していると思います。

美嶋:コンペでは13名を表彰しました。コンペのタスクは共通なのですが、過去の実績を基に、「エキスパート部門」と「初学者部門」に分け、それぞれ上位5名を表彰しました。例えば、エキスパート部門トップの方は、東京都世田谷区における2021年度平均所得約572万円(総務省調べ)に対し、精度の高いモデルを構築し誤差5%程度の約600万円という数値を算出されました。

もうひとつ「Contributor部門」を設けました。Kaggleではコンペのページに、タスクを解くための参考となるコードや知見を投稿し、議論できる機能があります。それぞれの投稿には「Upvote(いいね)」ボタンがあり、実際のKaggleではUpvoteがある数を超えるとKaggle内の称号(Masterなど)を得るために必要なメダルを獲得できます。コンペで高いスコアを出さなくても、良質な知見やデータを共有しコンペを盛り上げる人が評価されている証です。今回の社内コンペでもこのKaggleの設計を踏襲して、Upvoteの総獲得数が上位だった3名はコンペを盛り上げてくれたContributorとして表彰しました。

三宅:コンペに参加する他のメンバーを後押しするKaggleのこういった思想も、仲間と切磋琢磨して互いを高め合うコミュニティ活動との親和性がとてもよいと考えています。

懇親会では社内副業による課題解決への熱い要望も

イベント関係者の記念撮影

▲イベント関係者の記念撮影

サミット当日の雰囲気はどうでしたか。

美嶋:サミットでは、3テーマに関する発表を行いました。データ分析コンペのコーナーでは、内容紹介、結果発表、そしてエキスパート部門・初学者部門それぞれの優勝者によるコンペ解法についての発表が行われました。

その後、本社のカフェテリアで懇親会を実施し、30名ほどが参加しました。データ分析をテーマに活発なコミュニケーションが行われ、異なるコミュニティの方とも自然と交流が生まれていました。コンペ参加者同士がタスクの解法を聞き合うといったノウハウの共有も行われていましたね。

三宅:懇親会では、4つの部門から所属長やリーダーたちが登壇し、「会場にいるデータサイエンティストのみなさんに副業のご案内です!」という呼びかけがありました。それぞれの部署で抱えるデータ分析の課題解決に「ぜひ、社内副業制度を利用して参画してほしい」という熱いメッセージです。参加者のみなさんにとっては、データサイエンスという専門性が社内で求められていると改めて実感できた機会となったのではないでしょうか。

所属を超えたコミュニティでのつながりが個人と組織を高める

所属を超えたコミュニティでのつながりが個人と組織を高める

コミュニティの意義、今後のサミットの展開についてお願いします。

三宅:KDDIは研修や資格取得などインプットの制度が充実していると感じますが、スキルを伸ばすためにはインプットで得られた知識を実践するアウトプットの場がとても重要です。社内コミュニティやサミットはデータ分析や機械学習に関するアウトプットがとても気軽にできる場だと思います。

それとネットワーキングとフィードバックですね。所属する部署を超えてデータ分析というテーマでつながっているコミュニティがあることで、意見やアイデアといったフィードバックを積極的にいただけます。とても価値のあることだと思います。

美嶋:私はそのつながりを「同志」と捉えています。データサイエンティストは専門家であり、1人いればその部署のデータ分析業務が遂行できるケースも多く、それゆえに同じ部署内にデータ分析の専門的な議論ができる社員がいない場合もあります。しかし、こういったコミュニティであれば、コミュニティメンバーと気を使わずに話したり、業務上の課題も相談したりすることができます。精神的な支えになるコミュニケーションができる同志が集まっている場所だと考えています。

KDDIにはスキルの高いデータサイエンスのプロフェッショナルがたくさんいますし、先にお話ししたように社内のさまざまな意思決定にデータ分析・機械学習は関与しているので、いろんな部署にそういった方が在籍しています。例えば、私が所属する情報セキュリティ本部はKDDIのサイバーセキュリティを担う部署ですが、データ分析・機械学習が活用される業務は複数ありますし、私以外にも今回の社内コンペエキスパート部門の優勝者が在籍しています。現在の業務や入社時のコースに関わらずデータ分析や機械学習に関心がある社員にはコミュニティにどんどん参加してほしいですね。働きながら、データ分析の趣味を続け、開かれたコミュニティで同志と共に学ぶことができるのはKDDIの魅力だと思います。

三宅:今後もコミュニティ活動を通じた全社イベントなどでコンペを実施して、KDDIグループ社員がデータ利活用のスキルアップを楽しくできる環境を提供し続けたいですね。データ分析コンペは、分析結果から導いたビジネス提案を行うプレゼンテーションコンペや、データのビジュアライズの分かりやすさや綺麗さを競うコンペなど、さまざまな種類があります。新たなコンペの取り組みにも積極的にチャレンジしていきたいと思います。

この記事をシェア

Facebook LINE Twitter

RECOMMEND おすすめ記事

RANKING 人気記事ランキング