Kaggleと企業の活用事例〜人気上昇中のAI・機械学習コミュニティ〜

  • このエントリーをはてなブックマークに追加
  • LINEで送る

エンジニアやデータサイエンティストが在籍する企業では、世界中の機械学習を扱う人が集まる「Kaggle」というサービスの人気が上昇しています。

企業にとっても社員がKaggleに参加することをメリットと捉え、業務時間の50%をKaggleに充てるのを容認している企業もあるほどです。

そこで本記事では、このKaggleについて、基本的な概要説明と具体的にどのようなことができるのかを解説していき、AI人材育成・採用に活用している企業事例をご紹介します。

Kaggleとは

Kaggleとは、AI・機械学習を学ぶ人が集まるコミュニティ・プラットフォームです。2010年にKaggle社が開始したサービスで、2017年にはGoogleが買収した関係で現在KaggleはGoogleのサービスとなっています。今話題に上がることが増えてきているサービスですが、実は意外と前から存在しているもので、Googleの傘下に入ってからも既に数年経過しています。

Kaggleでできること

KaggleはAIの課題と解決をマッチングさせます。例えば、企業が解決したい課題をプラットフォーム上で提示すると、AIに知見のある人々がAIを使った課題解決方法を模索し、提案します。集まった提案の中から企業は最も良いと思われるものを採用し、提案者は報酬がもらえるという仕組みです。

全体の大枠はこのようになっているのですが、他にも学習できる材料が揃っていたり、コードの実行ができる環境があったりと様々なことができます。以下では、Kaggleでできることを細分化してご紹介します。

コンペに参加(Competitions)

主軸と言っても過言ではないのが、「コンペ」です。コンペでは、企業や団体がAIで解決を求める課題が提示されています。コンペがスタートすると、コンペ参加希望者が集まり、課題解決策を提案していきます。

1つのコンペにつき、1日5回までの提案が可能で、コンペ終了後には他の人が投稿したコードも閲覧可能になります。逆に言えば、自分が投稿したコードも閲覧されます。お互いに提案内容を見て勉強することができるので、その点はメリットと言えるでしょう。

データセットの入手(Datasets)

Kaggleには多くの種類のデータセットが公開されていて、参加者はこれらをダウンロードできます。データセットのアップロードも可能です。CSV形式でまとめられている場合が多く、ビジネス活用だけでなく遊び目的のものも豊富です。例えば、ゲームのアイテムのデータセットなどもあります。

学習済みモデルの利用(Models)

学習済みモデルは、上で挙げたデータセットを事前に学習し、タスクに対応できるようになっている機械学習モデルのことです。学習済みモデルを利用することで、少ない労力で目的に合った機械学習モデルを生成することが可能です。

コード実行(Code)

Kaggleには、Kaggle Notebookというコードの実行環境が用意されています。この環境にコードを書き込めば全体の実行ができるだけでなく、セル単位で実行することも可能です。

またライブラリのインポートなど、一般的なプログラミング環境でできることがKaggle Notebookでも可能です。簡易的なコード実行だけでなく本格的なシステム構築もできます。構築したシステムをそのままKaggleでコンペ参加して投稿するような使い方もでき、コンペ終了後に他の人が投稿したコードをKaggle Notebookに持ってきて実行するようなこともできます。

議論(Discussions)

Kaggle内で様々な人と議論もできます。議論と言っても討論のような意味合いではなく、単純に意見交換などコミュニケーションを図る意図で使われています。情報交換することで情報を収集できると同時に、モチベーションアップにつながる場合もあるでしょう。

学習(Learn)

Kaggle Learnという機能が用意されていて、データサイエンス初心者向けの学習が可能です。Kaggle Learnには17のCoursesと6つのGuidesがあります。内容としては、プログラミングの基本、Pythonの使い方、機械学習、SQL、深層学習、強化学習などです。

Kaggleを取り入れている企業事例

KaggleはAI・機械学習に関心のある個人が集まっているのですが、企業としてこのプラットフォームを活用するケースも増えてきています。ここからは、Kaggleを活用している国内の企業事例をご紹介していきます。

DeNA「Kaggle社内ランク」制度

DeNAでは「Kaggle社内ランク」制度を導入しています。この制度の目的は、コンペ参加によってデータサイエンス人材を育成していくことです。

Kaggle社内ランク制度は、社内のランクだけでなく、採用時の条件としても使用されています。コンペ参加で優秀な成果を残した人材はDeNA社内で高い評価を得られ、それがランクアップや昇給にも影響していくのです。

実際DeNAには多くの参加者、通称「Kaggler」が在籍しています。2021年時点で、Kaggleの最高位であるKaggle Grandmasterが3名、Kaggle Master も国内最多の16名です。

参考:Kaggleで大活躍するDeNAの社内制度とは | DeNA×AI

Rist「Kaggle Team制度」

京セラコミュニケーションシステム(KCCS)傘下のRistでは、「Kaggle Team制度」を導入しています。Kaggle Team制度は、採用時にGrandmasterだと業務時間の50%を、Masterだと30%をKaggleの活動に充てることができるというものです。1年に1回更新審査があり、条件をクリアすると業務時間をKaggleの活動に充てられるようです。

結果的に、Ristには2024年時点で6名のKaggle Grandmasterが在籍しています。Masterも5名とKaggleの活動に力を入れていることがわかります。

参考:Kaggle | 株式会社Rist | Rist Inc.

ダイハツ:社内Kaggle

ダイハツでは、2020年末にダイハツ工業社員専用のKaggleコミュニティが立ち上がりました。3名からスタートしたコミュニティですが、その後重要性が認められ活動が本格化されました。2024年現在は関西と関東にそれぞれコミュニティが存在するほどです。エキスパートの商号を取得する社員や自作のAIを部内で展開している社員も現れました。

参考:プロジェクトストーリー|新卒採用情報【ダイハツ 採用情報】

アイリス:Kaggle参加支援

アイリスは医療AIベンチャー企業です。アイリスでは「最大40%ルール」を導入していて、業務時間の最大40%をKaggleの活動に充てられます。その結果、アイリスからはGrandmasterが2名誕生しました。

参考:「業務時間の最大40%をKaggleに投資」がもたらす効果とは? Kaggle Grandmasterを2名同時輩出した医療AIベンチャーに聞く – エンジニアtype | 転職type

まとめ

Kaggleは現在Googleが提供するAI・機械学習コミュニティ・プラットフォームサービスで、コンペ参加形式でAIで解決してほしい課題を提示する人と、解決案を提示する人が存在しています。

課題解決や賞金といったメリットもありますが、コンペに参加することでエンジニアやデータサイエンティストのスキル向上に役立つメリットがあります。そのため、企業もKaggleの活動を認め、力を入れ始めています。これからデータサイエンティストやAI人材を採用したり育てていこうと考えている場合は、一度見てみてはいかがでしょうか。