Kaggleコンペティション「Predicting Molecular Properties」での日本人トップ・Goldメダル獲得の軌跡

データサイエンティストの世界最高峰のプラットフォーム「Kaggle(カグル)」。
この度、Vitalify AsiaのAI R&Dチームを率いるチーフデータサイエンティストの曽佐 顕(Sosa Akira)が、Kaggleの「Predicting Molecular Properties(分子の属性予測)」コンペティションにおいて、全2,749チーム中10位という素晴らしい成績を収め、Goldメダル(日本人トップ)を獲得しました。

また、この結果と過去に獲得した2つのSilverメダルを合わせ、Kaggle全体でも一握りのトップ層にのみ与えられる「Kaggle Master」の称号を獲得いたしました。
過去に獲得したSilverメダルの記事


1. 世界的AIコンペティション「Kaggle」とは
Kaggleは、2017年にGoogleによって買収された世界最大のデータサイエンス・プラットフォームです。世界中の企業や研究機関が解決したい課題と実データを提供し、世界中のデータサイエンティストや機械学習エンジニアが最適なAIアルゴリズム(予測モデル)を競い合います。
Kaggleで上位(Gold、Silver、Bronzeメダル)を獲得することは、AIエンジニアにとって世界的な技術力の証明となります。中でも「Kaggle Master」は、複数の難関コンペティションで一貫して高い推論精度を叩き出したエキスパートにのみ与えられる名誉ある称号です。
2. 挑戦した課題:量子化学と機械学習の融合(分子コンペ)

今回入賞したコンペティションのテーマは、「Predicting Molecular Properties」です。
具体的には、分子構造データから「Scalar Coupling Constant(スカラー結合定数)」と呼ばれる、NMR(核磁気共鳴)分析において重要な数値を予測する機械学習モデルを構築するタスクです。
従来、この数値を量子力学に基づいて正確に計算するには膨大な計算リソースと時間を要していました。これを機械学習のデータドリブンなアプローチで高速かつ高精度に予測できるようにすることが本コンペの目的です。
この技術が発展すれば、新薬の合成予測や新規素材の開発など、創薬・マテリアルズインフォマティクス分野において劇的なイノベーションをもたらすことが期待されています。
3. Kaggle Master 曽佐による振り返りと技術的アプローチ
コンペティション終了後、チーフデータサイエンティストの曽佐に技術的なアプローチや所感をインタビューしました。

―― 非常に専門的な化学領域のテーマでしたが、アプローチは難しかったですか?
曽佐:私自身のバックグラウンドが化学専攻(京都大学大学院 理学研究科出身・タンパク質立体構造解析を研究)であったこともあり、ドメイン知識の面で抵抗はなく、むしろ知的好奇心がモチベーションに繋がりました。
―― 今回の予測モデル構築において、どのような過程を辿りましたか?
曽佐:専門性の高い分野であるため、まずは最新の学術論文を大量にインプットすることから始めました。この分野のトップ研究者のアプローチをベースに、今回のコンペ特有のデータセットに合わせてアーキテクチャを独自にカスタマイズし、解法を構築しました。(※解法はKaggleフォーラムでも共有しています)
―― 今回のコンペティション全体を通じて、技術的なトレンドとして印象的だった点は?
曽佐:上位陣(1〜6位)の解法の多くが、「Transformer(トランスフォーマー)」と呼ばれるアーキテクチャを採用していた点です。
Transformerは自然言語処理(NLP)の分野でブレイクスルーを起こした技術ですが、分子構造という全く異なるグラフ/シーケンス問題の解決にTransformerが適用され、圧倒的な精度を出したことは革新的でした。Kaggleという場が、分野の垣根を越えてデータサイエンスの手法を進化させていることを強く実感しました。
―― 最後に、Vitalify AsiaのAIチームの今後の展望をお願いします。
曽佐:Vitalify AsiaのAIチームには、真に才能を持ったリサーチャーやエンジニアが集まっています。ベトナム人スタッフの中にも、インターンシップ中にKaggleで単独Silverメダルを獲得するような優秀なメンバーが育ってきています。我々は業界・ドメインを問わず、最先端のアルゴリズムを用いてビジネス課題を解決する力を持っています。
【世界トップレベルのAI技術をビジネスへ】
バイタリフィアジアでは、Kaggle Masterが率いる強力なAIエンジニアチームが、お客様のデータ活用やAIモデル構築(PoC)、そしてシステムへの組み込みまでを一気通貫で支援します。
「既存の業務データを活用して予測モデルを作りたい」「先端AI技術を自社プロダクトに組み込みたい」とお考えの企業様は、ぜひお気軽にご相談ください。
「Generative AI & ML」の関連記事

画像1枚から3Dを作る技術 - Zero123からUnique3Dまでの進化の過程を解説
たった1枚の画像から3Dモデルを生み出す魔法のようなAI技術「Generative 3D」。Zero123から最新のUnique3Dに至るまでの革命的な進化の歴史と、その裏側にある仕組みを分かりやすく解説します。

GazeboにおけるTurtleBot3を用いたLiDAR迷路探索アルゴリズムの実装と検証
ROS 2とGazeboを用いたTurtleBot3の自律走行アルゴリズム開発レポート。安価なLiDARセンサーのみで迷路走破に挑んだ実装プロセスと、ゴール目前でロボットがとった「まさかの行動」とは?

ローカルLLM比較の最短経路:なぜ開発者は「Ollama + Open WebUI」ではなく「LM Studio」を選ぶべきなのか
ローカルLLM環境の構築、まだ「インフラ構築ごっこ」に時間を溶かしていませんか?Ollama + Open WebUIの定番構成と、開発者向け特化の「LM Studio」を徹底比較。モデル検証の最短経路を解説します。