Kaggle上位入賞事例:メタデータに基づくYouTube動画再生回数予測アルゴリズムの開発

データ分析好きが集まる交流プラットフォーム「ProbSpace」にて開催された「YouTube 動画視聴回数予測コンペ」において、バイタリフィアジアのチーフデータサイエンティストである曽佐顕(Sosa Akira)を中心としたAIチームが、全444チーム中、見事3位にランクインしました。

世界最高峰のデータサイエンスコンペ「Kaggle」でもMasterの称号を持つ彼の取り組みと、動画マーケティングにおける機械学習アプローチの可能性について解説します。
1. YouTube視聴回数予測コンペの概要とビジネス課題
世界で最も普及した動画マーケティングツールであるYouTube。YouTuberとして活躍するクリエイターや企業にとって、動画の視聴回数は広告収益やプロモーション効果を左右する最重要KPIです。しかし、「どのような要素が視聴回数を伸ばすのか」について、定量データに基づいた分析やノウハウの共有は十分に進んでいないのが実情でした。
本コンペティションは、「YouTube APIとして公開されているメタデータをインプット情報として、動画の視聴回数を予測するアルゴリズムを開発する」という実践的なビジネス課題をテーマに開催されました。
分析対象となるメタデータには、以下のような情報が含まれています。
- 動画コンテンツの質的指標(Like/Dislike数、コメント数など)
- SEOにおいて重要とされるメタ情報(タイトル名、説明文、タグなど)
- 投稿時間やカテゴリなどの属性情報
これらの膨大なデータを機械学習アルゴリズムで分析・モデル化することで、「視聴回数を最大化するためには、どの指標をどのように改善すべきか」というインサイトを可視化し、動画マーケティングの最適化を図ることが可能になります。
2. データサイエンティストによる機械学習アプローチ
今回のコンペティションにおいて、曽佐率いるVitalify AsiaのAIチームは、提供された多様なメタデータの特徴量を適切に処理し、精度の高い予測モデルを構築しました。
自然言語処理(NLP)技術を用いてタイトルや説明文のテキストデータから特徴を抽出したり、エンゲージメント指標の相関関係を分析したりと、高度なデータサイエンスの知見が要求されるタスクにおいて、444チーム中3位というトップクラスの成績を収めることができました。
3. 世界トップレベルのAI人材が在籍するVitalify Asia
Vitalify AsiaのAI研究チームは、今回のProbSpaceでの入賞のみならず、Googleが主催するKaggleのコンペティション(Predicting Molecular Properties等)においてGoldメダルを獲得するなど、世界的なデータ分析コンペティションで確かな実績を残しています。
また、不動産物件の反響予測AIシステムにおいては独自の特許(学習装置及び予測装置)を取得するなど、R&Dから商用化まで一気通貫した技術力を持っています。
「自社に蓄積されたビッグデータを活用して、売上予測や需要予測モデルを構築したい」「世界レベルのデータサイエンティストにAI開発を依頼したい」といったご要望がございましたら、ぜひバイタリフィアジアのAIソリューション『Mobile AI Lab』までお気軽にご相談ください。
「Generative AI & ML」の関連記事

【生成AI×UIデザイン】一貫性のあるアイコンをLoRAで安定生成する技術検証
画像生成AIが陥りがちな「描き込みすぎ」や「一貫性の不在」を防ぎ、UI/UXデザインに最適なシンプルなアイコンをLoRAを用いて安定生成するアプローチを解説します。

AI Economist: Reinforcement Learning in Economics
Experimenting with the AI Economist API to simulate free markets and communism using Reinforcement Learning (RL) agents.

Applying Self Pre-Training Method to GNN for Quantum Chemistry
Explore how self pre-training methods are applied to Graph Neural Networks (GNN) to improve predictions in quantum chemistry.