Kaggle上位入賞事例:メタデータに基づくYouTube動画再生回数予測アルゴリズムの開発

データ分析好きが集まる交流プラットフォーム「ProbSpace」にて開催された「YouTube 動画視聴回数予測コンペ」において、バイタリフィアジアのチーフデータサイエンティストである曽佐顕(Sosa Akira)を中心としたAIチームが、全444チーム中、見事3位にランクインしました。

世界最高峰のデータサイエンスコンペ「Kaggle」でもMasterの称号を持つ彼の取り組みと、動画マーケティングにおける機械学習アプローチの可能性について解説します。
1. YouTube視聴回数予測コンペの概要とビジネス課題
世界で最も普及した動画マーケティングツールであるYouTube。YouTuberとして活躍するクリエイターや企業にとって、動画の視聴回数は広告収益やプロモーション効果を左右する最重要KPIです。しかし、「どのような要素が視聴回数を伸ばすのか」について、定量データに基づいた分析やノウハウの共有は十分に進んでいないのが実情でした。
本コンペティションは、「YouTube APIとして公開されているメタデータをインプット情報として、動画の視聴回数を予測するアルゴリズムを開発する」という実践的なビジネス課題をテーマに開催されました。
分析対象となるメタデータには、以下のような情報が含まれています。
- 動画コンテンツの質的指標(Like/Dislike数、コメント数など)
- SEOにおいて重要とされるメタ情報(タイトル名、説明文、タグなど)
- 投稿時間やカテゴリなどの属性情報
これらの膨大なデータを機械学習アルゴリズムで分析・モデル化することで、「視聴回数を最大化するためには、どの指標をどのように改善すべきか」というインサイトを可視化し、動画マーケティングの最適化を図ることが可能になります。
2. データサイエンティストによる機械学習アプローチ
今回のコンペティションにおいて、曽佐率いるVitalify AsiaのAIチームは、提供された多様なメタデータの特徴量を適切に処理し、精度の高い予測モデルを構築しました。
自然言語処理(NLP)技術を用いてタイトルや説明文のテキストデータから特徴を抽出したり、エンゲージメント指標の相関関係を分析したりと、高度なデータサイエンスの知見が要求されるタスクにおいて、444チーム中3位というトップクラスの成績を収めることができました。
3. 世界トップレベルのAI人材が在籍するVitalify Asia
Vitalify AsiaのAI研究チームは、今回のProbSpaceでの入賞のみならず、Googleが主催するKaggleのコンペティション(Predicting Molecular Properties等)においてGoldメダルを獲得するなど、世界的なデータ分析コンペティションで確かな実績を残しています。
また、不動産物件の反響予測AIシステムにおいては独自の特許(学習装置及び予測装置)を取得するなど、R&Dから商用化まで一気通貫した技術力を持っています。
「自社に蓄積されたビッグデータを活用して、売上予測や需要予測モデルを構築したい」「世界レベルのデータサイエンティストにAI開発を依頼したい」といったご要望がございましたら、ぜひバイタリフィアジアのAIソリューション『Mobile AI Lab』までお気軽にご相談ください。
「Generative AI & ML」の関連記事

AIによってベトナムの雇用は減るのか?
「AIによってベトナムの雇用は減るのか?」バイタリフィ アジアCOOが語る、システム開発・オフショア業界における生成AIのリアルな影響と、次世代エンジニアに求められる「自己破壊的な好奇心」とは。

画像1枚から3Dを作る技術 - Zero123からUnique3Dまでの進化の過程を解説
たった1枚の画像から3Dモデルを生み出す魔法のようなAI技術「Generative 3D」。Zero123から最新のUnique3Dに至るまでの革命的な進化の歴史と、その裏側にある仕組みを分かりやすく解説します。

GazeboにおけるTurtleBot3を用いたLiDAR迷路探索アルゴリズムの実装と検証
ROS 2とGazeboを用いたTurtleBot3の自律走行アルゴリズム開発レポート。安価なLiDARセンサーのみで迷路走破に挑んだ実装プロセスと、ゴール目前でロボットがとった「まさかの行動」とは?