ベトナムAIオフショア開発の実践:GANによる異常検知とクラウドファンディング成功予測

当社、Vitalify Asiaでは日々様々なAIの研究・開発(R&D)を行っています。
日本人チーフデータサイエンティストをはじめ、ベトナム人AIエンジニアで構成された専属チームを有し、最新のアルゴリズムを用いたビジネス課題の解決に取り組んでいます。今回は、過去に取り組んだHOTな研究内容を2つピックアップしてシェアいたします。
1. クラウドファンディングのプロジェクト成功予測
クラウドファンディングのプロジェクトの成功確率をAIで予測するという研究プロジェクトに取り組みました。
クラウドファンディングサイトの先駆け的存在とも言えるKickStarterのオープンデータを利用し、36,812件(成功案件7,496件、失敗案件23,320件、その他中止・進行中案件は除外)のプロジェクトの中から、24,652件を学習データ、6,163件をテストデータとして使用しました。

1-1. 使用したデータ項目(特徴量)について
利用したデータ項目は以下の通りです。
- プロジェクトの基本情報:開始年(Year)、目標金額(Goal_amount_USD)、設定期間(Duration)、通貨(Goal_currency)、カテゴリー(Category/ChildCategory)
- コンテンツの質的指標:画像数(ContentImageCount)、動画数(ContentVideoCount)、説明文の単語数(DescriptionWordCount/ContentWordCount)、リスク部分の単語数(RiskWordCount)
- リターン(パッケージ)情報:提供パッケージ数(PackageCount)、パッケージの最小・最大・平均金額
- 起案者の実績:過去のバックアッププロジェクト数(BackedProjCount)、過去の作成プロジェクト数(CreatedProjCount)
【予測精度と分析結果】
検証の結果、テストデータ6,163件のプロジェクトにおいて、90.2%の精度で成功・失敗を正しく予測することに成功しました。
さらに、どのデータ項目が成功に寄与しているかを分析したところ、以下のインサイトが得られました。

- プロジェクト開始年(Year):Kickstarterプロジェクトの成功を予測する上で最も重要な要素でした。近年はプラットフォームの成熟に伴い失敗するプロジェクトの割合が増加傾向にありました。
- 起案者の実績:過去に多数のプロジェクトをバックアップ(支援)した経験がある起案者ほど、新しいプロジェクトで成功する確率が高くなります。
- リスク要因と目標額:RiskWordCount(リスク説明の多さ)とGoalAmount(目標金額の高さ)は、成功に対して負の相関(悪影響)を与えます。
- コンテンツの充実度:画像や動画が多く、内容が詳細に説明されていれば成功確率は高まります。また、食品(Food)カテゴリーの成功率が高い傾向が見られました。
- キャンペーン期間:期間が短いプロジェクトの方が成功のチャンスが高まる傾向がありました。
Mediumにも研究成果報告(英語)をまとめています。

1-2. ビジネスへの応用可能性
この研究を発展させることで、プラットフォーム横断での成功予測や、「成功確率を最大化するために目標金額や期間をどう設定すべきか」を提案するレコメンド機能(SaaS等への組み込み)の開発が可能になります。
2. GAN(敵対的生成ネットワーク)を用いたX線画像の異常検出
もう一つの取り組みは、GAN(Generative Adversarial Networks:敵対的生成ネットワーク)を用いて、少数の不良品(異常)と大量の正常品データから、異常を検出できるモデルの構築です。データセットとしてX線画像サンプルを利用しました。

GANは、データから特徴を「教師なし学習」で学習し、実在しないデータを生成したり変換したりできる強力なAIアルゴリズムです。医療システムにおいて、大量のラベル付きデータ(医師の診断データ)を必要としないディープラーニングモデルが構築できれば、コストとスピードの面で極めて大きなメリットをもたらします。

2-1. 研究アプローチ
以下のプロセスで検証を行いました。
- 正常なX線画像(陰性サンプル)のみを生成するようにGANを訓練する。
- 異常を予測する際、GANを使用して正常画像と異常画像の両方を再構成する。
- 再構成誤差、特徴マッチング、識別損失を計算し、正常なケースと異常なケースを区別する。
2-2. 結論と今後の展望
結果として、今回のGANを用いたアプローチだけで異常を完璧に検出するという仮説を直ちに実証するには至りませんでした。しかし、GANの内部操作と特徴表現の抽出に関する重要な知見が得られ、医療分野における教師なし異常検知のモデル構築に向けた新たな仮説(次のアプローチ)へと繋がりました。
Mediumにも研究成果報告(英語)をまとめています。

3. ベトナムでAI開発をするならバイタリフィへ
「自社サービスにAIを導入したい」「AIを導入して業務効率化やコスト削減を実現したい」という企業様は、ぜひバイタリフィアジアにご相談ください。
Kaggle等で実績を持つ優秀なデータサイエンティストとAIエンジニアが、PoC(概念実証)の設計から実際のモデル構築、システムへの組み込みまでを一気通貫でサポートいたします。

「Generative AI & ML」の関連記事

画像1枚から3Dを作る技術 - Zero123からUnique3Dまでの進化の過程を解説
たった1枚の画像から3Dモデルを生み出す魔法のようなAI技術「Generative 3D」。Zero123から最新のUnique3Dに至るまでの革命的な進化の歴史と、その裏側にある仕組みを分かりやすく解説します。

GazeboにおけるTurtleBot3を用いたLiDAR迷路探索アルゴリズムの実装と検証
ROS 2とGazeboを用いたTurtleBot3の自律走行アルゴリズム開発レポート。安価なLiDARセンサーのみで迷路走破に挑んだ実装プロセスと、ゴール目前でロボットがとった「まさかの行動」とは?

ローカルLLM比較の最短経路:なぜ開発者は「Ollama + Open WebUI」ではなく「LM Studio」を選ぶべきなのか
ローカルLLM環境の構築、まだ「インフラ構築ごっこ」に時間を溶かしていませんか?Ollama + Open WebUIの定番構成と、開発者向け特化の「LM Studio」を徹底比較。モデル検証の最短経路を解説します。