VITALIFY.ASIA logo

バイタリフィ アジアのAI R&Dチーム:画像認識や音声アシスタントの開発実例

Author profile
Vitalify Asia Team2018/05/17
バイタリフィ アジアのAI R&Dチーム:画像認識や音声アシスタントの開発実例

バイタリフィアジアでは、機械学習やディープラーニングを専門とするAIのR&D(研究開発)チームを組成し、日々最新技術のビジネス検証を行っています。

当初は日本人AIスペシャリストと数名のベトナム人エンジニアでスタートしたチームも現在では規模を拡大し、お客様からの受託案件はもちろん、自社独自のR&Dテーマにも積極的に取り組んでいます。今回は、公開可能な自社研究の中から2つのプロジェクト事例をピックアップしてご紹介します。

事例1:TensorFlowを用いたリアルタイム「髪色シミュレーションAI」

ある広告企画系の企業様から、「スマートフォンのカメラで撮影している人物の髪色を、リアルタイムに別の色にシミュレーション(変換)するアプリは作れないか?」というご相談をいただいたのがきっかけでした。

事業計画の都合でお客様のプロジェクト自体は一時保留となりましたが、画像認識AIの技術的チャレンジとして非常に価値があるテーマだったため、自社のR&Dプロジェクトとして研究を継続しました。

【技術的アプローチと成果】
機械学習(セマンティックセグメンテーション等の技術)を用いて、モバイルアプリのカメラ映像から「頭髪の領域」のみをリアルタイムかつ高精度に認識・追従するAIモデルを構築しました。
これにより、顔や体が動いても髪の領域だけを正確に捉え、カラーフィルターを自然に合成することが可能になりました。

Hair Color Simulation (AI & Image recognition)のデモ動画

このような特定の領域を高精度に切り出す画像認識AIは、髪色だけでなく「洋服のバーチャル試着」や「顔の特定パーツの認識」など、小売業や美容業界のDXにおいて幅広い応用が可能です。

事例2:Amazon Alexaを活用した「音声認識オーダーシステム」

日本でも普及が進んでいるスマートスピーカー。Echo Dotなどに搭載されているAI音声アシスタント「Alexa」を活用し、B2B(店舗業務)への応用を検証したプロジェクトです。

スマートスピーカー「Echo Dot」

スマートスピーカーは個人の家庭での利用が一般的ですが、音声認識AIの精度向上により、商業施設での業務効率化ツールとしての可能性が高まっています。そこで、「飲食店のテーブルにスマートスピーカーを設置し、お客様の音声をAIが認識して自動で厨房へ注文データを送る」というオーダーシステムのデモを構築しました。

【利用イメージ】

  • ユーザー:「アレクサ、マイメニューを開始して」
  • Alexa:「いらっしゃいませ。ご注文を伺います」
  • ユーザー:「コーヒーを6杯ください」
  • Alexa:「コーヒー6杯ですね。他に注文はありますか?」

Alexa OrderSystemデモ

AIが音声をテキストデータに変換(STT)し、意図を解釈してバックエンドの注文管理システムへとデータを送信します。これにより、ホールスタッフの人手不足解消や、非接触でのオーダー体制の構築が期待できます。

今後の展望と製造業界からのAI導入ニーズ

今回ご紹介したのは自社R&Dの一部ですが、現在お客様からお問い合わせをいただき、並行して進行しているAIのPoC(概念実証)プロジェクトは数十件に上ります。

特に昨今、ものづくり(製造業)の現場や工場における「AIを活用した不良品検知・外観検査の自動化」に関するお問い合わせが非常に増加しています。人間による目視検査の限界を、AIの画像認識によって効率化・高精度化したいというニーズです。

Vitalify Asiaでは、既存のAI APIの組み込みから、独自のAIモデルのスクラッチ開発(PoC検証)まで、柔軟に対応可能な体制を整えています。「こんな業務をAIで自動化できないか?」といったアイデアベースのご相談から、ぜひお気軽にお声掛けください。

1,000社以上の事業成長を支えた圧倒的な『スピードと柔軟性』で、御社のアイデアを最短で形にします。まずは無料で壁打ちしませんか?

無料相談はこちら
#Generative AI & ML

「Generative AI & ML」の関連記事

画像1枚から3Dを作る技術 -  Zero123からUnique3Dまでの進化の過程を解説

画像1枚から3Dを作る技術 - Zero123からUnique3Dまでの進化の過程を解説

Toshihiko Nagaoka2026/05/12

たった1枚の画像から3Dモデルを生み出す魔法のようなAI技術「Generative 3D」。Zero123から最新のUnique3Dに至るまでの革命的な進化の歴史と、その裏側にある仕組みを分かりやすく解説します。

GazeboにおけるTurtleBot3を用いたLiDAR迷路探索アルゴリズムの実装と検証

GazeboにおけるTurtleBot3を用いたLiDAR迷路探索アルゴリズムの実装と検証

Toshihiko Nagaoka2026/05/06

ROS 2とGazeboを用いたTurtleBot3の自律走行アルゴリズム開発レポート。安価なLiDARセンサーのみで迷路走破に挑んだ実装プロセスと、ゴール目前でロボットがとった「まさかの行動」とは?

ローカルLLM比較の最短経路:なぜ開発者は「Ollama + Open WebUI」ではなく「LM Studio」を選ぶべきなのか

ローカルLLM比較の最短経路:なぜ開発者は「Ollama + Open WebUI」ではなく「LM Studio」を選ぶべきなのか

Toshihiko Nagaoka2026/05/06

ローカルLLM環境の構築、まだ「インフラ構築ごっこ」に時間を溶かしていませんか?Ollama + Open WebUIの定番構成と、開発者向け特化の「LM Studio」を徹底比較。モデル検証の最短経路を解説します。

ぼくはデューパー、なんでもきいてね!