公式ブログ

Blog

対面接客の”声”を資産に変える――IdeinによるAI音声解析の新サービス「Phonoscape」とは?

Blog-kv-phono-story

こんにちは、IdeinでAIカメラ・AIマイクの事業統括をしている川崎です。

本日、Ideinは対面接客の現場の“声”を収集し、AIを使って解析する「Phonoscape(読み:フォノスケープ)」を正式にリリースしました。
私たちの開発した「Phonoscape」は、これまで見えなかった対面接客中の顧客の生の声を、AI技術でデータ化し、企業活動に活用できるサービスです。今回は、Phonoscapeの開発背景と主な機能をご紹介します。

なお、サービス名の「Phonoscape」には「音声データを使って世界を可視化していく」という想いが込められています。

idein-vp-kawasaki-profile

なぜ今、対面接客の音声データが注目されるのか?

背景にあるのは、音声認識や自然言語処理に強みを持つ生成AI技術の飛躍的な発展です。

Ideinではこれまで、大手通信キャリア様とのプロジェクトなどを通じて、マイクとAI機能を組み合わせた音声記録技術を構築してきました。これにより、接客現場におけるリアルな音声を高精度に収集できるようになった一方で、それをどう活かすかが課題でした。

音声を分析し、価値ある情報に変えるには、「録音→文字起こし→テキスト分析」という工程が必要です。従来はこれが非常に煩雑で、難易度が高かったのですが、OpenAIの「Whisper」や「ChatGPT」をはじめとした生成AIの登場により、状況は大きく変わりました。こうした技術を活用すれば、自社で高度なデータ分析の専門知識を有さずとも、高度な分析が可能となったのです。

Phonoscapeの3つの特長

1. ノイズに強く、高精度な音声収集

音声を収集して文字起こしするソフトウェアは巷に多くありますが、Ideinは通信キャリア様とのプロジェクトにおける数千台規模のプロジェクトで培った独自の音声収集技術により、雑音の多い店舗内でもクリアな音声を自動で録音。話者の方向を検知し、店員と顧客の声を分離して記録できます。

技術的な解説を加えると、Idein独自のノウハウによるマイクのパラメータ制御や方向推定によって、周囲の雑音を低減し、対象の会話のみを高品質に録音します。マイクには「マイクアレイ」という特殊なマイクを採用することで、話者がどの方向から話しているかを検知して発言者を特定。店員と顧客それぞれの発話音声を分離し、別々のデータとして保存可能です。これにより、後に会話を分析する際の精度や利便性が高まります。

2. 録音・文字起こしは全自動

マイクをコンセントに繋いで電源を入れるだけで(※)、AIが人間の会話を認識し、録音の開始・停止、さらには文字起こしまですべて自動で行います。現場のスタッフが録音操作を行う必要がないため、録音ボタンの消し忘れなどが起きません。
(※) Wi-Fi環境は必要です。

3. データ分析・活用もAIで支援

録音データは、ChatGPTをはじめとする生成AIと連携することで大量の会話テキストを目的に応じて分類・要約。商談メモや接客レポートなどの自動生成も可能なため、レポート作成時間を大幅に削減できます。現場の業務負担を最小限に抑えつつ、従業員は目の前の顧客対応に集中できるため、成約率の向上や残業時間の削減による人件費の節約も期待できます。

また、ChatGPT等との連携により、文字起こしされた大量のテキストデータを、特定の基準や目的に基づいて分類(=ラベリング)することも可能です。これにより、単に文字起こしされたテキストデータを集計可能な定量データへと変化させて、有意義なインサイトの発見に役立てられます。

「守り」と「攻め」のDXを1つのサービスで

先述した通信キャリア様とのプロジェクトでは、カスタマーハラスメントなどから従業員を守るための接客録音が主たる目的でした。しかし、生成AI技術の進化により、こうした「守りのDX」にとどまらず、取得した音声データを資産として活用し、ハイパフォーマー(成果を上げている従業員)の接客分析などを通じて売上向上につなげる「攻めのDX」にも展開できます。

対面接客の現場で生まれる音声データは、大きな価値を持っています。なぜなら購買や成約の瞬間など、顧客が最終判断を下す際の本音がそこに存在するためです。コールセンターでの音声録音は以前から行われていますが、対面接客のように雑音・ノイズの多い環境では音声収集が難しく、これまで普及が進んでいませんでした。
こうした「ラストワンマイル」の情報は、従来のマーケティングデータでは捉えきれない貴重なものなのです。

なお、Phonoscapeは、Ideinが独自開発したエッジAI開発プラットフォーム「Actcast(読み:アクトキャスト)」と連携しています。Actcastは現場に設置された多数のデバイスを管理・運用することに長けており、1案件あたり数千台規模の運用実績があります。大企業の厳しいセキュリティ要件をクリアする機能も備えており、個人情報保護に配慮した運用が可能です。

要望に合わせた柔軟な導入と進化する機能

現在はウェディングや不動産、銀行、自動車ディーラーなど、大きな商談の行われる業界で高い関心をお寄せいただいています。

こうした音声データ分析の市場は、まだ黎明期にあるといえます。まずは音声データの取得により、現場の担当者の方が「楽になる」「業務が改善・効率化される」と実感していただくような導入から始まり、その後蓄積されたデータを分析することで、接客の高度化や人材育成につながっていく形が理想ではないかと考えています。

Phonoscapeではイニシャルコストを低減するため、デバイス制御信号処理を実行するための処理基板としてRaspberry Piを採用しているほか、リースにも対応しています。Idein独自の技術により、Raspberry Pi上で高度なAI処理を動作させることを可能にしています。顧客ニーズを見極めつつ、将来的にはリアルタイム文字起こし機能の実装も視野に入れています。

まとめ:音声データが企業の資産になる時代へ

今後、音声データ解析を活用したビジネスは間違いなく進化していきます。その基盤となるのが「高品質な音声データ」です。Phonoscapeは、この要となる部分において圧倒的な強みを持つサービスであると自負しています。私たちは、今後も技術を進化させ、音声の力で現場を、そして社会を変えていきたいと考えています。

今回のブログは以上となります。お読みいただきありがとうございました。

> ブログの内容について問い合わせる

 

関連記事

こんなことで
お困りではありませんか?
ぜひご相談ください

  • AIやIoTをビジネスに
    取り入れたい
  • DXによる業務改善や
    売上UPを実現したい
  • AIプロジェクトが
    うまくいっていない