リアルタイム文字起こしとは
リアルタイム文字起こしとは、会話の音声を発話とほぼ同時にテキスト化する技術です。商談 AI では、AI が会話内容を即座に理解して支援するための基盤になります。
リアルタイム文字起こしの定義
リアルタイム文字起こしとは、会話音声を発話とほぼ同時 (数百ミリ秒〜数秒の遅延) にテキスト化する技術です。商談後にまとめて文字起こしする「バッチ型」と対比されます。
商談 AI においてなぜ重要か
リアルタイム文字起こしは、商談中の AI 支援を成立させる基盤技術です。
- 会話をテキスト化できて初めて、AI が「いま何の話をしているか」を理解できる
- ヒアリング項目が話題に出たことを検知し、チェックリストを自動更新できる
- 会話の流れに応じたトークサジェストを出せる
つまり文字起こしの速度と精度が、リアルタイム支援の品質を直接決めます。
音声の取得方式
| 方式 | 仕組み | 商談相手から見えるか |
|---|---|---|
| BOT 参加型 | 会議に録音 BOT が参加して音声を取得 | 参加者一覧に BOT が表示される |
| デスクトップ取得型 | 営業担当者の PC 上で音声を直接取得 | 一切見えない |
BOT 参加型は商談相手に AI の利用が伝わるため、商談の自然さを保ちたい場合はデスクトップ取得型が適しています。詳しくは商談ボット (会議 BOT) を参照してください。
Stand のリアルタイム文字起こし
Stand はデスクトップ取得型で、Zoom / Microsoft Teams / Google Meet / Webex など主要な会議ツールに対応しています。文字起こしを基盤に、ヒアリングチェック・AI サジェスト・商談後の SFA 自動転記 までを一気通貫で行います。