TOP > 機能概要

Sound Archery Type Ⅰ(高速版)

Type Ⅰ(高速版)は、必要とするリソースが小さく、組込み機器への搭載も可能なライブラリーです。
右グラフ図は、ICレコーダーを用いて実験した実測結果を示しています。話者数57名での評価結果です。話者を登録した音声と、話者を判定した音声はそれぞれ約20秒です。登録音声と判定音声の発話内容は全く異なる音声を用いています。ノイズ除去処理を事前に実行しています。概ね、90%の精度で、話者を特定できています。
閾値を設定すれば、登録されている音声か、そうでない音声かという2値判定も可能です。

▲ページの先頭へ

Sound Archery Type Ⅱ(高精度版)

Type Ⅱ(高精度版)は、パソコンなどCPU能力が高く、リソースに余裕のある機器でご利用頂けるライブラリーです。
音・音声に含まれる様々な特徴を解析し、特徴量として管理し、評価します。
未知の音・音声に対しては、そのデータに含まれる特徴量と、登録済みの音・音声データに含まれる特徴量を比較し、最も近いと推定される音・音声を特定します。
実験では、話者5名の中からの判定の場合、ノイズ除去処理を行い、20秒程度の音声で判定すれば、95%以上の精度で話者を特定できています。また、Type Ⅰと比べ、比較的短い音・音声であっても、高精度に特定できるという特徴もあります。

▲ページの先頭へ