FAQ

マイクロコントローラ

音声ガイド・認識製品に関し、よくあるご質問をFAQに取りまとめています。ご活用下さい。

全般(仕様)

評価ボード

HW系

SW系

外付け部品

異常

全般(仕様)

  • Q01電源電圧は?
  • Aコア:1.8v、IO:3.3vの2電源です。
  • Q02動作温度範囲は?
  • A-40℃~85℃です。
  • Q03不特定話者認識ってどういうこと?
  • A不特定多数のユーザに対して高い認識精度が得られることを言います。
  • Q04登録可能語彙:無制限ってどういうこと?
  • A音声認識用データを差し替えることで、音声認識するワードをアップデートできるという意味です。差し替える数に特に制限はありません。
  • Q05サポートしているHostインターフェイスは?
  • A下記をサポートしております。
    ・同期式シリアルインタフェース
    ・調歩同期式シリアルインタフェース(UART)
  • Q06クロックは?
  • Aクロック入力(振動子不可) : 32.768kHz
  • Q07パッケージは?
  • AQFP64(10mm角、0.5mmピッチ)です。
  • Q08音声の圧縮伸長手法は?
  • Aオリジナル・ボイス・フォーマット:EOVになります。
    サンプリング周波数は16kHz固定で、ビットレートは16, 24, 32, 40kbpsから選択いただけます。
  • Q09EOVってADPCMに比べてどうなの?
  • AADPCMと比較すると、音質が上がり、さらににデータサイズが小さくなります。
    ADPCM 16kHzと比較してデータサイズは1/3~1/4、ADPCM8kHzと比較して2/3~1/2となります。(16kbpsの時)
  • Q10SPI-Flashにどれくらいの時間はいるの?
  • A以下になります。(時間は目安です、実際の音声により前後します)
    ビットレート EPSON(16kHz) ADPCM(8kHz) ADPCM(16kHz)
    1MB 約8分強 約2分強 約4分強
    2MB 約16分強 約4分強 約8分強
    4MB 約33分強 約8分強 約16分強
    8MB 約1時間6分強 約16分強 約33分強
    16MB 約2時間13分強 約33分強 約1時間6分強
  • Q11音声認識用データのサイズは?
  • Aだいたい平均で1000byte以下です。最大で2000bytesです。
  • Q12接続できるSPI-Flashの最大サイズは?
  • A16MBまでです。
  • Q13マニュアルに外部シリアルFlash メモリに格納できる最大ファイル数に制限があるのはなぜ?
  • Aファイル1つにつき1ms遅延が増加します。SPI-Flashで100個目に置かれているファイルの読み出しには100msが、300個目に置かれているファイルは300msの遅延が付加されてしまいます。許容できる範囲として、512個とさせていただいております。
  • Q14外付けで必要な部品は?
  • Aアナログコーデック、SPI-Flash(オプション)、マイク/スピーカです。
  • Q15SPI-Flashって必須?
  • A必須ではございません、音声認識用データ、音声データをHost CPUよりストリーミングする場合は不要です。音声のストリーミング再生の場合、対応するHost I/fはSPIのみになります。
  • Q16SPI-Flashを使用しない場合の端子の処理は?
  • AS1V50300HWマニュアル図7.5を参照ください。
  • Q17スタンバイ・モードってあるの?
  • Aございません。
  • Q18シーケンサ機能って何?
  • A分割したフレーズを、接続を指定することをシーケンス機能といいます。
    下記は、シーケンス機能で5フレーズを接続しております。S1V50300では最大64まで可能です。
    「現在の」「設定温度は」「二十」「五度」「です」
  • Q19シーケンス機能で、フレーズ間のディレイ設定って可能?
  • A0-4000ms (10msステップ)で設定が可能です。
  • Q20音声認識で発話を検知できないタイムアウトと、対象外の発話を区別できるの?
  • A出来ます。Host CPUへの返り値が異なります。
  • Q21シナリオライブラリって何?
  • A音声ガイドデータ(eov)と音声認識用選択肢データ(lms)で構成される外付けSPI-Flash用データファイルです。

評価ボード

  • Q01評価ボードはあるの?
  • Aございます。
    プリインストールデモが搭載されていりますので、入手後すぐに評価が可能です。
    評価ボードについては、弊社営業窓口まで、お問い合わせください。
  • Q02評価ボード購入後、最初にすることは?
  • A評価キット同梱の用紙を参照し、当社へご登録いただきます。
    ご登録後、下記を提供いたします。
    ・評価ボードを購入いただいたお客様専用サイトアクセス用のID, password
    ・音声作成ツールのライセンスファイル
    ・お客様専用のキーコード
  • Q03キーコードって何?
  • A弊社より提供する、お客様個別に割り当てられる、アルファベットと数字から構成されるID 文字列です。音声作成ツール、LSI双方に必要になります。
  • Q04評価ボードって、Host CPUと接続して評価できるの?
  • A出来ます。
    評価ボード上にHost CPU接続用端子がございます。
  • Q05評価ボードをそのまま量産に使いたい。
  • A申し訳ございませんが、できません。
    お客様ご評価用のボードです。
  • Q06評価ボードを使用するに当たり準備するものってあるの?
  • Aスピーカー、評価用PCをご用意ください。(FTDIのドライバーが必要になる場合がございます)
  • Q07評価ボードの回路図ってあるの?
  • A評価ボードユーザーマニュアルに掲載しております。
    評価ボードユーザーマニュアルは、評価ボードを購入いただいたお客様専用サイトからダウンロードいただけます。
  • Q08評価ボードのBOM Listってあるの?
  • A評価ボードユーザーマニュアルに掲載しております。
    評価ボードユーザーマニュアルは、評価ボードを購入いただいたお客様専用サイトからダウンロードいただけます。

HW系

  • Q01S1V50300経由で、Host CPUからSPI-Flashに書き込むことはできますか?
  • A可能です。
  • Q02入力クロックのzの許容精度は?
  • A±50ppmです。
  • Q03Host InterfaceがUARTで音声ストリーミングできますか?
  • A転送レートが低く、リアルタイムの音声出力が出来ないためできません。
  • Q04CNF端子って、High, Lowに固定していい?
  • ACNF1, CNF2 端子は起動時動作モード設定完了後、出力状態となりますので、必ずプルアップ/プルダウン抵
    抗を用いて設定して下さい。直接HVDD またはVSS への接続は動作に支障を及ぼすため絶対に行わないで下さい。
    また、CNF1, CNF2 端子からプルアップ/プルダウン抵抗までの配線長は極力短くして下さい。
  • Q05コーデックは、Wolfson社WM8974以外は不可?
  • AAKM社AK4957も使用可能ですが、音声認識LSIからAK4957に出力するアナログクロックを基板上で2分周いただく必要がございます。このクロックにノイズ等がのると、音声認識機能に悪影響が出ますので、気を付けて実装いただく必要がございます。
  • Q06シナリオライブラリ格納領域はどこですか?
  • AHost CPUのメモリ領域、または外付けSPI-Flashとなります。

SW系

  • Q01KEYCODEってどこで設定するの?
  • AISC_TEST_REQです。
  • Q02コマンドでボリューム設定できるの?
  • AISC_DAC_VOLUME_REQによって、ボリュームを設定できます。
    音声ファイルのボリューム振幅が大きい場合など、コマンドでゲインを上げることで、サチってしまうことがありますので、十分にご評価ください。
  • Q03繰り返し再生は可能でしょうか。
  • Aはい、コマンドで設定できます。
  • Q04UARTでHost CPUからストリーミング転送できるの?
  • Aストリーミング再生を行う場合は、音声ファイルであるEOVファイル(*.eov)を転送してください。EOVファイル(*.eov)は、ESPER2で作成されるプロジェクトの『project_name/sound/eov』に生成されます。
  • Q05ストリーミング再生では、何を送ればいいの?
  • Aストリーミング再生を行う場合は、音声ファイルであるEOVファイル(*.eov)を転送してください。EOVファイル(*.eov)は、ESPER2で作成されるプロジェクトの『project_name/sound/eov』に生成されます。
  • Q06RTS, CTSの役割は?
  • AホストとS1V50300は、RTS、CTSを使用しハンドシェイクを行います。RTS(Request-To-Send)信号およびCTS(Clear-To-Send)信号で制御を行い、ハンドシェイクによるメッセージの受信を行います。
  • Q07ブートモードって?
  • A初期化データの転送、UARTの通信条件の設定などを行うモードです。転送、設定完了後はメインモードに移行してください。
  • Q08メインモードって?
  • A音声認識、音声再生による音声対話を実行する動作モードです。
  • Q09SPI-Flashブートって?
  • A起動時にS1V50300 が外付けSPI-Flashから初期化データ、UARTの通信条件の設定を自動的にロードするモードです。Host CPUから転送、設定いただく必要はありません。
  • Q10初期化データって何?
  • AS1V50300 の内部パラメータの設定値の変更などを目的として使用するものです。
  • Q11初期化データって必ず必要?
  • A必ず必要です。
  • Q12初期化データってどこで入手できるの?
  • A評価ボードを購入いただいたお客様専用サイトからダウンロードいただけます。
  • Q131度の選択肢は50以下とのことですが、それを超える時間や数字などの設定などは可能ですか?
  • A制限はございますが、可能です。シナリオライブラリ作成ツールにサンプルがございますので、参照ください。

外付け部品

  • Q01推奨するアナログコーデックは?
  • AWolfson社製WM8974(評価ボードcottage搭載)
  • Q02推奨するSPI-Flashは?
  • ASPANSION
    ・S25FL032P:32Mbit
    ・S25FL208K:8Mbit
    Macronix
     MX25L6406EM2I
    他製品であっても、インターフェイス仕様、コマンド仕様、電圧などが同一であれば接続可能であると考えられますが、タイミング仕様等が異なることもございますので、お客様にてご評価をお願いいたします。
    SPI-Flashの選定は、Flash選定マニュアルを参照ください。
  • Q03ROM WriterでSPI-Flashに書き込んでもいいの?
  • A問題ございません、書き込みは0番地からでお願いします。
  • Q04マイクを筐体に組み込む際の注意点がれば教えてください。
  • Aマイクをできるだけ話者の正面に配置すること
    筐体表面とマイクとの距離は、極力小さくすること。可能な限り筐体と密着することが望ましい。
    筐体に開ける音孔は、極力大きくする。マイクの直径と同等程度(6mm~10mm)が望ましい。
    振動による影響を抑えるため、マイクロフォンの周囲にゴムブッシングなどの防振材を配置する。
  • Q05マイクに必要な特性を教えてください。
  • A50Hz~16kHzの周波数特性がフラットなもの。
    特定の周波数領域で減衰しないもの。
    懸念されるのは、マイクを筐体に組み込む際の共振による周波数特性の変化です。
  • Q06エラー信号ってあるの?
  • AISC_ERROR_INDがございます。

異常

  • Q01通信できない。
  • AS1V50300メッセージプロトコル仕様書を参照ください。
    ・CNFの設定は正しいか?
    ・メッセージコマンドは適切か?
    ・送信データのMSB/LSBは適切か?
    ・I2CのスレーブID(0110110)は適切か?
    ・RTS, CTSの制御は適切か?
  • Q02音がならない
  • A下記確認ください
    ・弊社より連絡させていただいたキーコードが、音声作成ツールに正しく設定されているか、またISC_TEST_REQコマンドで正しく音声LSIに送信されているか?
    ・キーコード設定のMSB/LSBは正しいか?
    ・外付けアナログコーデックとの接続、設定は適切か?
  • Q03Host InterfaceがSPIで音声ストリーミング送信しているが、音声が途切れる
  • A音声の転送が間に合っていないことが考えられます。ISC_START_RCV_IND受信後、すぐにデータ転送を行う、Host側で通信速度を上げるなどの対応をお願いします。
  • Q04音声認識できない。
  • A以下を確認ください。
    下記確認ください。
    ・シナリオライブラリは正しいか?
    ・音声認識選択肢用データの送信、指定は正しいか?
    ・音声認識選択肢用データ名は12バイト以下か?
    ・外付けアナログコーデックとの接続は正しいか?
    ・ISC_ADC_VOLUME_REQでのvolume_selectの設定は適切か?