国产精品久久久久久久久软件,国产成人久久久精品二区三区,国产成人无码一区二区三区在线 ,大又大粗又爽又黄少妇毛片,国产精品成人aaaaa网站

首頁 新聞 工控搜 論壇 廠商論壇 產(chǎn)品 方案 廠商 人才 文摘 下載 展覽
中華工控網(wǎng)首頁
  P L C | 變頻器與傳動(dòng) | 傳感器 | 現(xiàn)場檢測儀表 | 工控軟件 | 人機(jī)界面 | 運(yùn)動(dòng)控制
  D C S | 工業(yè)以太網(wǎng) | 現(xiàn)場總線 | 顯示調(diào)節(jié)儀表 | 數(shù)據(jù)采集 | 數(shù)傳測控 | 工業(yè)安全
  電 源 | 嵌入式系統(tǒng) | PC based | 機(jī)柜箱體殼體 | 低壓電器 | 機(jī)器視覺
樂鑫語音之文字轉(zhuǎn)語音(TTS)
深圳市啟明智顯科技有限公司
收藏本文     查看收藏

今天,我們來研究樂鑫的語音助手框架ESP-Skainet其中的中文語音合成的例程。

編譯原例程

  1. 首先需要clone例程

git clone --recursive https://github.com/espressif/esp-skainet.git

該工程內(nèi)部自帶一個(gè)idf,是運(yùn)行的最佳版本,不過你任然可以使用自己的idf。

  1. 進(jìn)入例程中

cd  esp-skainet/examples/chinese_tts

  1. 理論上設(shè)置好了芯片型號(hào)為esp32s3后自動(dòng)調(diào)用sdkconfig.defaults.esp32s3配置文件。 但是實(shí)際上好像沒有,所以這里加一個(gè)步驟確保能使用上默認(rèn)配置。

cp sdkconfig.defaults.esp32s3 sdkconfig.defaults

  1. 設(shè)置芯片為esp32s3

idf.py set-target esp32s3

  1. 進(jìn)入menuconfig

idf.py menuconfig

修改Audio Media Hal -> Audio Hardware board 改成ESP32-S3-Korvo-1

  1. 編譯燒錄程序

idf.py flash monitor -p /dev/ttyUSB0

運(yùn)行原例程

運(yùn)行后,可以看到如下打印

歡迎使用樂鑫語音合成
I (266) tts_parser: unicode:0x6b22 -> huan1
I (266) tts_parser: unicode:0x8fce -> ying2
I (276) tts_parser: unicode:0x4f7f -> shi3
I (276) tts_parser: unicode:0x7528 -> yong4
I (286) tts_parser: unicode:0x4e50 -> le4
I (286) tts_parser: unicode:0x946b -> xin1
I (296) tts_parser: unicode:0x8bed -> yu3
I (296) tts_parser: unicode:0x97f3 -> yin1
I (306) tts_parser: unicode:0x5408 -> he2
I (306) tts_parser: unicode:0x6210 -> cheng2

請輸入短語:

簡化原例程并分析

原例程大致分為兩個(gè)功能,第一個(gè)功能是閱讀“樂鑫語音合成”這句話,還有一個(gè)功能是朗讀串口輸入的文字。 第二部分經(jīng)常會(huì)有bug,所以咱們簡化例程,重心分析第一個(gè)功能。簡化例程如下:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#include "freertos/FreeRTOS.h"
#include "freertos/task.h"
#include "esp_system.h"
#include "esp_tts.h"
#include "esp_tts_voice_xiaole.h"
#include "esp_board_init.h"

int app_main()
{

    ESP_ERROR_CHECK(esp_board_init(AUDIO_HAL_16K_SAMPLES, 1, 16));     // 初始化codec芯片,配置好采樣率、聲道數(shù)、采樣大小
    esp_tts_voice_t *voice = (esp_tts_voice_t *)&esp_tts_voice_xiaole; // 配置tts的聲音配置文件,來自libvoice_set_xiaole
    esp_tts_handle_t *tts_handle = esp_tts_create(voice);              // 創(chuàng)建tts對象
    char *prompt1 = "你好我是啟明云端";                                // 需要轉(zhuǎn)換的文字

    if (esp_tts_parse_chinese(tts_handle, prompt1)) // 文字解析成拼音
    {
        int len[1] = {0};
        do
        {
            short *pcm_data = esp_tts_stream_play(tts_handle, len, 3); // 拼音轉(zhuǎn)換成pcm音頻
            esp_audio_play(pcm_data, len[0] * 2, portMAX_DELAY);       //播放音頻
        } while (len[0] > 0);
    }
    esp_tts_stream_reset(tts_handle); // 重置 tts 流并清除 TTS 實(shí)例的所有緩存

    return 0;
}


這里音頻的tts來自靜態(tài)庫libvoice_set_xiaole中,目前也只有這一個(gè)音色可供使用,其余的tts相關(guān)函數(shù)則是屬于靜態(tài)庫libesp_tts_chinese。

總結(jié)

tts過度封裝化,一定程度上注定它的使用難度不高。但是依據(jù)已跑完的例程來看,音頻任然有發(fā)音聲音的問題,對于現(xiàn)在的一些成熟的tts方案,樂鑫的這個(gè)tts還有一定的差距,這個(gè)缺點(diǎn)可能導(dǎo)致無法應(yīng)用于商業(yè)化項(xiàng)目中。項(xiàng)目中如果涉及到語音轉(zhuǎn)文字的內(nèi)容,一方面可以通過云平臺(tái)的提供的API能力發(fā)送文字收取PCM音頻來解決。另一方面如果是有限的詞匯,也可以用語音拼接的方式,把相應(yīng)的音頻存到文件系統(tǒng)中,通過映射播放指定的內(nèi)容并拼湊成一段完整的語句。例如:“支付寶收款”、“元”、“個(gè)”、“十”、“百”、“千”、“萬”這幾段文字的語音就基本可以通過拼湊音頻達(dá)到支付寶語音播報(bào)功能。


 

狀 態(tài): 離線

公司簡介
產(chǎn)品目錄

公司名稱: 深圳市啟明智顯科技有限公司
聯(lián) 系 人: 楊楊
電  話: 0755-22670222
傳  真:
地  址: 南山區(qū)國際創(chuàng)新谷6棟A座8樓
郵  編: 518000
主  頁:
 
 
該廠商相關(guān)技術(shù)文摘:
啟明智顯分享|如何通過matter協(xié)議實(shí)現(xiàn)燈亮滅控制
啟明云端邀您免費(fèi)申領(lǐng)ESP32-C2樣品
啟明智顯分享|盤點(diǎn)86智能開關(guān)面板一季度行業(yè)頭號(hào)玩家們都發(fā)布了啥
啟明智顯解決方案|基于ESP32-S386智能開關(guān)面板\溫控器,低成本解決方案
啟明智顯分享| 2.4寸旋鈕串口屏在家用健身器材上的應(yīng)用
啟明智顯分享| ESP32學(xué)習(xí)筆記參考--LED PWM 控制器與MCPWM的配置
啟明智顯低成本4.3寸串口屏解決案~兩輪電動(dòng)力儀表DEMO
啟明智顯分享|4.3寸串口屏應(yīng)用于兩輪車儀表及充電樁
更多文摘...
立即發(fā)送詢問信息在線聯(lián)系該技術(shù)文摘廠商:
用戶名: 密碼: 免費(fèi)注冊為中華工控網(wǎng)會(huì)員
請留下您的有效聯(lián)系方式,以方便我們及時(shí)與您聯(lián)絡(luò)

關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 本站動(dòng)態(tài) | 友情鏈接 | 法律聲明 | 不良信息舉報(bào)
工控網(wǎng)客服熱線:0755-86369299
版權(quán)所有 中華工控網(wǎng) Copyright©2022 Gkong.com, All Rights Reserved