本文檔是開發(fā)者集成科大訊飛MSC(Mobile Speech Client,移動(dòng)語音終端)iOS版SDK的使用指南,定義了語音聽寫、語音識(shí)別、語音合成、語義理解,語音評(píng)測(cè)、語音喚醒,人臉識(shí)別等服務(wù)接口的使用。關(guān)于各服務(wù)接口更詳細(xì)的說明,請(qǐng)參考 [**MSC iOS API 文檔**](http://mscdoc.xfyun.cn/ios/api)。在集成過程中如有疑問,可登錄[語音云開發(fā)者論壇](http://bbs.xfyun.cn/),查找答案或與其他開發(fā)者交流。
#### **1. iOS語音SDK概述**
MSC SDK的主要功能接口如下圖所示:

#### **2. 業(yè)務(wù)描述**
為了更好地理解后續(xù)內(nèi)容,這里對(duì)文檔中出現(xiàn)的若干專有名詞進(jìn)行解釋說明,更為詳細(xì)的信息可查看官網(wǎng)文檔(http://www.xfyun.cn/doccenter/)中的語音服務(wù)部分。
<table>
<thead>
<tr>
<th style="
width: 65px;text-align:center;
">名詞</th>
<th style="
text-align:center;">解釋</th>
</tr>
</thead>
<tbody>
<tr>
<td>語音合成</td>
<td>將一段文字轉(zhuǎn)換為成語音,可根據(jù)需要合成出不同音色、語速和語調(diào)的聲音,讓機(jī)器像人一樣開口說話。</td>
</tr>
<tr>
<td>語音聽寫</td>
<td>將一段語音轉(zhuǎn)換成文本,把語音中的文字信息提取出來,并可以優(yōu)先識(shí)別用戶手機(jī)特有的聯(lián)系人和個(gè)性化數(shù)據(jù)。</td>
</tr>
<tr>
<td>語法識(shí)別</td>
<td>判斷用戶所說的內(nèi)容是否與預(yù)定義的語法相符合,主要用于識(shí)別用戶是否下達(dá)某項(xiàng)指令,使用語法識(shí)別前,需要先定義語法。</td>
</tr>
<tr>
<td>AIUI語義</td>
<td>在語音聽寫基礎(chǔ)上,分析理解用戶的說話意圖,返回結(jié)構(gòu)化的指令信息。開發(fā)者可在AIUI開放平臺(tái)定義專屬的問答格式。</td>
</tr>
<tr>
<td>語音評(píng)測(cè)</td>
<td>通過智能語音技術(shù)自動(dòng)對(duì)發(fā)音水平進(jìn)行評(píng)價(jià),給出用戶綜合得分和發(fā)音信息。</td>
</tr>
<tr>
<td>語音喚醒</td>
<td>即設(shè)備(手機(jī)、玩具、家電等)在休眠(或鎖屏)狀態(tài)下也能檢測(cè)到用戶的聲音,并根據(jù)聲音提示進(jìn)行相應(yīng)操作,開啟全語音交互,同時(shí)支持喚醒+識(shí)別、喚醒+語義的OneShot方案。</td>
</tr>
<tr>
<td>身份驗(yàn)證</td>
<td>在本方案中,開發(fā)者可根據(jù)應(yīng)用場(chǎng)景靈活的選擇身份驗(yàn)證方式,如單人臉驗(yàn)證、單聲紋驗(yàn)證以及人臉+聲紋的融合驗(yàn)證方式。這樣既解決了單生物特征識(shí)別暴露的局限性,也提供了更精準(zhǔn)、更安全的識(shí)別和檢測(cè)方案。身份驗(yàn)證方案還會(huì)持續(xù)增加更多的常用特征,達(dá)到更廣泛的市場(chǎng)應(yīng)用前景。</td>
</tr>
</tbody>
</table>
