目前,热门的智能语音处理技能有身份识别,语种识别,语音识别、情绪识别、语音分离、语音合成等方向。那你知道这些语音处理技能中都会用到哪些标注方法吗?我们一起来看下
语音标注方法
语音洗濯
语音洗濯是对语音进行重新的审查和校验的过程,洗濯空音频,筛选出符合哀求的音频
数据洗濯的紧张包括:纠正缺点、删除重复项、统一规格、改动逻辑、转换布局、数据压缩、补足残缺/空值、丢弃数据/变量,语音洗濯也是一样的,其目的在于删除重复的信息,纠正存在的缺点,并供应语音同等性,助力语音识别模型演习,可运用于智能家居、智能设备、智能客服、聪慧门店等场景落地
语音转写
所听即所写,语音转写便是将语音数据转写成笔墨数据的过程,是数据标注领域比较常见的一种标注形式
ASR语音转写常用于客服、教诲培训机构、公安、法律、医疗、金融等领域
感情剖断
又称情绪标注,是针对一些对话数据,对音频内的人物措辞内容进行感情意图的剖断,比如:表达疑问、需求或投诉建议等等
情绪标注大致可划分为四类
一是主客不雅观分类;
二是情绪性分类,包括正面、负面 、中性;
三是情绪分类,是按范畴、维度或措辞学理论进行分类;
四是细致不雅观点划分,可分为实体、情绪、不雅观点持有者等;
同样一条语音内容,用不同的感情说出来,其所带有的语义可能是完备不同的,只有打算机同时识别出语音的内容以及语音所带有的感情,我们才能准确的理解出措辞的语义,因此理解语音的感情能让人机交互变得更故意义。
感情标注是语音识别中主要的一环,可被用于自动驾驶、机器人等浩瀚领域
语音切割
顾名思义,将语音中有内容代价的语音切割出来,正如大多数自然措辞处理问题一样,进行语音分割须要考虑到语境,语法和语义,作为数据供AI利用
声纹识别
声纹识别便是辨别某句话是否是某个人说的一种技能
声纹是范例的生物识别特色之一,当代科学研究表明,声纹具有特定性与相对稳定性的特点。
不同的人说话时所利用的发声器在尺寸和形态方面都各不相同,每个人的声纹图谱都有一定的差异,因此无论讲话者如何变换声音与腔调,其声纹却始终相同
声纹识别紧张运用在公安、法律等须要利用声纹鉴定职员身份的领域中;在日常生活中还被用于利用声纹密码进行身份认证,登录,授权,打卡、语音唤醒等
音素标注
措辞由语音、词汇和语法三部分要素组成,传统措辞学将其称作 “措辞三要素”,而音素则是从音色的角度划分出来的最小的语音单位
后来人们根据音素在发音过程中气流是否受到阻碍,将音素分为两大类,分别为元音音素和辅音音素
元音音素:发音时气流在口腔、咽头不受阻碍而形成的音叫元音
辅音音素:发音时气流在口腔、咽头受到一定程度的阻碍而形成的音哨子音
因此音素标注便是根据音标、组成音素和读音对语音进行标注
音律标注
韵律标注是要标注的韵律符号的位置,韵律是句子中字词之间的停顿。大多数情形下,一句话中不能完备没有停顿,总会涌现或长或短的停顿,这些停顿便是要标注韵律符号的位置。根据停顿长度不同,韵律符号也会相应发生变革
发音校正
发音校正便是对全体口语演习过程中的数据的采集以及对不标准的发音进行纠正的过程,发音校正可用于智能搜索中
语音标注与人工智能有着密切的关系,因此与语音标注干系的问题都值得我们重视和学习,本日的内容分享不知道对你在事情中是否有用呢?还想知道关于哪些方面的知识呢,欢迎私信我们,大家共同一起磋商