
當前位置:
門鎖網>
門鎖新聞>
門鎖周邊>
詳情
手機版最新留言:
使用手機微信“掃一掃”功能,掃描以下二維碼,即可將本文分享到“朋友圈”中。
2024-06-23 編輯:中國門鎖網 來源:網絡 瀏覽數(shù):6120
是不是感覺和以往聽到的機器合成音有些不一樣,似乎是真人?不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語音合成技術生成。作為國內專業(yè)的對話式人工智能平臺...
是不是感覺和以往聽到的機器合成音有些不一樣,似乎是真人?
不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語音合成技術生成。
作為國內專業(yè)的對話式人工智能平臺型企業(yè),思必馳自主研發(fā)了全鏈路智能對話系統(tǒng),涵蓋聲學信號處理、語音識別與合成、性別/年齡/聲紋識別、自然語言理解、知識圖譜、對話管理、智能交互決策等技術鏈條。
思必馳在專注挖掘場景需求、不斷提升整體系統(tǒng)智能的同時,也關注單點技術的持續(xù)創(chuàng)新與突破。比如在語音合成領域,思必馳近年來率先推出多項技術,持續(xù)給客戶和終端用戶帶來更人性化、智能化的體驗。
2022年,發(fā)布單人千音,實現(xiàn)單個音色就能生成同時覆蓋多種語言、多種風格的語音合成聲音,極大豐富了合成語音的表現(xiàn)力;
2022年,推出發(fā)音人音色定制平臺,支持客戶自主完成語音合成音色模型定制,降低語音合成定制門檻;
2022年,針對智能客服推出高情感、高擬人度的“多情感TTS”;
2022年,發(fā)布“千語千訓”系統(tǒng),零人工介入、自動更新模型,語音識別系統(tǒng)更新頻率實現(xiàn)了從周級到天級的跨越;
2023年,發(fā)布“聲音復刻”技術,僅需錄制一句話即可復刻出自己的音色,支持任意文本的朗讀;
2023年,發(fā)布自然場景數(shù)字人生成技術,個性化對話生成與語音合成模型無縫結合,構建可自由交互的個性化IP;
2023年,發(fā)布支持基于生成擴散模型的零樣本高質量語音編輯,支持中文及英文,能夠像文本一樣去修改音頻......
而今天,思必馳又推出了一項全新的技術:超自然語音合成,即基于語音特征離散化技術和大語言模型等,降低預測連續(xù)語音特征的難度,還原真人說話細微的韻律特點、發(fā)音口癖,讓合成效果更加自然、真實且富有表現(xiàn)力。該項技術適用于AI數(shù)字人、新聞播報、智能客服、智能助理等眾多應用場景。
(在線體驗)
拿捏真人說話的“藝術”,高度還原細節(jié)
與傳統(tǒng)TTS生成聲音的刻板、不接地氣、缺乏真人聲音的抑揚頓挫等相比,超自然語音合成的最大特點就是能夠高度還原真人說話時的細節(jié),特別是語氣詞、吸氣聲、停頓等。
當我們和朋友聊天時,語氣詞、吸氣聲、停頓以及字音拖長等語言現(xiàn)象經常出現(xiàn),這些語言現(xiàn)象并不是隨意的,而是自然而然產生的:
“啊”、“哦”、“嗯”等語氣詞能夠傳達說話人的情緒,吸氣聲表現(xiàn)了說話人在思考或準備說話時的心理狀態(tài),猶豫時的停頓反映了說話人的不確定性,字音拖長則強調了某個詞語的重要性......
當細微的韻律特點和發(fā)音口癖被還原時,你能感受到語音的生動性和自然性,仿佛是在與真實的人進行交流。
以銀行智能客服場景為例,用戶感受到的是與“真人”溝通的親切感和舒適度。
然而,要實現(xiàn)這樣完美的語音合成效果并不容易,需要先進的語音處理技術和大量的真實語音數(shù)據(jù)來訓練合成模型。與此同時,還需要對語音學和語言學有深入的理解,以便能夠準確地捕捉和復現(xiàn)語音中的細微差別。
關鍵技術創(chuàng)新突破,捕捉真人語音特點
為了還原真人說話效果,思必馳對韻律的多樣性進行了深入研究,并將語音特征離散化應用到語音合成領域。
語音特征離散化是指將連續(xù)的語音信號轉換為一系列離散值的過程。這種離散值通過使用自監(jiān)督(Self-Supervised Learning,SSL)模型提取得到,而自監(jiān)督模型則使用海量語音數(shù)據(jù)訓練得到。在語音生成的過程中,用聲音模型將文本轉換成語音特征,離散化處理可以降低模型預測連續(xù)語音特征的難度,使其更容易捕捉到自然和多樣化語音的特點。
2022 年 4 月份,思必馳首席科學家、上海交通大學計算機系教授俞凱博士帶領的研究團隊發(fā)表了將語音特征離散化技術應用于文本到語音生成的關鍵成果,即《 VQTTS: High-Fidelity Text-to-Speech Synthesis with SelfSupervised VQ Acoustic Feature 》,這是業(yè)界首次將語音特征離散化應用于從文本到語音生成的建模,使語音生成效果取得了突破性進展。
在思必馳和上海交通大學計算機系跨媒體語言智能實驗室的共同努力下,基于VQTTS 技術的思必馳情感音色悅悅取得了高達 4.7 的 MOS 分數(shù),達到業(yè)內一流水平。
思必馳也將VQTTS 技術應用于超自然語音合成,結合大語言模型技術的成果,以及海量自然風格的數(shù)據(jù),思必馳超自然語音合成技術可以更好地捕捉語言的韻律和語調,從而生成更貼近人類發(fā)音的語音。
全新的語音交互體驗,賦能千行百業(yè)多場景
羅伊·澤扎納在《未來生活簡史》一書中提到,三場科技革命將在未來改變人類的工作、生活和思維方式。這三場革命分別是:個性化制造革命、智能革命和生物革命。在智能革命中,計算機開始模仿人類的部分語言和思維能力,人類也在此過程中得到提升。
思必馳DFM-2大模型已經在智能家居、電商客服、在線教育、智能汽車等眾多場景落地應用,基于語音大模型技術的超自然語音合成,將讓更多產品具有更好的人機交互體驗,讓更多用戶體驗到了科技創(chuàng)新的成果:
在線上教學場景中,學生可以聽到自然、流暢且富有感情的授課內容,激發(fā)學習熱情;在居家生活場景中,不僅能分享自己的喜怒哀樂,還能得到“真人”情感上的安慰和支持。
每一次科技進步,都讓人類的生活更美好?;诔匀徽Z音合成技術,思必馳成將為千行百業(yè)的不同場景提供“真人”個性化聲音,助力開啟全新的語音交互之旅。
掃描下方二維碼,輸入文本即可獲得一段自然流暢、聲情并茂的“真人”音頻,快去動手試試吧。
想了解這個項目,請聯(lián)系我!
我想加盟,請將項目的資料發(fā)給我。
請問我所在地區(qū)有加盟商了嗎?
想了解此項目的加盟流程,請聯(lián)系我!
請問加盟此項目需投資多少錢?
版權與免責聲明:
凡未注明稿件來源的內容均為轉稿或由企業(yè)用戶注冊發(fā)布,本網轉載出于傳遞更多信息的目的,如轉稿涉及版權問題,請作者聯(lián)系我們處理。我們對頁面中展示內容的真實性、準確性和合法性均不承擔任何法律責任。
如內容信息對您產生影響,請及時聯(lián)系我們修改或刪除。
13520832007
今天已經有 298 人獲取加盟資料
2025北京木門展,中國木門網采訪洛克曼智能鎖何總
2024門鎖網專訪凱理五金王總
2024門鎖網專訪三彪名派智能鎖黃總
隨著人工智能技術和物聯(lián)網技術的完善和普及,智能家居已經進入到千家萬戶,在消費升級背景下,智能門鎖已然成為智能家居市場的一大風口。
為了探尋飛利浦智能鎖的起步歷程和未來規(guī)劃,我們特地專訪了飛利浦銷售總監(jiān)劉志丹先生,希望能夠找到飛利浦成功的奧義所在,為行業(yè)的良性發(fā)展帶來一些啟示和靈感。
中居聯(lián)杯·2024年度門鎖及智能鎖十大品牌獲獎名單
2024門業(yè)及定制家居品牌峰會暨中居聯(lián)杯·2023年度木門及門墻柜整裝十大品牌表彰盛典圓滿落幕
飛利浦智能鎖采用半導體指紋傳感器,識別靈敏度高,不僅能透過皮膚表皮層去采集更精細的指紋細節(jié),還具備指紋認證修復功能。
隨著人們安全意識的不斷提高,家庭安防正在成為智能家居產品中日益崛起的一部分,其中涉及到的產品包括家用攝像機、智能門鎖、智能貓眼、智能門鈴、門磁傳感器、紅外報警器等等。據(jù)相關數(shù)據(jù)統(tǒng)計,家庭安防類設備在2...
CEEASIA亞洲三大專業(yè)消費電子展之一、一年一度的消費電子全產業(yè)鏈大會 —— CEEASIA亞洲消費電子展(北京)將于2022年6月25日-27日在中國北京亦創(chuàng)國際會展中心舉行。10月25日,中新展...
讓加盟更誠信 讓選擇更放心
立即咨詢做有權威的品牌