除以標(biāo)準(zhǔn)的詞序列中詞的總個數(shù)的百分比,即為wer。計(jì)算公式如下:其中,s為替換的個數(shù),d為刪除的個數(shù),i為插入的個數(shù),n為漢字總數(shù)。通過上述測評,不斷的修正整個模型的內(nèi)容,以實(shí)現(xiàn)模型的理想輸出結(jié)果。具體訓(xùn)練過程中,每訓(xùn)練200次,就在驗(yàn)證集上進(jìn)行一個驗(yàn)證,并記錄下驗(yàn)證集的wer,終將結(jié)果統(tǒng)計(jì)成如圖3所示的在驗(yàn)證集中,隨著訓(xùn)練次數(shù)steps的疊加,整體wer終收斂至%,終在測試集中獲得了wer為%,綜上所述本發(fā)明的基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的端到端語音識別系統(tǒng),通過將注意力機(jī)制融合卷積神經(jīng)網(wǎng)絡(luò)中,并通過使用ctc損失函數(shù)構(gòu)建完整的語音識別網(wǎng)絡(luò)模型,實(shí)現(xiàn)深度學(xué)習(xí),從原始語音數(shù)據(jù)中提取語音的語譜圖作為cnn的輸入,以提高語音的性能,減少了人工提取特征帶來的信息損失,具有良好的應(yīng)用前景。本申請實(shí)施例還提供一種基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的端到端語音識別系統(tǒng),該系統(tǒng)用于執(zhí)行前述任一項(xiàng)上述。具體地,參見圖4,圖4是本申請實(shí)施例提供的一種定位裝置的示意框圖。本實(shí)施例的裝置包括:語音接收單元310、頻譜獲取單元320、構(gòu)建模型單元330、訓(xùn)練模型單元340。語音接收單元310,用于接收整段語音,并將該段語音歸一化后進(jìn)行切分。頻譜獲取單元320。能夠助力企業(yè)實(shí)現(xiàn)端到端自動化的RPA平臺,亦能夠推動企業(yè)快速實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。西藏供應(yīng)鏈端到端軟件
在本申請說明書和所附權(quán)利要求書中使用的術(shù)語“和/或”是指相關(guān)聯(lián)列出的項(xiàng)中的一個或多個的任何組合以及所有可能組合,并且包括這些組合。如在本說明書和所附權(quán)利要求書中所使用的那樣,術(shù)語“如果”可以依據(jù)上下文被解釋為“當(dāng)...時(shí)”或“一旦”或“響應(yīng)于確定”或“響應(yīng)于檢測到”。類似地,短語“如果確定”或“如果檢測到[所描述條件或事件]”可以依據(jù)上下文被解釋為意指“一旦確定”或“響應(yīng)于確定”或“一旦檢測到[所描述條件或事件]”或“響應(yīng)于檢測到[所描述條件或事件]”。參見圖1,是本申請實(shí)施例提供的一種識別方法的示意流程圖,如圖所示該方法可包括:101:采集語音數(shù)據(jù),將整段語音數(shù)據(jù)進(jìn)行統(tǒng)一歸一化處理后依據(jù)數(shù)據(jù)庫標(biāo)簽進(jìn)行切分??梢岳斫獾氖?,整段語音是根據(jù)所收集到的語音數(shù)據(jù)中的語音間隔時(shí)間來決定的,通過對話中的停頓來實(shí)現(xiàn)語音的斷句,將一段連續(xù)的話作為整段語音,在收集到該語音之后,在整個語音端上執(zhí)行數(shù)據(jù)的歸一化,歸于的區(qū)間是以0點(diǎn)作為對稱中心,本實(shí)施例中,歸一化的范圍采用[-1,1],歸一化前后語音數(shù)值為零處所表達(dá)的物理意義不變,均是無聲段。切分時(shí),根據(jù)數(shù)據(jù)庫標(biāo)簽對統(tǒng)一歸一化處理的語音進(jìn)行切分。西藏供應(yīng)鏈端到端軟件在企業(yè)流程管理過程中,端對端對企業(yè)的快速反應(yīng)、增效降本以及提升競爭力,都有著重要作用。
霍尼韋爾攜端到端供應(yīng)鏈整體解決方案亮相CeMATAsia2018滿足從制造商到零售商的一站式應(yīng)用需求2018年11月6日,中國上海―《財(cái)富》全球500強(qiáng)之一的多元化、高科技先進(jìn)互聯(lián)工業(yè)企業(yè)霍尼韋爾(紐交所代碼:HON)攜一系列軟件及硬件產(chǎn)品技術(shù)亮相亞洲國際物流技術(shù)與運(yùn)輸系統(tǒng)展覽會(CeMATAsia2018),展示從制造商到零售商的端到端供應(yīng)鏈整體解決方案。這些創(chuàng)新解決方案將于2018年11月6日至9日在上海新國際博覽中心W2展館館A2展臺展出。近年來,隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)以及數(shù)字經(jīng)濟(jì)的發(fā)展,供應(yīng)鏈行業(yè)正朝著信息化、智慧化方向轉(zhuǎn)變。與此同時(shí),新零售、新電商等新型商業(yè)模式的出現(xiàn)在為品牌商和制造商的倉儲物流體系帶來挑戰(zhàn)的同時(shí)也帶來了新的發(fā)展機(jī)遇,互聯(lián)物流、智能倉儲等智慧供應(yīng)鏈解決方案應(yīng)運(yùn)而生,成為影響相關(guān)企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵因素?;裟犴f爾針對各類商品,為供應(yīng)鏈條上從制造商到零售商提供端到端的整體供應(yīng)鏈解決方案,從軟件到硬件,從互聯(lián)工廠、互聯(lián)運(yùn)輸、互聯(lián)倉儲再到互聯(lián)零售,充分滿足企業(yè)在智慧供應(yīng)鏈發(fā)展趨勢下的新需求。
用于將切分的語音數(shù)據(jù)利用傅里葉變換獲取頻譜數(shù)據(jù)。構(gòu)建模型單元330,用于將注意力機(jī)制與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合,構(gòu)建完整的語音識別網(wǎng)絡(luò)模型。訓(xùn)練模型單元340,用于利用語音數(shù)據(jù)作為訓(xùn)練內(nèi)容,優(yōu)化模型參數(shù),將詞錯誤率作為優(yōu)化目標(biāo)訓(xùn)練模型。上述語音接收單元310將整段語音的范圍歸一化至以0點(diǎn)為對稱中心的閾值范圍,其中歸一化前后的整段語音在數(shù)值為零處所表達(dá)的物理意義均是無聲段。作為一種可選的實(shí)施方式,歸一化的范圍采用[-1,1],歸一化前后語音數(shù)值為零處所表達(dá)的物理意義不變,均是無聲段。切分時(shí),根據(jù)數(shù)據(jù)庫標(biāo)簽對統(tǒng)一歸一化處理的語音進(jìn)行切分。其中數(shù)據(jù)庫為語音學(xué)家建立的用于研究語音識別的專業(yè)數(shù)據(jù)庫,本實(shí)施例中數(shù)據(jù)庫采用清華大學(xué)所建立的用于研究語音識別的專業(yè)數(shù)據(jù)庫,是在安靜的辦公室環(huán)境下,通過單個碳粒麥克風(fēng)錄取的,總時(shí)長超過30個小時(shí)。大部分參與錄音的人員是會說流利普通話的大學(xué)生。采樣頻率16khz,采樣大小16bits。根據(jù)數(shù)據(jù)庫標(biāo)簽切分后,獲得10000條有效語音,其中,500條語音作為驗(yàn)證集,500條語音作為測試集,其余作為訓(xùn)練集,語音的數(shù)據(jù)長l為343208,持續(xù)時(shí)間約為。上述頻譜獲取單元320。一句話概括就是端到端是由無數(shù)的點(diǎn)到點(diǎn)實(shí)現(xiàn)和組成的,但又絕不簡單等同于點(diǎn)到點(diǎn)的累加。
具體用于對所切分的語音進(jìn)行分幀加窗處理后利用快速傅里葉變換獲取頻譜。作為一種可選的實(shí)施方式,上述頻譜獲取單元320,包括:分幀單元321,決定切分語音的幀數(shù)。本實(shí)施例中,分幀處理中幀長i為1024,幀間重疊率p為25%,獲大幀數(shù)h為447。加窗單元322,按上述方法加窗后,每一幀的起始段和末尾端會出現(xiàn)不連續(xù)的地方,所以分幀越多與原始信號的誤差也就越大。加窗就是為了解決這個問題,使分幀后的信號變得連續(xù),每一幀就會表現(xiàn)出周期函數(shù)的特征。在語音信號處理中一般加漢明窗。本實(shí)施例中,增加的窗函數(shù)為hamming窗w(n,α),其的計(jì)算公式如下,w(n,α)=(1-α)-αcos(2πn/(n-1)),0≤n≤n-1。其中,α取值,n為n的取值范圍,表示hamming窗的長度??焖俑道锶~變換單元323,對語音進(jìn)行快速傅里葉變換得到其頻譜,由于其頻譜為對稱式,所以只取其一半長度??焖俑道锶~變換的公式為:上述構(gòu)建模型單元330用于將注意力機(jī)制與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合,構(gòu)建完整的語音識別網(wǎng)絡(luò)模型。可以理解的是,本申請中通過將注意力機(jī)制引入卷積神經(jīng)網(wǎng)絡(luò)中,注意力機(jī)制通過兩個全連接層a和b相乘實(shí)現(xiàn),其中全連接層b作為注意力權(quán)重。企業(yè)級的端到端流程再造,就是要從部門級流程到企業(yè)級端到端流程。西藏供應(yīng)鏈端到端軟件
RPA同時(shí)解決了端到端中的自動化與集成化,同時(shí)讓業(yè)務(wù)流程更加精簡。西藏供應(yīng)鏈端到端軟件
隨著國內(nèi)不少行業(yè)信息化中臺系統(tǒng)規(guī)劃,中臺ERP服務(wù)平臺的成長演變并與國際市場密切接軌,市場對專業(yè)、及時(shí)、獨(dú)到的內(nèi)容分析需求日益增強(qiáng)。以用戶為中心進(jìn)行精細(xì)化運(yùn)營,提升用戶閱讀體驗(yàn)和內(nèi)容獲取效率,成為了各個行業(yè)的轉(zhuǎn)型焦點(diǎn)。大批品牌商紛紛涌入這個行業(yè),并非是這個行業(yè)之幸,因?yàn)椴还軅鹘y(tǒng)型有限責(zé)任公司還是現(xiàn)代型的,都避不開一個問題那就是“商業(yè)模式大同小異”會員分銷的方式進(jìn)行發(fā)展。這對自有流量和選品能力都提出了極高的要求。新誕生的商務(wù)服務(wù),不但可實(shí)現(xiàn)跨系統(tǒng)、跨協(xié)議的服務(wù)互通,更可以為企業(yè)提供一體化、自動化解決方案 ,減少系統(tǒng)開發(fā)周期,助力企業(yè)數(shù)字化升級飛速落地。企業(yè)圍繞中高級別客戶日益增長的多層次品質(zhì)人生的需求,不斷豐富完善信息化中臺系統(tǒng)規(guī)劃,中臺ERP服務(wù)平臺的同時(shí),還陸續(xù)推出適合中產(chǎn)階級品味的生活化服務(wù)。西藏供應(yīng)鏈端到端軟件
首匯信息技術(shù)河北有限公司位于新石北路368號金石創(chuàng)新大廈105室,交通便利,環(huán)境優(yōu)美,是一家服務(wù)型企業(yè)。首匯信息技術(shù)是一家有限責(zé)任公司企業(yè),一直“以人為本,服務(wù)于社會”的經(jīng)營理念;“誠守信譽(yù),持續(xù)發(fā)展”的質(zhì)量方針。公司始終堅(jiān)持客戶需求優(yōu)先的原則,致力于提供高質(zhì)量的信息化中臺系統(tǒng)規(guī)劃,中臺ERP服務(wù)平臺。首匯信息技術(shù)順應(yīng)時(shí)代發(fā)展和市場需求,通過**技術(shù),力圖保證高規(guī)格高質(zhì)量的信息化中臺系統(tǒng)規(guī)劃,中臺ERP服務(wù)平臺。