一個虛擬數(shù)字人的落地需要經(jīng)歷從內(nèi)容策劃,到建模、綁定動畫、虛擬、配音等需要多方面協(xié)作,而如果數(shù)字人開源平臺的搭建,或許是快速推進行業(yè)標準化發(fā)展的有效手段。無規(guī)矩不成方圓。來日數(shù)字人產(chǎn)業(yè)生態(tài)如何完善?數(shù)字勞動力標準化如何定義?還需要經(jīng)歷更多的評估和測試。但可以預(yù)見,各行各業(yè)對虛擬數(shù)字人發(fā)展趨勢的認可。由于虛擬數(shù)字人行業(yè)仍處于培育期,上下游產(chǎn)業(yè)平臺的缺失,在很大程度上制約產(chǎn)業(yè)化發(fā)展,同時也為該產(chǎn)業(yè)的投資豎立了“無形門檻”,而且制作方式自動化較低、生產(chǎn)門檻高、關(guān)鍵技術(shù)不夠成熟,以及技術(shù)人才、綜合人才的缺乏,也使得數(shù)字人難以體系化發(fā)展。數(shù)字人在線上還可以提供一種新的交互方式。東莞音視貝AI虛擬數(shù)字人
什么是AI虛擬數(shù)字人?“數(shù)字人”是通過計算機技術(shù),將人體結(jié)構(gòu)數(shù)字化,在電腦屏幕上出現(xiàn)看得見的、能夠調(diào)控的虛擬人體形態(tài)。進一步將人體功能性信息賦加到這個人體形態(tài)框架上,經(jīng)過虛擬現(xiàn)實技術(shù)的交叉融合,這個“數(shù)字人”將能模仿真人做出各種各樣的反應(yīng)。若設(shè)置有聲音和力反饋的裝置,還可以提供視、聽、觸等直觀而又自然的實時感。因此,在以往的報道中,又將數(shù)字化人的部分研究工作,稱之為“可視人”或“虛擬人”?!疤摂M人”這個名詞,需要經(jīng)歷4個發(fā)展階段,即“虛擬可視人”、“虛擬物理人”、“虛擬生理人”和“虛擬智能人”,這4個階段不一定截然分開,各階段的內(nèi)容也可能交叉重疊。其原理是通過先進的信息技術(shù)與生物技術(shù)相結(jié)合的方式,在計算機上操作可視的模型,包括人體的各部分和細胞等,建成生物網(wǎng)絡(luò)化的流程,即從由幾何圖形的數(shù)字化“可視人”到真切實感的數(shù)字化“物理人”,再到隨心所欲的數(shù)字化“生物人”。東莞音視貝AI虛擬數(shù)字人虛擬數(shù)字人效率高,能大幅減少人力成本。
數(shù)字人是藝術(shù)化與結(jié)構(gòu)化的3D模型 另一個重要的區(qū)別是,數(shù)字人是結(jié)構(gòu)化的3D模型,其中不包括AI換臉或初始三維掃描的成果。對于不熟悉3D管線的人來說,“結(jié)構(gòu)化”意味著其數(shù)據(jù)已經(jīng)組織好,并且已經(jīng)經(jīng)歷了使其“可以投入生產(chǎn)”的某些步驟。相反,因為用戶無法完全控制3D對象,AI換臉或初步的三維掃描是非結(jié)構(gòu)化的。數(shù)字人的制作需要經(jīng)歷一些列生產(chǎn)管線(ProductionPipeline),期間3D藝術(shù)家會負責它的重新拓撲、紋理化和綁定,以確??梢栽谥谱髦惺褂?。
AI虛擬數(shù)字人的使用:AI虛擬數(shù)字人是依托ASR、TTS、NLP等技術(shù),實現(xiàn)智能語音交互,支持多輪對話和插話功能。在線下,虛擬數(shù)字人可以在相關(guān)部門、醫(yī)院、銀行、消費場所等場景里提供簡單的客服功能。數(shù)字人的主要應(yīng)用場景是在銀行、相關(guān)部門辦事部門、醫(yī)院等,與來辦事的民眾做一些簡單互動與引導,做虛擬助手。在相關(guān)部門以及醫(yī)院這樣的單位,民眾若不知道辦事流程或者歸屬部門,以往需要專門安排一個人做這事,對這個員工來講,挺考驗?zāi)托暮拓熑涡牡?,在職業(yè)上也缺乏成就感。對此,虛擬數(shù)字人便有了用武之地。關(guān)于虛擬人的商用,大眾首先會聯(lián)想到虛擬偶像、虛擬演員等影視、游戲產(chǎn)業(yè)的應(yīng)用。
虛擬數(shù)字人市場之所以熱起來,除了需求的催生,還與AI技術(shù)不斷成熟有關(guān)。虛擬數(shù)字人較早是通過手工繪制的,現(xiàn)在通過CG(computer graphic,電腦繪圖)實現(xiàn),較近5年深度學習算法取得突破,使得數(shù)字人制作的過程得到了有效的簡化,數(shù)字虛擬人正朝著智能化、便捷化、精細化和多樣化方向發(fā)展。虛擬數(shù)字人的通用系統(tǒng)框架主要包括了人物形象、語音生成模塊、動畫生成模塊、音視頻生成顯示模塊、交互模塊等。虛擬數(shù)字人制作過程涉及建模、驅(qū)動、渲染三大關(guān)鍵技術(shù)。從建模來看,靜態(tài)掃描建模仍是主流,動態(tài)光場三維重建初現(xiàn)端倪。從驅(qū)動的角度來看,智能合成、動作捕捉、遷移是數(shù)字人目前主流的動作生產(chǎn)方式。從渲染的角度看,隨著硬件能力的提升和算法的突破能夠?qū)⒄鎸嵭院蛯崟r性大幅提升。AI虛擬數(shù)字人以電子屏、全息設(shè)備等為載體。東莞音視貝AI虛擬數(shù)字人
虛擬數(shù)字人市場之所以熱起來,除了需求的催生,還與AI技術(shù)不斷成熟有關(guān)。東莞音視貝AI虛擬數(shù)字人
AI驅(qū)動,多形態(tài)“虛擬數(shù)字人”花樣百出 目前,超寫實“虛擬數(shù)字人”、仿真“虛擬數(shù)字人”、卡通“虛擬數(shù)字人”等多種形態(tài)的“虛擬數(shù)字人”花樣百出。從技術(shù)角度出發(fā),這些多形態(tài)“虛擬數(shù)字人”主要應(yīng)用了動態(tài)三維重建、CG結(jié)合動作捕捉、仿真人體模型、卡通建模結(jié)合語音合成等AI技術(shù)。其背后,是機器學習新算法(深度學習)的出現(xiàn)、運算力的提升、數(shù)據(jù)量的上漲、計算機視覺“基礎(chǔ)設(shè)施”的日益精進等,這些都為“虛擬數(shù)字人”提供了充分的“養(yǎng)料”。東莞音視貝AI虛擬數(shù)字人
杭州音視貝科技有限公司專注于人工智能領(lǐng)域智能語音、智能圖像、虛擬數(shù)字人等產(chǎn)品的研發(fā),通過將人工智能技術(shù)與企業(yè)服務(wù)場景深度融合,助力企業(yè)智能化升級,幫助企業(yè)降本提效、升級用戶體驗、挖掘更多的營銷價值,致力于為企業(yè)提供營銷、服務(wù)、運營、管理一站式智能化解決方案。
公司堅持科學發(fā)展,將技術(shù)研發(fā)和人才培養(yǎng)作為公司的發(fā)展目標,團隊成員來自于華為、阿里巴巴、螞蟻金服、同盾科技、金蝶軟件等企業(yè),擁有多年人工智能與企業(yè)服務(wù)相關(guān)產(chǎn)品研發(fā)和商業(yè)化經(jīng)驗,專注于智能語音、語義理解、語義分析、語音網(wǎng)關(guān)等人工智能技術(shù)的研究與應(yīng)用,在音視頻互動領(lǐng)域有長期的技術(shù)積累能力和商業(yè)實踐。
在此基礎(chǔ)上結(jié)合ASR、NLP、TTS和人臉識別等技術(shù),打造出了智能客服、智能外呼、智能質(zhì)檢、智能語音機器人、虛擬數(shù)字人、智能媒資等產(chǎn)品。團隊擁有出色的商業(yè)化和項目交付能力,已成功積累了多個行業(yè)的成功案例,目前已服務(wù)于曹操專車、中移在線、贛南醫(yī)學院等多家單位。
未來公司將會進一步探尋技術(shù)領(lǐng)域,提供更專業(yè)、更符合各行業(yè)發(fā)展方向的智能外呼、智能客服、智能語音網(wǎng)關(guān)、虛擬數(shù)字人等產(chǎn)品,提供SAAS及PAAS的應(yīng)用服務(wù),保持研發(fā)技術(shù)持續(xù)走在行業(yè)前沿,實現(xiàn)長足發(fā)展。