定位為戰(zhàn)略先導(dǎo)產(chǎn)業(yè),深入推進(jìn)“人工智能+”行動。這一系列舉措旨在推動人工智能在多個領(lǐng)域的創(chuàng)新應(yīng)用,賦能千行百業(yè)。4月7日,趣丸科技正式發(fā)布其首款搭載SOTA模型的AI語音應(yīng)用——趣丸千音(AllVoiceLab),標(biāo)志著中國在全球語音技術(shù)領(lǐng)域的進(jìn)一步崛起。
趣丸千音是一個全球領(lǐng)先的AI語音創(chuàng)作平臺,提供一站式的智能語音解決方案。平臺集成了文本轉(zhuǎn)語音、視頻翻譯、多語種合成等功能,為影視動漫、有聲讀物、新聞傳媒以及文旅導(dǎo)覽等行業(yè)提供了全流程的內(nèi)容創(chuàng)作革新。該應(yīng)用的推出,為用戶帶來了前所未有的沉浸式體驗(yàn),也確立了趣丸科技在國際語音應(yīng)用領(lǐng)域的領(lǐng)先地位。
在技術(shù)層面,趣丸千音依托MaskGCT模型,憑借其在語音相似度、準(zhǔn)確率、質(zhì)量和穩(wěn)定性上的優(yōu)勢,超越了同類產(chǎn)品。該模型由趣丸科技與香港中文大學(xué)(深圳)共同研發(fā),采用了創(chuàng)新的掩碼生成模型和語音表征解耦編碼技術(shù)。MaskGCT曾登頂GitHub趨勢榜,被業(yè)界譽(yù)為“最強(qiáng)AI語音模型”。訓(xùn)練數(shù)據(jù)集“Emilia”為模型提供了多樣化的高質(zhì)量語音資源,這使得模型在跨語言生成和風(fēng)格遷移方面展現(xiàn)出了卓越的性能。
趣丸千音的應(yīng)用場景十分廣泛,尤其是在影視動漫、有聲讀物和在線教育等領(lǐng)域。其微短劇功能的推出,使得這款產(chǎn)品在媒體與泛娛樂行業(yè)的市場需求中大放異彩。根據(jù)《2024全球數(shù)字內(nèi)容產(chǎn)業(yè)報告》,僅在媒體及泛娛樂領(lǐng)域的多語言翻譯需求規(guī)模就已經(jīng)超過650億美元,趣丸千音正逐漸成為這一賽道的核心基礎(chǔ)設(shè)施。
以微短劇為例,國家廣播電視總局國際合作司的數(shù)據(jù)表明,中國微短劇在海外的應(yīng)用已經(jīng)超過300款,全球下載量逾4.7億次。隨著短劇的快速發(fā)展,譯制劇正在加速成為出海內(nèi)容的主體。這一過程中,傳統(tǒng)的人工譯制流程因周期長、成本高昂而成為短劇作品國際傳播的瓶頸。趣丸千音的視頻翻譯功能可以在12小時內(nèi)完成1000分鐘劇集的譯制工作,相比人工方式提升了10倍以上的效率,且成本降低超過15倍。這一工業(yè)化進(jìn)程將推動短劇出海,為中國優(yōu)秀文化作品注入新活力。
目前,廣州市正在按照市委、市政府的工作部署成立產(chǎn)業(yè)辦,專門推進(jìn)與人工智能相關(guān)的各項(xiàng)工作。通過搭建便捷、優(yōu)質(zhì)的AI+行業(yè)應(yīng)用服務(wù)基地,集聚產(chǎn)業(yè)生態(tài)合作伙伴,廣州推動AI技術(shù)的應(yīng)用和產(chǎn)業(yè)化,加速人工智能的實(shí)際落地。這一系列策略不僅將為趣丸科技的未來發(fā)展奠定基礎(chǔ),也將推動整個行業(yè)的健康發(fā)展,促進(jìn)人工智能的更廣泛應(yīng)用和普及。返回搜狐,查看更多