从AI绘画、AI视频换脸再到当下爆火的ChatGPT,越来越多的 AI 生成类软件如雨后春笋般冒出来,AIGC(人工智能生成内容)也成为当今大数据时代下最热门的话题。
同样的,基于互联网的音频业务全球市场规模持续增长,在线音频业务平台生态和产品形态不断多样化,为互联网用户提供了播客、直播、社交、游戏等音频服务场景,提供了人工智能技术在业务广泛应用的行业实践空间。随着AIGC和大语言模型的技术突破,为音频互动产品提供了更多创新的可能性,通过AIGC和大语言模型技术赋能业务产品创新探索将成为未来的发展趋势。
(相关资料图)
近日,白鲸技术栈携手亚马逊云科技&伊克罗德&Intel,分别在北京、广州两地举办《乘“云”而上 数智AI并行》、《游戏行业创新发展研讨会》技术沙龙活动,来自亚马逊云科技、英特尔(中国)有限公司、荔枝集团、启元世界等嘉宾,探索如何用数据+人工智能+云技术,构建企业出海、游戏行业创新新路径。
从AI降噪到AIGC赋能音频业务
作为以音频为中心的社交和娱乐平台,荔枝集团是行业内为数不多拥有自研声音技术的平台。2022年,荔枝推出了自研技术综合平台“声音云”,荔枝一直在研究AI语音相关的核心底层技术,结合市场上的前沿技术成果,正陆续将AI语音、NLP等技术应用在产品中。
在技术沙龙中,荔枝集团以“AI降噪技术”为例,音频技术团队基于以站内海量内容数据,通过自研训练的AI降噪算法,可以有效抑制互动文娱场景下音视频通话过程中的背景噪声,并保证语音无损伤,最终有效提升在多种复杂场景下的实时互动体验。
荔枝资深音频算法工程师徐潇宇介绍,互动娱乐场景相比其他场景,其技术差异方向主要在不同外设的接入、多条通道的支持、变声美声的需求、声音的理解以及链路音质的提升等方面。跟会议场景声音源主要来源采集输入通道不一样,文娱场景为了丰富娱乐性,在主播端要支持音乐播放通道、音效播放通道、屏幕共享通道等。当主播进行才艺表演或播放音乐时,整个互动娱乐场景对于音质的要求就会提高。从音频体验来讲,要让用户像在本地一样声临其境沉浸式的参与到互动场景当中,不受各种身边噪音输入干扰,这成为了音频行业的一大技术难点。
徐潇宇现场演示了不同使用场景下的“AI降噪”效果。随着算力持续增长,基于大数据训练的AI语音降噪算法具有强大的能力,使实时AI语音降噪算法在互动娱乐场景中成为可能。相比于传统的降噪算法,荔枝技术团队自研的 AI 降噪的效果有巨大提升,对直播场景可能经常会遇到敲键盘、喝饮料、背景讨论等噪声能进行有效抑制乃至降低到最低影响。
除了音频底层技术赋能业务,荔枝还积极利用AIGC上的技术突破,为音频互动产品提供了更多创新的可能性。据悉,荔枝已经在旗下多款产品中应用AI语音技术,并上线了聊天机器人等创新功能。包括在旗下音频产品中上线了语音聊天机器人“小吱”。据了解,荔枝团队将自然语言处理NLP技术与语音识别ASR、语音合成TTS等AI语音技术相结合,在今年2月完成了语音聊天机器人原型开发,并上线了“小吱”机器人,为用户提供一种全新的智能语音聊天体验。
通过对自然语言处理NLP技术的深入研究和探索,荔枝在此前推出在线聊天机器人产品demo基础上,本次升级则结合荔枝在音频领域的技术能力,实现了AI语音技术的应用。在线语音聊天机器人通过语音识别ASR技术可实现语音输入内容的自动识别,并应用NLP技术进行自然语言智能分析并对语意做出判断和反馈,最后通过TTS技术实现语音回复的输出,使用户可以通过语音对话与语音聊天机器人进行互动,并收到符合语境的语音回复。
AIGC会是荔枝新增长极
据兴业证券研究报告,AIGC有望成为互联网下一阶段的增长驱动。Gartner 预计,2022 年AIGC 占全球数字数据量为1%,到2025 年,这一比例将提升至10%。应用领域广泛,如软件编程,医药研发,精准营销,影视娱乐等,除了内容产出的变革外,AIGC 也将有效的提高工作效率,减少工时。
对此,不少人可能已经体验过AIGC的魅力了。当然,随着ChatGPT的大火以及中国互联网科技公司的加入,其实AIGC已经进入了一路“狂飙”的阶段。
在海外,大厂纷纷布局,商业化速度快于预期。除了OpenAI 的ChatGPT 外,如谷歌推出聊天机器人Bard,英伟达推出AI Foundation 云服务。而在商业化方面,OpenAI 携手微软,已经在多个方面进行布局尝试,如搜索、Office 365 Copilot、Azure OpenAI 服务、Plugins、订阅等。此外Meta 发布通用图像分割模型SAM,有望加速自动驾驶发展。
而在国内,各家厂商也纷纷加速研发与投资进度。百度于3 月份上线文心一言,此外,阿里、商汤、昆仑万维等均于4 月份举办大模型发布会或产品发布会。由于大语言模型的开源,如Meta 的LLaMA,使得大语言模型开发在算法上的门槛降低,算力、数据、落地场景成为各家大厂重要看点。
AIGC的出现和应用,意味着基于AI技术延伸出的大规模商业时代即将来临。业内资深人士表示,对荔枝而言,抓住AIGC的机遇,持续进行前沿科技的研究和探索,进一步拓展相关技术的应用场景,包括实现语音聊天机器人在荔枝旗下音频产品中的落地,并结合音频产品的持续创新,丰富用户的声音社交、音频娱乐体验,“这有可能给荔枝业务带来新的增长极。”
数据显示,荔枝2022年第四季度营收为5.88亿元人民币,并连续第五个季度实现盈利。荔枝2022年营收21.85亿元,首次实现全年盈利,年净利润8650万元,相比2021年1.27亿元的净亏损,大幅实现扭亏为盈。易观文娱行业研究总监廖旭华认为,稳步提升的盈利能力都证明了荔枝商业模式的竞争力和可持续性。从目前不到1美元的股价来看,荔枝已经明显低于正常估值,随着未来荔枝集团的自研技术平台发展、营收稳定提升,国际化、AI聊天机器人业务等全面推进,荔枝估值将有望迎来新的爆发期。
关键词: