音视频技术如何为元宇宙提供全真稳的全新体验之漫话腾讯云音视频 | 社区征文

社区征文

目录

引言

        多年积累后的“全真稳”腾讯音视频

        多面手,腾讯云音视频有多“全”?

        身临其境,腾讯云音视频有多“真”

        固若金汤,腾讯云音视频有多“稳”

        真实案例,看腾讯云音视频如何满足音视频一线开发需求


引言

元宇宙已经不是一个全新的概念,它更多的是融合了众多技术于一身的一个集合体,包括AR、VR、区块链、云计算等技术媒介。而所有的这些概念组成的元宇宙呈现出来的载体都将是音视频,音视频技术将助力元宇宙时代的快速到来,音视频技术开发商将成为元宇宙开发中重要一员。

首先,需要说明的是本文纯属音视频技术的回顾和展望,不带任何指向性。 现在,国内音视频技术开发商众多,比如腾讯、阿里、华为、京东、声网等,不过音视频技术仍然需要底层资源与技术实践的长久积累。以腾讯为例,腾讯在音视频方面的技术积累最早可以追溯到QQ独霸一方的时候,从QQ到微信,作为国民级的应用,它们的用户体量巨大,其中的语音和视频服务(例如QQ语音、微信视频等等),都经历了大量用户并发的技术考验。

多年积累后的“全真稳”腾讯音视频

在服务技术开发者的时代,腾讯云依托腾讯超过21年的音视频技术积累而建立并对外提供技术服务。目前,腾讯云在全球拥有27 个地理区域,68个可用区,2800+加速节点以及超过200Tbps带宽储备。国际研究机构IDC曾就中国音视频解决方案市场发布过三份专题报告,腾讯云都占据了一席之地。

image.png

此外,腾讯云音视频在网络资源的多年积累下,具备了RT-ONE™全球网络,实现融合了实时音视频通信网络(TRTC)、即时通信网络(IM)、流媒体分发网络(CDN),为音视频技术传输和并发奠定了最稳固的网络基础。

现在,腾讯云音视频提供实时音视频、云直播、云点播、即时通信、云渲染等完整的 PaaS 产品体系,并以 All in One SDK 的方式为开发者提供音视频能力。音视频技术开发者可以实现一次接入,处处调用,灵活组合,快速上线。

腾讯多年积累的丰富内容和视频、版权等能力,也在腾讯云音视频中得以发挥作用。腾讯云音视频打造了集内容汇聚、视频生产处理、内容版权与分发于一体的云创多媒体引擎,为全真互联网丰富的内容呈现,提供云端创作能力。

在积累了以上所有的音视频技术能力之后,现在,腾讯云音视频已经可以满足开发者多元的音视频开发需求,真正实现“全、真、稳”的音视频开发服务。

多面手,腾讯云音视频有多“全”?

详细拆解来看,我们能看到腾讯云音视频目前产品应用覆盖全面,不仅服务自家产品,比如QQ、微信、企业微信、腾讯会议等,还服务于其他热门应用,比如快手、哔哩哔哩、央视频等。通过对外输出坚实的底层PaaS能力,帮助企业和用户实现全面的互联互通。

image.png

另外,在音视频能力中,腾讯云音视频不仅包含通用解决方案,还包括行业解决方案以及微信相关解决方案。其中,通用解决方案涉及架构云、基础产品、计算场景、数据处理、大数据、人工智能、区块链、物联网、安全、数据上云、多媒体、云渲染、设计。行业解决方案涉及医疗、金融、音视频、文旅与出行、教育、传媒、交通物流、游戏、电商、制造、政务、智能终端、地产、能源与资源。

随着音视频技术的深入和创新应用,要求技术开发商可以提供更多的使用场景,腾讯云音视频涉及音视频互动、直播推流、美颜特效、视频剪辑、超级播放器等。同时支持多场景终端,包括 iOS、Android、Web、小程序、Flutter、Electron、ReactNative等。

上面提到的基础设施的网络资源,需要音视频服务能够覆盖更全面的地域,国内国外均有布点。目前,腾讯云在全球拥有27 个地理区域,68个可用区,2800+加速节点,超过200Tbps带宽储备。

对于“全”的特性,属于产品和服务的横向扩展能力,腾讯云音视频服务能够应用到众多的产品、解决方案和使用场景中,说明了该产品定位准确,适用性强的特点。特别是全终端支持的场景,基本上所有的项目都会对此提出要求,一整套统一的 SDK 对于上层业务的逻辑开发会有非常大的助力作用。

身临其境,腾讯云音视频有多“真”

能够达到无损、无延迟的音视频感受其实有很多技术指标上的要求,比如直播互动场景中,整体延时需要保证在500毫秒以内,才不会让我们有沟通上的不适;视频画面最好保证1080P的分辨率,如果在移动端设备上观看,720P基本上就够用了。

在视频低码率技术上,腾讯云音视频实现了低码高清,超低码率却带来高清体验。腾讯云的明眸方案提供了超分、片源修复等多种功能,帮助用户提升视频画质。在保持视频画质质量不变的情况下,最多可以降50%的码率,减少视频传输和存储的成本。

在音频降噪技术领域,需要技术服务商提供更优秀的音质,扩展语音带宽结合AI降噪。基于先进的轻量级神经网络,腾讯云音视频提供将3min以内带噪语音去除噪声的服务,具有速度快、效果好的优点,广泛应用于语音采集过程、语音后期应用预处理等领域。

除了更低码率更高画质,视频增强也是音视频领域的重要技术点。腾讯云音视频实现了超分、片源修复,以提升视频画质。腾讯明眸研究团队的画质增强研究工作主要是应用到编码优化前的前置处理阶段,提供了画质修复和增强的能力。通过传统算法和深度学习模型消除片源中的噪点和压缩效应,增强细节去除模糊,提升色彩质量,并解决由于分辨率和帧率低面卡顿不清晰等缺陷。

image.png

对于“真”的特性,无非就是视频画面更加高清,声音更加清晰,但是这需要一定的码率和带宽做支撑,很多时候由于网络因素的限制,这往往是很难满足的。在实现高清画面和清晰声音的同时还能降低码率,需要非常深厚的技术功底。腾讯云音视频团队的发力点是正确的,在视频上考虑压缩问题,因为视频数据占比最大,在音频上考虑降噪问题,因为相比视频画面,人们对音频质量更加敏感。

固若金汤,腾讯云音视频有多“稳”

真实的音视频体验需要建立在稳定的服务基础之上,试想一下,一款产品可以在所有的终端和应用场景中提供近乎真实的音视频体验,但是经常崩溃死机,用户也不会买账吧,那么腾讯云音视频“稳”的特性又体现在那些方面呢?

稳固的音视频传输,需要网络技术的深厚积累。腾讯云的RT-ONE™网络,同时将TRTC实时音视频通信网络,IM即时通信网络,CDN 流媒体分发网络整合成一个集合网络,底层技术复用,互相融合,互相赋能,避免技术栈不统一导致的一系列兼容性问题。

另外,腾讯云在全球已经拥有接近3000个CDN加速节点,而且数量还在持续增长中。除了自建的节点之外,腾讯云还在与第三方合作伙伴合作,引入第三方的节点。不仅如此,腾讯云还拥有200Tbps+ 带宽储备,日通话时长超过31分钟,以及10亿多多IM全球月活。这些都是技术巨头长久积累的底层资源与技术实力。

image.png

在音视频传输中,另一个重要的问题是数据安全,需要保证音频、视频、IM、账号等数据的安全传输与应用。腾讯云音视频提供了云加密机(符合国密局和金融行业标准的数据加密服务)、数据安全中心(依托AI算法以及云上数据系统的深度对接,帮助企业发现并解决数据安全风险)、数据安全审计(高性能人工智能数据安全审计,实时掌握数据安全风险趋势)、数据保险箱(更高安全系数的企业核心数据存储服务)。

对于“稳”的特性,应该是一切产品和服务的基础。稳,一方面体现在产品和服务的可持久化运行,没有bug和崩溃;另一方面体现在数据安全上,很多行业对于数据安全都有严格的要求。很多项目在验收时,数据安全都会是重点考察的内容之一。

总的来说,腾讯云音视频的三大特性:全、真、稳。其中,稳是一切的基础;真是在音视频技术深度上的体现;全是在基于稳和真两个特性扩展出来的横向扩展能力,就像房子有了坚实的地基,才能大搞上层建筑一样。实际上,技术研发人员很多时候也是最关心产品和服务的稳定性。

真实案例,看腾讯云音视频如何满足音视频一线开发需求

在实际开发应用中,很多视频开发者与视频技术服务提供商也都在大量引入腾讯音视频的能力,下面通过自己参与的两个比较重要的项目案例来具体介绍。

在某大型国有金融机构一体化项目中,用户要求视频会议场景必须全终端支持,也包括微信小程序。经过研究,决定整个项目只采购一家云服务厂商的服务,为的就是避免之前由于多云混用导致的一系列问题。其中,遇到的最棘手的问题之一是MCU模块的音画不同步问题,花费了大量时间去排查原因。因为客户需要支持微信小程序终端,腾讯云音视频的微信解决方案在某些场景中具备一定的优势,因此最终项目选择了腾讯云音视频。笔者认为腾讯云音视频团队可以在这个方向上继续发力,因为目前微信小程序的音视频延时比较大,另外费用也比较高。

在另一个某大型汽车厂商智能泊车项目中,用户使用了腾讯云的对象存储服务和云点播服务。之所以没有自研相关的服务,是因为存储服务布点和云点播CDN分发都需要投入大量成本。而测试过程中,腾讯云服务面对大并发上传和大并发点播观看时,整体表现稳定。腾讯云音视频让用户节省了很多在云存储和云点播方面人力和时间上的投入,可以全力去做自己的业务处理内容,在一定程度上保证了该项目试运行的稳定和顺利验收。

提供技术开发能力的服务商,绝非一朝一夕可得。技术开发服务的背后,是各家公司长久的实践,对产品与技术的打磨,才能最终将技术能力开放,为开发者提供稳定的技术能力和服务。全真互联网时代以及更宏大的元宇宙,音视频技术必将发挥至关重要的作用,也是技术界与开发者的全新机会,音视频行业的未来,也是值得开发者重点关注的一个就业方向。

文章来源:https://xie.infoq.cn/article/636d3cfe75d5ec62b3e0f3e5d

作者简介:😄大家好,我是 Data-Mining(liuzhen007),是一位典型的音视频技术爱好者,前后就职于传统广电巨头和音视频互联网公司,具有丰富的音视频直播和点播相关经验,对 WebRTC、FFmpeg 和 Electron 有非常深入的了解,😄公众号:玩转音视频。同时也是 CSDN 博客专家、华为云享专家(共创编辑)、InfoQ 签约作者,欢迎关注我分享更多干货!😄

137
1
0
0
关于作者
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论