全部社区征文图像处理编解码RTC直播流媒体协议播放器技术服务知识库视频服务视频云计算云存储E3PO边缘计算前端2023总结智能语音交互技术大讲堂BMF大数据Meetup
展开 
音视频E3PO
https://github.com/bytedance/E3PO近些年来,不管是学术界还是工业界,360视频传输吸引了人们越来越多的注意力。随着Meta、PICO等知名品牌头显销量激增,以及苹果公司推出其首款空间计算设备,360视频及其应用的前景正在迅速扩大。与传统2D视频相比,360视频的特点是传输数据量更大、对于交互时延的要求更高。由于其整体系统的复杂性,目前还没有一个普遍认可的360视频传
音视频BMF
https://github.com/BabitMF/bmf被誉为"稳定的火山",ByteDance旗下的全新多媒体处理框架BMF正在获得广泛关注。本文将为大家带来从入门到高阶的BMF知识体验之旅,让更多人了解和使用这套功能强大的跨平台框架。什么是BMF?BMF即Babit Multimedia Framework,中文称为"火山引擎多媒体框架"。它是一个通用的多媒体处理框架,通过提供简洁易用的
音视频2023总结
在2023年,作为一名工程师,我坚持的爱好有阅读、写作、coding,战绩为阅读书籍20+,写作80余篇,爱好项目5个左右,完成了从后端向嵌入式的转行,也增长了一岁,19岁大三,虽然offer暂无,但是能力见长,但愿明年能成功找到一份满意的工作,完成从学生到工程师的彻底转变!本文主要围绕2023年,我从0开始创作的几个音视频的嵌入式项目。这是2023年3月份左右创作的一个项目,当时差不多学了有半个
音视频E3PO视频服务
E3PO,全称Epic 3D Pose,是一款为360°视频传输方法提供多样性实验环境的开放平台。其多功能性使其成为研究人员和开发人员在360°视频领域中进行创新和实验的理想选择。本节将更详细地介绍E3PO的特性和对360°视频传输的支持。E3PO不仅仅是一个360°视频传输模拟器,更是一个支持多种不同方法和策略的实验平台。它的设计目标是为用户提供一个可灵活定制的环境,以满足不同场景和需求的实验要
音视频技术服务知识库视频服务视频云
近日,抖音发布亚运会观赛报告。报告显示,亚运会期间抖音赛事直播,运动员、工作人员互动,冠军访谈等内容精彩纷呈。9月19日-10月8日,抖音亚运会赛事直播累计获62亿人次观看,“杭州亚运会”话题视频播放量超过503亿。作为持权转播商,抖音对亚运会全程进行了免费、无贴片广告、4K超高清直播。9月23日亚运会开幕,有最高264万人同时在抖音收看直播。“数字人火炬手”“大莲花”等多个记忆瞬间镌刻在屏幕前的
音视频技术服务知识库视频云视频服务
《跟着德爷闯东非》是 Pico 一款全新的 6DoF 互动纪录片。主角由在全球拥有 530 万粉丝的明星探险家德爷(Edward James Stafford)担任。观众以第一视角摄影师的身份陪伴德爷一起冒险,近距离观察野生动物,体验非洲大草原的野外生存之旅。与行业内常见的不具备互动性的 3DoF 实拍纪录片以及不具备写实性的游戏引擎制作的 6DoF 纪录片不同,《跟着德爷闯东非》纪录片的拍摄采用
音视频智能语音交互
声音(目标声音和噪音)一起被智能硬件的麦克风(阵列)采集到,在智能硬件的芯片上通过预处理之后,然后再送往云端进行ASR(语音转文字)。而很多智能硬件识别效果不好的主要原因是因为预处理,也就是声学处理没有做好,才导致识别效果不好。 就像人耳朵一样,没听清楚讲话内容,可不得乱猜一通!现在,云端的语音识别(ASR)可以通过SDK/API进行调用,大厂提供的识别接口背后所使用的算法和效果基本都差不多。毕竟
音视频技术服务知识库
据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》显示,截止到 2022 年 6 月我国网络直播用户规模达到了 7.16 亿,占网民整体的 68.1%。最主要原因是 2020 年度疫情期间导致居家办公和休闲娱乐的人数呈现激增,新媒体互动直播成为了广大网民最重要的休闲娱乐方式之一。随着直播产业链的不断扩展完备升级,相关产业链各个环节分工逐渐明确且各环节参与人数逐步增多;为了满足不同的就业需
音视频技术服务知识库
无论你是不是一个短视频爱好者,视频化的场景也已经覆盖了你生活的方方面面。QuestMobile数据显示,截止到2023年5月,中国移动视频行业整体用户规模达到10.76亿,月人均时长达到64.2小时。即便没有这些数据统计,日常的生活已说明了一切。早上到公司后,你一边上电梯,一边打开手机观看汽车的“自动泊车”是否顺利;10点的第一个会议需要通过视频与外地的同事进行沟通;午休时间你和暑假在家的孩子通了
音视频技术服务知识库视频云视频服务
随着全行业视频化的演进,营销、知识、商业和空间的交互体验正在被重塑,将会直接影响到您的用户留存和业务增长。火山引擎视频云特推出「产品月刊-云上新视界」,与业界分享基于亿级DAU沉淀的音视频领域产品动态、技术干货、实践案例和市场活动,助力企业打造“面向体验”视频化能力,驱动业务良性增长。月度更新,更多动态,尽在视频云产品月刊。8月22日,火山引擎视频云&AIGC技术大会上,火山引擎视频云就技术底座、
音视频直播
据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》显示,截止到 2022 年 6 月我国网络直播用户规模达到了 7.16 亿,占网民整体的 68.1%。最主要原因是 2020 年度疫情期间导致居家办公和休闲娱乐的人数呈现激增,新媒体互动直播成为了广大网民最重要的休闲娱乐方式之一。随着直播产业链的不断扩展完备升级,相关产业链各个环节分工逐渐明确且各环节参与人数逐步增多;为了满足不同的就业需
音视频视频云流媒体协议
人工智能与智慧城市是当前热门的话题和概念,通过将人工智能技术应用在城市管理和服务中,利用自动化、智能化和数据化的方式提高城市运行效率和人民生活质量,最终实现城市发展的智慧化,提升城市居民的幸福感。AI技术在城市中的应用主要体现在以下几个方面:1)城市交通:利用人工智能技术实现交通拥堵监测、优化路线规划、智能导航等功能,可以减少交通拥堵和出行时间,提高城市运行效率。2)智能公共管理:通过建立数据中心
音视频RTC
实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备、多人、多噪音场景下,为用户提供听得清、听得真的体验。作为 RTC 方案中不可或缺的技术,语音增强技术正从传统的基于统计学习的方案向基于深度学习的方案融合演进,利用 AI 技术,可以在语音降噪、回声消除、干扰人声消除等方面实现更好的语音增强效果,
音视频图像处理RTC直播
中国历史悠久,文化底蕴深厚,文物数目众多,文物作为前人智慧的结晶,其文献价值不言而喻。古籍是记录中华文明的重要载体,也是流传至今的宝贵文化遗产,文物保护也是一项长期重要的基础工作。全国2800多家图书馆收藏有超过5000万册的古籍,其中1/3存在不同程度的破损。按现有的文物修复人员数量,需要数百年的时间才能把馆藏文物全部修复好。《古籍寻游记》是字节跳动联合中国第一历史档案馆、敦煌研究院、甘肃简牍博
音视频RTC
RTC 是一个“发布-订阅”系统,我们在发布端和订阅端做的很多关于画质、性能、卡顿、延时的优化,在经过网络传输之后,不一定能够达到端到端的最优效果。本文介绍 RTC 如何通过发布端和接收端的联动优化,为用户提供更佳的视频通话体验。这是一个多人 RTC 系统的示意图,左边是发布端 Pub(Publisher),右边是接收端 Sub(Subscriber),把视频流从发布端通过一连串的媒体级联服务器送
音视频RTC
在音视频业务中,QoS(Quality of Service,技术服务质量指标)和 QoE(Quality of Experience,用户体验指标)并不是一个新的话题。相较于传统流媒体业务,RTC 业务方兴未艾,人们对其关注的点从过去的 QoS 指标转向用户体验 QoE,并进入了“数据驱动业务增长”的探索实践阶段。那么,RTC 的用户体验究竟是什么?体验要如何衡量?QoS 的变化对 QoE 的影
音视频编解码
据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。字节跳动 AV
音视频编解码
2016 年,短视频应用崭露头角,并进入持续爆发式增长阶段;2019 年 3 月 1 日,工业和信息化部、国家广播电视总局、中央广播电视总台联合发布《超高清视频产业发展行动计划( 2019 - 2022 年)》,大力推进超高清视频产业发展和相关领域的应用;同年,电商直播开始引领新的消费模式;2020 年初,视频会议火遍全球;2021 年央视春节联欢晚会将首次采用 8K 超高清视频进行呈现,同时融入
音视频计算
近年来,云游戏这个概念渐渐被广大游戏爱好者所了解。顾名思义,云游戏就是利用部署在数据中心里的强大的云服务来进行游戏画面的渲染。在云端生成的游戏画面以视频流的形式借助高速网络实时地传递到用户的终端进行显示,用户可以在终端对游戏进行各种操控,体验和玩在本地运行的游戏毫无差别。云游戏服务让用户可以像浏览视频网站一样,很轻松地在线选择想玩的游戏,只需点击即可立刻进入游戏。既不用花时间下载安装,也不用担心本
音视频播放器
上图是火山引擎点播端到端的音视频解决方案架构图。点播端到端一般指视频从上传到播放所经历的全链路技术解决方案,涉及的主要技术模块包括上传 SDK 、视频处理与管理、 CDN 分发以及最终播放端的点播 SDK ****。在每一个环节里火山引擎点播中台都做了很多相关的技术优化和重点功能的迭代。随着我们服务的用户和业务越来越多,我们也经常收到实现极致体验的需求。于是,在近几年的主要工作中,我们面向用户体