精选文章
最热文章
音视频杂谈
SDK 教程
开发者实践
更多专栏
开源技术
声网产品与方案
资讯
月度小报
前端与跨平台
视差图像—— 了解 2D 图像新方法
https://miro.medium.com/max/1200/1*T2UzD6ZjHrkmCaJzcSSd7g.gif 视差图像演示图片网址 我们都看过 3D 电影、幻觉图像,并且了解制作它们的诀
AgoraTechnicalTeam
2021-07-26
实时流直播 FPS:视频帧率高级指南 [2021 年更新]
不用再特意强调在线直播视频 比以往更受欢迎,现在已有超过85%的美国互联网用户每月都会观看在线视频。如果你没有在线内容,那可能会错过 85% 的潜在客户。 虽然你可能会因此被说服并拿起相机拍摄一段短
AgoraTechnicalTeam
2021-07-24
视频比特率-入门知识
不确定将哪些设置比特率的视频用在你的最新项目?现在深入了解我们的指南,我们会告诉你需要知道的一切! 当谈及视频制作时,很容易被大量现有的技术信息淹没,尤其是当这些信息会因为你使用的平台或软件不同而不同
AgoraTechnicalTeam
2021-07-19
视频编码基础:你需要知道的一切
什么是视频编码?简单来说,编码是将原始音视频内容的格式压缩和转换为数字文件或格式的过程,这反过来会使视频内容兼容不同的设备和平台。编码的主要目标是压缩内容以占用更少的空间。我们通过删除无用的信息来做到
AgoraTechnicalTeam
2021-07-14
音频的基础知识
这个音频基础知识的音视频程序是Audio Basics系列讲座中的第一个讲座。它概述了声音的基本原理及其在音乐制作工作中的重要性。随后的音频程序将为此处概述的主题提供更多详细信息。 音频的基础知识是
AgoraTechnicalTeam
2021-07-12
OpenCV 简介
1_feZWR5Gy-M8GiQqyy8fxyw.png1280×720 310 KB 表中的内容 图片介绍 安装 输入 读取图像 读取视频 访问网络摄像头 将图像转换为灰度、模糊、hsv 边缘
AgoraTechnicalTeam
2021-07-08
基于机器学习的语音编解码器声网Agora Silver:支持超低码率下的高音质语音互动
从 1860 年电话发明,到现如今通过网络进行语音互动,语音始终是最自然、最基础的实时互动方式。过去几年,语音实时互动成为越来越多人日常生活的一部分。但是每个人都会遇到弱网环境,这会直接影响语音通话体
JeffZ
2021-07-02
Android FFmpeg 流媒体边播放边录制功能
前面 FFmpeg 系列的文章中,已经实现了音视频的播放、录制已经添加滤镜等功能,本文将用 FFmpeg 实现流媒体的边播放边录制功能。 流媒体 流媒体(英语:Streaming media) 是指将
ByteFlow
2021-06-30
使用深度学习进行音频源分离
0_i4eFG46Lz7n8dT_Q.jpg960×639 112 KB 听觉超能力 想象一下,当你走进一个拥挤嘈杂的自助餐厅,并将所听到的各个说话者的噪音“分离”,这就是音频源分离的问题:将输入
AgoraTechnicalTeam
2021-06-29
音视频学习 -- 弱网对抗技术相关实践
背景介绍 实时音视频通话在当前的生活中是无时不刻存在的,包括社交、安防、交通等等各个方面都需要。用户场景复杂多变、要求严苛、网络环境不一致等给实时音视频通话带来很大条件。我们在这方向稍微做了一些工作,
fengtao86520
2021-06-16
DSS如何实现RTSP协议支持与分发处理
xie.infoq.cn DSS如何实现RTSP协议支持与分发处理 1.项目概要:本文主要分析DSS流媒体服务的如何实现RTSP协议支持与分
BeSmart
2021-06-15
基于DSS框架开发一个GB28181协议插件
xie.infoq.cn 基于DSS框架开发一个GB28181协议插件 1.项目概要:本文主要介绍GB28181协议概念、应用场景,以及如何
BeSmart
2021-06-15
这可能是介绍 Android UvcCamera 最详细的文章了
设备外接 usb 摄像头,进行基本的预览、拍照、录像。相信有些同学在工作中有遇到类似的需求。 usb 摄像头在 Android 设备上,应用的确很广泛,我之前公司做的是车载产品,众所周知,现在汽车上是
1689606425
2021-06-14
【经验分享】RTC 技术系列之视频编解码
要了解什么是视频编解码,首先我们需要了解什么是视频 视频归根结底是一系列连续的图像帧,当这些图像以一定速率播放时,人眼就会判断其是连续活动的,这样就构成了音视频。 那为什么要进行视频编解码呢,因为视频
bakedcorn
2021-06-13
用Python将采访数据从视频转录成文本
用语音识别将音视频转换为文本,添加GUI并使用线程来提高性能 1_y8FAErxlCe5yOH1AsniCcQ.jpeg875×1312 249 KB 图片来自Pexels的Anna Shvets
AgoraTechnicalTeam
2021-06-10
用 OpenCV 和 Face-Recog 进行实时人脸识别
嘿,这是我要在网上写的第一篇文章,正如你看到的标题,是关于人脸识别的,现在让我们开始吧。 你可以从 这里 查看我 Github 存储库中的代码。 导入 来,让我们导入 OpenCV (你可以从这里安
AgoraTechnicalTeam
2021-06-08
什么是赫夫曼编码?
赫夫曼编码算法是许多压缩算法的基础,如DEFLATE–用于PNG图像格式和GZIP格式。 关注赫夫曼编码的原因? 你将会知道: 我们如何在不丢失任何数据的情况下开展压缩活动? 为什么有些事物的压缩效
AgoraTechnicalTeam
2021-06-01
用Python轻松实现语音转文字
0_UcL_V3oY7u8FfWBK.jpeg1024×440 41.3 KB 来源:《信息时代》的屏幕截图 语音是最常见的交流手段,世界上绝大多数人都依靠语音进行交流。而语音API识别系统能将口
AgoraTechnicalTeam
2021-05-29
用于音视频分类的递归神经网络
1_nC-7RkjK_kn8bC3RAZRgdw.jpeg1289×1036 307 KB 图片由作者提供 使用tensorflow进行音视频分类的深度学习入门教程 递归神经网络 RNN或递归神经
1046165834
2021-05-27
NDK 开发中 Native 方法的静态注册与动态注册
那些鼓吹碎片化学习的人,登上了高楼,撤掉了梯子,然后对楼下众人说道: 我们就是这样飞上来的。真正重要的收获,往往都来自持续艰难的思考。 Native 方法的静态注册 NDK 开发中,通过 jav
ByteFlow
2021-05-24