精选文章
最热文章
音视频杂谈
SDK 教程
开发者实践
开源技术
声网产品与方案
资讯
月度小报
前端与跨平台
更多专栏
开源技术
声网产品与方案
资讯
月度小报
前端与跨平台
详解低延时高音质|编解码篇
语音社交已经出现了数十年,而近期的“互动播客”场景让音频互动再次成为业界焦点。如何提供好的音频互动体验?怎么优化音质?如何应对全球传输下的网络挑战?如何在高音质的基础上让声音更悦耳?我们将从今天开始
ChenYun
2021-11-23
REACT NATIVE 直播视频
流媒体是我们每天在 Instagram、Tik Tok、Twitter、Twitch 和 Youtube 等应用程序中随时都能看到的东西。在应用程序中拥有流媒体功能听起来有点困难,然而,对我们来说幸运
AgoraTechnicalTeam
2021-11-05
Javacv 音视频小工具 - 下载抖音视频
一、前言 大家好,俗话说的好,学习新的知识后要学以致用,在学习音视频的过程中,你有没有疑问,不知道音视频可以用来做什么。下面举几个例子,比较耳熟能详,被吹到风口的一些场景有:AI 视觉计算, AI
AgoraMarketingTeam
2021-10-30
Android 音视频 - EGL 源码解析以及 C++ 实现
OpenGL 是一个跨平台的 API,而不同的操作系统(Windows,Android,IOS)各有自己的屏幕渲染实现。所以 OpenGL 定义了一个中间接口层 EGL(Embedded Graph
AgoraMarketingTeam
2021-10-29
网络上用于游戏和 VR的音频!
0_JfFKaRTfeEkw0x4_1000×667 195 KB 图片由史蒂夫·哈维在Unsplash上提供 提示、技巧和入门 音频是为 Web 上的游戏和虚拟现实体验添加重要主题和沉浸感的基
AgoraTechnicalTeam
2021-10-28
音视频编解码 -- 编码参数 CRF
在这里插入图片描述1920×1080 362 KB 之前多多少少接触过一些编解码参数,CRF 参数也用过,但是最近在和朋友们聊天时,说到使用 FFMPEG 过程中碰到 CRF 参数,以及具体作用流
AgoraMarketingTeam
2021-10-27
【AI 全栈 SOTA 综述 】这些你都不知道,怎么敢说会 AI?【语音识别原理 + 实战】
章目录 前言 语音识别原理 信号处理,声学特征提取 识别字符,组成文本 声学模型 语言模型 词汇模型 语音声学特征提取:MFCC和LogFBank算法的原理
AgoraMarketingTeam
2021-10-27
实时互动技术展望 | 弱网下的极限实时视频通信
8304e2b13fe6542ce47bb841199b6789.jpg1280×853 150 KB 本文首发于 InfoQ,由声网 Agora 开发者社区 与 InfoQ 联合策划,并由 In
ihewro
2021-10-21
【音视频流媒体开发】资料整理
内容包含: 精选文章 学术论文 大佬视频 实践项目 开源框架 协议 业界大神一览 访问地址:https://github.com/0voice/audio_video_streaming
wenchao1024
2021-10-12
【音视频专题】音频质量评估方法那些事
今天参加了声网 Agora 的《实时语音质量监控系统的过去、现在与未来》,结合之前工作时音频处理的一些经验,分享一些自己的理解。 音频(泛指人能听到的自然界的所有声音,人耳能听到声音的频谱范围一般为
AgoraMarketingTeam
2021-10-09
音频技术及行业的发展
音频技术的重要性: 在当今社会,工业科技革命的迅速崛起,大数据分析技术、物联网技术、音频技术等的相互融合快速发展,在生物、化学、人工智能等领域有了较大的市场和研究价值。对于音频技术在这之中起到了承上
AgoraMarketingTeam
2021-09-28
音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理
6ce4b30bbfcbf4fb3efcad3ed567ee9f.jpg1200×675 346 KB 一、前言 FFMPEG 是特别强大的专门用于处理音视频的开源库。你既可以使用它的 API
AgoraMarketingTeam
2021-09-16
最近爆火的互动播客,要解决哪些技术难题?
​ 嘿,你也听播客么? 有机构统计过,去年 1 月美国最热门的播客单月受众就超过了 2370 万人,那时疫情还未影响人们的生活。随着 RTC 技术的普及,还有人们生活方式的变化,播客也演进出了新的形态
AgoraMarketingTeam
2021-09-08
带有 OpenGL ES 和 Kotlin 的 Android 图像编辑器 - 第 1 部分
几十年来,OpenGL 是使用最广泛的图形API之一。在本文中,我们将学习如何在 Android 应用程序中使用 OpenGL ES。 0_uPhrOTwacQkMTS1Z.jpg2000×1333
AgoraTechnicalTeam
2021-08-27
人工语音识别
ASR 使机器能够接收、识别和理解人类的话语 人工语音识别(ASR)是一种机器学习模型,它能将语音翻译成文本,也能识别并理解人类语言。 图片由https://www.hindipanda.com
AgoraTechnicalTeam
2021-08-19
基于深度学习的实时噪声抑制——深度学习落地移动端的范例
在实时通讯技术迅猛发展的今天,人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。在 LiveVideoStackCon 2021 上海站中,声网Agora 音频算法负责人冯建元分享
AgoraMarketingTeam
2021-08-18
利用PyTorchVideo 高效理解视频
了解如何从 PyTorchVideo 库中轻松可视化和评估活动分类模型 1_e3hsEHljdJ1Y18E9gKFJqw.jpg957×794 184 KB 在FiftyOne 中PyTorchV
AgoraTechnicalTeam
2021-08-18
语音分析初学者指南
来自Pixabay的语音信号 本文介绍了语音信号及其分析。此外,我还与文本分析进行了比较,方便了解它与语音的不同之处。 作为交流媒介的语音和文本之比较 语音被定义为通过声音来表达思想和感受。语音是人
AgoraTechnicalTeam
2021-08-13
编写基本的混响算法 - 第 1 部分:音频编程简介
混响 是音乐中一种非常强大的效果,它可以突出音频并广泛用于音乐制作。我确信你是个浴室演唱家,也知道到你已经注意到浴室里的声音比你家的其他房间都棒。嗯,这要归功于混响。混响的想法很简单。 混响 的特
AgoraTechnicalTeam
2021-08-12
理解音频:声音的概念及其应用
0_xCCjaobYqpDVDtdJ.jpg1400×933 233 KB 音频无处不在。虽然音频处理已存在数十年,但人工智能和大数据的兴起帮助我们发现了音频隐藏的秘密,并为企业和终端用户提供了新
AgoraTechnicalTeam
2021-08-06