SDK是否提供接近人类感知的评估指标?

SDK大多都是基于网络质量,双方状态的提供,但音视频评估指标也是因人而异的,有没有那种比较贴近人类感知的评估方法API,如声色,响度,噪音等?或后续是否有计划开发,如没有是否有参考的方案?