Key Words : 私有云,Openstack,KVM,流量分析,性能监控,定位排障,网络流量源数据,东西向流量,南北向流量,OVS,TCPDUMP
与经过多年发展的传统架构相比,私有云至今仍然缺乏具有开放性,细粒度,极低消耗的异常流量分析,和NPM性能监控产品。
特别是在私有云内部,不仅承载了60%~70%的私有云流量,更由于多层虚拟化和SDN,导致流量的可视化异常复杂。
鉴于如上原因,绝大多数的私有云支撑部门,都很难构建起一个全局化的流量可视化能力。
因此,在业务、网络性能下降,安全风险增加时,支撑部门往往后知后觉,而事故发生后,又因为缺乏一体化的,细粒度的数据支撑,而导致故障域定位复杂,责任界定模糊,风险难于追查和研判。
针对私有云的云网一体化流量可视化方案,已经箭在弦上,势在必行。
1. 方案构成:JsonFlow + XPM 完整的细粒度流量可视化方案,可以覆盖传统架构,Cloud Underlay,Cloud Overlay三种架构,标准的云网一体化流量监控模型。
> JsonFlow负责所有虚拟机,容器和节点的流量收集,分析和数据分发
> XPM负责网络接入层,硬件层流量分析,以及JsonFlow数据的收集,管理,分析和可视化。
> 具有解析VXLAN和GRE流量的功能。
2. 应用场景
> 实时分析:节点服务器,Linux VM,Docker,Windows VM的流量,实现无盲点的云网一体流量可视化;
> 根据不同时延指标的含义和数值,快速界定性能事故,特别是时延类性能事故的故障域范围;是网络?应用?主机?
> 合理设置10种性能指标KQI的阈值,帮助运维部门预警业务、应用和网络性能下降,并定位至导致性能下降的通信会话;
> 合理设置20种状态指标KPI的阈值,帮助安全部门预警业务、应用和网络的安全风险,并定位至导致安全风险的通信会话;
> 通过会话查询功能,帮助工程师定位用户投诉的每次异常访问,并进一步界定投诉的故障域范围;
> 帮助租户的运维工程师,预警Web,中间件的处理性能异常,并定位到异常的HTTP会话;统计分析最慢URL,错误返回码最多的URL;
> 帮助租户的运维工程师,预警Oracle/SQLserver/MySQL的处理性能异常,并定位到异常的SQL会话;统计分析最慢SQL,错误返回码最多的SQL;
> 通过对每个宿主机10种KQI,20种KPI的图形化回溯,帮助用户掌握业务、应用和网络的运行规律,发现潜在风险,优化资源容量。
北京协软科技有限公司 © 2015-2020 EULA, Infomation and Code Secunity Statement