分布式系统自测要点

October 26, 2016

系统可用性与稳定性测试:

  • 网络failover:请求量猛增,网络丢包和延时、超时、网络闪断
  • 系统稳定性:CPU大量占用、内存不足、文件系统IO高负载、
  • 系统failover:意外被kill、多节点加入和离开、主机断电和重启

数据一致性测试:

  • 大量合法输入
  • 大量非法输入

性能测试:

  • QPS:大量同源/非同源请求
  • 子系统通信:子系统的监控报表

系统监控观察点:

· EOF ·