Gao Chao 's blog

♥ oh ♥

2016-12-07

偌大的都市,孤独的异乡人。

分布式系统自测要点

系统可用性与稳定性测试:

网络failover:请求量猛增,网络丢包和延时、超时、网络闪断

系统稳定性:CPU大量占用、内存不足、文件系统IO高负载、

系统failover:意外被kill、多节点加入和离开、主机断电和重启

数据一致性测试:

大量合法输入

大量非法输入

性能测试:

QPS:大量同源/非同源请求

子系统通信:子系统的监控报表

系统监控观察点:

RCA报告

根本原因分析(RCA)英文全称是Root Cause Analysis,它是一项结构化的问题处理法,用以逐步找出问题的根本原因并加以解决,而不是仅仅关注问题的表征。优化和改善系统,避免类似事件再次发生。

我为所属开发团队制定的RCA报告模板:

问题现象

在此描述问题的现象

影响范围

在此客观的评估出影响范围

问题原因/分析过程

在此分析问题原因或进一步给出分析过程

解决办法

......

技术面试技术综合能力考察

最近一年多以来面试过很多人,随着被面试/面试经验的增多,总结出一些非技术细节的问题,重点考察候选人的综合能力:

你参与的X项目部分是做什么的,在整个项目中的地位是怎样的?

重点考察对所做项目整体业务的理解程度

项目X中有没有遇到难题,你是怎么解决它的?

遇到问题是否跳过分析而盲目凭直觉(经验)进行修复或者立即放弃,考察对问题的解决和总结能力

做某件事,有没有想过用其他方案,比如开源的......