监控方法论(一): Google黄金指标与RED方法和USE方法 背景在做服务监控的时候,通常会根据不同层次来使用不同的方法论,或者综合使用。这些方法论可以帮助我们来挑选合适的指标,可以直观的表达出服务状态。 黄金指标Google黄金指标一般用于服务监控,它一共有四个: 延迟 流量 错误 饱和度 延迟(latency)延迟表示这个服务所消耗的时间,比如说用户获取商品列表这个接口一共花了30毫秒;用户启动虚拟机,消耗20毫秒等等;但是这个指标需要区分成功和失败 2023-11-25 #Observability
从零实现一个exporter(零)-exporter基本概念 Exporter简介云原生模式下的主流监控已经变成Prometheus为主的一套监控技术栈,下图是Prometheus架构: 而Exporter类似于Agent,它负责收集指定指标,它可以独立出来单独运行,也可以和程序集合在一起。打个比方,之前的中间件,比如Redis,Kafka,ES这些都没有集成Exporter,而在云原生中,就需要通过operator去集成。而一些比较新的中间件,比如pul 2023-11-25 #Observability
Linux存储学习(一)基本知识 背景对Linux存储方面的知识比较杂,没有整理相关知识,相关笔记是为了记录这一块的知识。 存储协议PCIeSATA(Serial Advanced Technology Attachment)SAS(Serial Attached SCSI)AHCI(Advanced Host Controller Interface)存储介质HHDSSDNVMe存储类型对象存储文件存储块存储本地存储在Linu 2023-10-22 #storage
homeLab搭建全过程 背景前段时间把手上的MBP2015给换掉了,这个时候就空出一台mini PC。之前一直想尝试PVE或者ESXI。但是尝试了几次发现上手比较困难,关键问题还是对Linux掌握的不够熟悉。其实主要就是WiFi比较麻烦,如果搞定了网络连接就非常简单了。 配置 宿主机操作系统: win11 CPU AMD zen3 锐龙5000 8核16线程 内存条 三星DDR4 3200 32*2 硬盘 SSD 三星9 2023-10-21 #homeLab
MapReduce论文笔记 背景在学MIT 6.824的时候,它的第一个Lab要求实现一个单机并发版本的MapReduce,所以这篇文章主要记录关于MapReduce和实验对应的内容。 Programming Model这里主要介绍了MapReduce的编程模型,它会接收一组键值对作为输入任务,同时输出一对键值对作为结果。它提供了两个函数给用户使用, 需要注意的是Map和Reduce都需要用户自己来实现: Map: 接收一 2023-10-16 #distributed system
MIT6.824-Lab1-MapReduce 背景这个Lab主要是参考了MapReduce这篇论文实现的,所以只需要读懂了MapReduce中2-3章节就可以了。我们需要实现worker,他主要有两个任务分别是Map和Reduce,来分别读取和写入文件。同时还有一个coordinator ,它有两个任务: 分配任务给worker和处理失败任务。Lab还给出了一个参考代码:mrsequential.go。 任务Lab要求我们实现一个分布式Map 2023-10-16 #distributed system
SRE理解 背景之前有一段时间做过半个月的SRE,当时并没有完全理解这个岗位是做什么的。后面兜兜转转又做回了SRE,这里总结下工作几个月来对SRE的理解,以及一些工作内容,同时还参考了别人对SRE的介绍。 SRE定义SRE(site reliability engineer)在各种社区上被说成是运维,是背锅的。或者干脆说SRE是devops是运维这种;这里简单说下我对SRE的理解,SRE主要是负责三个核心内容 2023-09-28 #SRE