监控方法论(一): Google黄金指标与RED方法和USE方法 背景在做服务监控的时候,通常会根据不同层次来使用不同的方法论,或者综合使用。这些方法论可以帮助我们来挑选合适的指标,可以直观的表达出服务状态。 黄金指标Google黄金指标一般用于服务监控,它一共有四个: 延迟 流量 错误 饱和度 延迟(latency)延迟表示这个服务所消耗的时间,比如说用户获取商品列表这个接口一共花了30毫秒;用户启动虚拟机,消耗20毫秒等等;但是这个指标需要区分成功和失败 2023-11-25 #Observability
从零实现一个exporter(零)-exporter基本概念 Exporter简介云原生模式下的主流监控已经变成Prometheus为主的一套监控技术栈,下图是Prometheus架构: 而Exporter类似于Agent,它负责收集指定指标,它可以独立出来单独运行,也可以和程序集合在一起。打个比方,之前的中间件,比如Redis,Kafka,ES这些都没有集成Exporter,而在云原生中,就需要通过operator去集成。而一些比较新的中间件,比如pul 2023-11-25 #Observability
Linux存储学习(一)基本知识 背景对Linux存储方面的知识比较杂,没有整理相关知识,相关笔记是为了记录这一块的知识。 存储协议PCIeSATA(Serial Advanced Technology Attachment)SAS(Serial Attached SCSI)AHCI(Advanced Host Controller Interface)存储介质HHDSSDNVMe存储类型对象存储文件存储块存储本地存储在Linu 2023-10-22 #storage
homeLab搭建全过程 背景前段时间把手上的MBP2015给换掉了,这个时候就空出一台mini PC。之前一直想尝试PVE或者ESXI。但是尝试了几次发现上手比较困难,关键问题还是对Linux掌握的不够熟悉。其实主要就是WiFi比较麻烦,如果搞定了网络连接就非常简单了。 配置 宿主机操作系统: win11 CPU AMD zen3 锐龙5000 8核16线程 内存条 三星DDR4 3200 32*2 硬盘 SSD 三星9 2023-10-21 #homeLab
MapReduce论文笔记 背景在学MIT 6.824的时候,它的第一个Lab要求实现一个单机并发版本的MapReduce,所以这篇文章主要记录关于MapReduce和实验对应的内容。 Programming Model这里主要介绍了MapReduce的编程模型,它会接收一组键值对作为输入任务,同时输出一对键值对作为结果。它提供了两个函数给用户使用, 需要注意的是Map和Reduce都需要用户自己来实现: Map: 接收一 2023-10-16 #distributed system
MIT6.824-Lab1-MapReduce 背景这个Lab主要是参考了MapReduce这篇论文实现的,所以只需要读懂了MapReduce中2-3章节就可以了。我们需要实现worker,他主要有两个任务分别是Map和Reduce,来分别读取和写入文件。同时还有一个coordinator ,它有两个任务: 分配任务给worker和处理失败任务。Lab还给出了一个参考代码:mrsequential.go。 任务Lab要求我们实现一个分布式Map 2023-10-16 #distributed system
SRE理解 背景之前有一段时间做过半个月的SRE,当时并没有完全理解这个岗位是做什么的。后面兜兜转转又做回了SRE,这里总结下工作几个月来对SRE的理解,以及一些工作内容,同时还参考了别人对SRE的介绍。 SRE定义SRE(site reliability engineer)在各种社区上被说成是运维,是背锅的。或者干脆说SRE是devops是运维这种;这里简单说下我对SRE的理解,SRE主要是负责三个核心内容 2023-09-28 #SRE
Hello World Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Quick 2023-09-28