我的小米粥分你一半

大型项目的云原生迁移方案整理

2024-10-16T12:14:31.000Z

项目前期的迁移工作是我在负责, 后续因为合规问题没有办法处理美国的环境, 就由其他同事继续操作完成,这篇博客就记录下我们迁移时遇到的问题以及一些解决方案. 希望能帮助读者在多云环境下的云原生方案的提供一个思路.我默认读者有过Docker以及Kubernetes使用经验, 以及使用它们部署过一些应用.

项目时间线

22年09月: 我入职时老板告诉我有一项工作是将我们的项目从Mesos集群迁移到Kubernetes集群
23年04月: 开始梳理所有的报警规则, 整理日志以及其他数据上报的链路
23年06月: 迁移前的计划与筹备, 并且尝试从零搭建服务
23年10月: 全球第一个区域迁移成功, 后续并行迁移多个区域
24年01月: 海外地区除美国外全部迁移成功, 我休了很久的年假, 直到春节假期结束, 非常开心
24年03月: 迁移工作由其他同事接手, 开始美国区域的迁移
24年07月: 美国部分完成迁移, 海外的所有环境均迁移至Kubernetes集群

前置工作

下面这些内容其实很虚, 但又十分必要.必要性在于, 你要告诉老板, 告诉同事, 告诉合作部门. 整个迁移的成功率在90%以上, 而且遇到了问题能够有拖底的解决方案.

梳理现有环境

要梳理的内容主要包括: 监控报警, 迁移范围

我们一般将报警按照是否有Player Impact进行区分, 为了整个迁移过程要保证用户无感.报警梳理这部分工作我做了挺久的, 主要是确认数据源, 数据上报链路, 有些时候直接去看后端代码, 确认下具体的报警逻辑.

Demo环境搭建以及验证

这部分直接决定着我们迁移方案的选择. 虽然合作方提供了Helm Chart, 但是在具体落地时, 需要事先将可能的坑踩一遍, 才能有把握去做好方案以及应对措施.

部门协调

这部分的工作不止是为了给老板做汇报, 也是为了让合作方伙伴更加信任我们, 要让对方也觉得这个工作是有把握的.

需要给出迁移的大致时间线, 并且做好风险评估以及回滚方案.

比如, 我们的系统有区分大版本和热更, 3个月一个大版本. 那么我们在规划时间线的时候, 就要考虑大版本的时间线, 最好在两个大版本之间完成, 避免在发大版本的时候出现事故.

问题与解决方案

这里记录一些我们曾经遇到的问题, 时间过去很久, 我就凭借记忆讲讲.

流水线改造

我们原有的流水线是基于BK GUI搭建的, 每次修改都需要在页面上点点点, 而且版本控制也不好用.基于此, 我们整套流水线改用Jenkins来实现了.

我之前写了一篇使用Groovy进行编程: 执行流程控制技巧与心得, 里面用到的并发以及重试技术基本就是整个流水线的核心了.

到目前为止, 流水线稳定运行了一年, 运行基本十分稳定且未出现重构功能这样的大改动.

我应该会再写一篇在Jenkins中如何做好流水线的单元测试以及项目规划的博客.

有状态的节点

虽然我们的业务在迁移前就已经使用了Mesos将其跑在了容器里, 但是在机器上还有几个目录是当前机器的容器都要共享的.为此, 我们使用了两个DaemonSet来同步机器上的这些目录文件, 但是依然存在着风险.

后来, 同事提出了一个解决方案, 新创建的Node会带有taint记号, 假如我们没有手动操作过这个Node,它就不会被投入使用. 这个问题我们至今也未完全解决, 带来的问题就是自动扩缩容迟迟没法落地.

给我带来了足够的教训, 业务一开始就不能有对有状态节点的依赖. 说人话就是, 自己把云硬盘或是volume挂进去,别用机器上的文件夹.

AWS CNI与多网卡问题

在美国的一些服务器, 会绑定一个单独的加速IP来降低玩家的游戏延迟, 本意是为了提升用户体验.但是同事发现在EKS集群中我们自己添加的网卡会被vpc-cni自动删掉. 他们当时没什么思路, 我说那我去读读看vpc-cni的代码吧,

被删掉的原因我找ChatGPT分析了一下代码

https://chatgpt.com/share/8e96aedc-b297-4f97-b765-267d108229f9

然后又看到了这个字段, 可以令vpc-cni忽略我们的网卡.

1
2
3

// eniNoManageTagKey is the tag that may be set on an ENI to indicate ipamd
// should not manage it in any form.
eniNoManageTagKey = "node.k8s.amazonaws.com/no_manage"

https://docs.aws.amazon.com/eks/latest/userguide/pod-multiple-network-interfaces.html https://docs.aws.amazon.com/whitepapers/latest/ec2-networking-for-telecom/multus-container-network-interface-cni.html

1 2	// https://github.com/aws/amazon-vpc-cni-k8s/blob/06828cee09446fd9e501984727ed807254385cb8/pkg/ipamd/ipamd.go#L1348 attachedENIs := c.filterUnmanagedENIs(allENIs)

当然可以说是我们文档读的还不够多, 不过, 能有机会简单看看基础组件的代码, 把问题解决掉, 还是很开心的.

混合云服务

我们使用的云服务业务中, 由于政策原因, 有一部分是非AWS以及腾讯云的, 我们仅仅租赁了几台物理机, 并通过专线进行组网.针对这部分机器, 也需要添加到腾讯云的TKE中, 才能完成整体K8S的升级. 这里借助了腾讯云的注册节点.只是网络方面稍稍不同, 我们直接用hostNetwork的方式规避了问题.

https://www.tencentcloud.com/zh/document/product/457/60282

一些思考

Terraform与IaC

我们使用Terraform是为了什么, 我觉得在使用它之前就要想清楚.

有个概念叫SSoT(Single Source of Truth), 对应在我们系统架构中, 它的含义是,我们们的当前的机器是什么功能, 他们分别有什么样的任务.在没有Terraform之前, 这部分数据可能会存储在CMDB中, 这也是一种SSoT, 但是CMDB的维护是需要人工的,也就是说, 从我们修改了一个机器的属性, 到它最后反映到CMDB中是有一个流程的.Terraform的存在简化了这一流程, 当我们对基建作出了改动的时候, Terraform的state就是一个SSoT,原有的CMDB就可以退变成仅仅是一个展示平台.

这里我推荐使用 Teragrunt+Atlantis 的方式, 真正的将基建的修改与审批流程相结合. 从技术人员的角度讲, 这个流程太美了.

https://medium.com/@unruly_mood/terragrunt-terraform-with-atlantis-to-automate-your-infrastructure-pull-requests-9832dd24e5bf

云原生问题的一些思考

Cloud Native 还是 Cloud Provider Native

在迁移结束之后, 我收到了一个任务是将原有的一部分逻辑迁移到Jenkins流水线中, 这个逻辑是到某台机器中执行一些脚本.不知道读者能想到有哪些方案, 我直接列出来这几种, 相信肯定有你想过的:

使用ssh登录到机器, 执行对应的脚本, 最简单, 但是扩展性低, 而且我们机器上基本都取消ssh的服务了
使用AWS或是腾讯云提供的SSM/TAT服务, 调用云厂商提供的脚本执行API
我已经有了Kubernetes集群, 那么我可以新建一个pod, 在Jenkins执行kubectl exec -ti xxxx run.shexec中时, 会保留stdoud和stderr的日志, 相当于使用Jenkins来做执行日志的保留

最后我选择了第三种, 也说服了老板, 现在它也还在这么跑着. 这是我的考虑:

需要区分好什么是云原生以及云厂商原生, 当我们使用了厂商提供的特有API的时候, 我们就应该问自己, 这是必要的吗?
需要区分业务的需求, 比如, 什么需求是来自业务的, 什么需求是来自基建的, 我们值不值得为这个需求写一层多云厂商的兼容?

全球化协作

在一个全球化的团队里其实是很幸福的. 我能想到2点,

你可以不太需要担心PageDuty(oncall)的问题, 美国的同事可以在我们凌晨的时候来处理问题.
对于美东的同事, 我们和他们正好相差12小时, 相当于CN的白天我来处理, 工作结果留好言.CN的夜晚由他们继续来做, 工作效率非常高

凌晨喊人oncall是不人道的, 运维全球化一定是趋势.

整理和总结

其实7月份我就想写这个博客了, 近期终于有时间来整理下思路. 实际的问题解决起来还是很有成就感的, 但是一定要做好记录哈哈.不然就真的只能在写博客的时候苦苦搜寻记忆了.

Image by Freepik

我自制的一些NFC冰箱贴

2024-10-14T19:24:40.000Z

背景

创意来自之前同期做的小卡纸卡片，她做的太精美了。但她和我说有点遗憾是没有加NFC跳转音乐的功能。我就想花时间探索一下，现在已经可以成功写入并且正常唤醒网易云音乐和bilibili了。

AI生成图片的能力着实给不会画图的我提供了很多可能哈哈哈.

图片生成

准备提示词

我是用ChatGPT先准备好了提示词

生成素材

初始化图片

之前玩的时候自己建过Stable Diffusion, 我就直接用自己的尝试了下, 反正我是觉得够了

制作NFC贴图

我本身不会用PS, 所以简单的图片编辑是借助这个网站

https://fabritor.surge.sh/https://github.com/sleepy-zone/fabritor-web

简单的加下文字, 合成下图片真的很好用

传给店家

素材准备好之后, 直接传给店家就可以, 就是你心里要有底它大概长什么样子, 以下是我的经验

图片是很亮的, 但是传给店家做出来的成品是有色差的
边缘一定要有一点留白, 避免边缘的内容没有完全反映到图片中

你看这张, 是不是亮度完全不一样:

NFC写入

这个部分我先前分享在了小红书上, 详细可以看这里.

【动手制作自己的 NFC 冰箱贴 - 小米粥分你一半 | 小红书 - 你的生活指南】 😆 liPjLOZocun3BUZ 😆 https://www.xiaohongshu.com/discovery/item/66eeef7000000000260326a6?source=webshare&xhsshare=pc_web&xsec_token=AB5UGv9LJKqQ3S8DKtTLRyyl7RAylzkovtWDS34-7prU4=&xsec_source=pc_share

一些NFC URI 的分享

内容	URI	来源
钟无艳	bilibili://video/BV147411s7EB	https://www.bilibili.com/video/BV147411s7EB/
喜帖街	bilibili://video/BV1PE411P7Qu	https://www.bilibili.com/video/BV1PE411P7Qu
	orpheus://song/308299
你们的幸福	orpheus://song/307935
独家村	orpheus://song/29460213
载我走	orpheus://song/308020	308020
年度之歌	orpheus://song/308169	308169
The Unforgiven 3	orpheus://song/21162394?play=1
你们的幸福	orpheus://song/307935
剑魔深情诗朗诵	bilibili://video/BV1kq4y1G7U2	https://www.bilibili.com/video/BV1kq4y1G7U2

VR峡谷预览以及Unity的入门使用

2024-09-16T21:28:50.000Z

背景

去年买了Meta Quest 3, 玩了几次之后就一直在吃灰. 每次录制五杀视频的时候,总想用VR第一人称的方式去观察峡谷中的战斗, 可惜没法hack到游戏客户端.

所以我想着直接写个VR版的游戏, 把召唤师峡谷放进去. 这次Thunderdome正好就有机会去实现了.我之前没做过任何游戏开发, 这次选Unity单纯是因为它的VR demo比较好. 在整个三天中,我实际做的工作有限, 基本是根据VR Demo来改改实现自己的逻辑, 这里抛砖引玉, 希望大佬们不要嘲笑哈哈.

最后的游玩视频我放在B站了, 可以直接查看:

Unity学习

我对Unity一点不认识的时候, 先去youtube上面找了一些视频来看, 确保自己有个还算是正常的认知,其实主要是学习一下C#以及模型的使用.

这是我看过的一些视频, 主要是

摄像头, 物体移动, 以及键盘鼠标交互

刚体碰撞

我自己是在Thunderdome前, 动手做了一个3D版简易的打地鼠. 到正式开始时才开始用VR demo重写.类似这样:

模型与动作

我的模型都来源于这里

https://modelviewer.lol/model-viewer?id=142001

上次也用这些模型做了一个网页的Zoe

而且下载的glb格式其实是有动作的, 我在Unity中可以导入模型之后直接加动作效果

以剑魔为例, 直接将模型拖拽到场景之后, 添加Animator绑定到模型中就可以了.

碰撞与刚体

说来惭愧, 我现在只搞懂了刚体的概念, 以及碰撞的原理, 对于在Unity中怎么使用它还是完全懵逼,这把亚托克斯的剑, 我是将它固定在demo中原有的一个枪上面, 而后增加了Mesh collider使其能够与其他模型发生交互.

VR调试与双项目编译

VR调试

VR项目的开发中, 我不可能每改一点代码就烧到机器中去调试.所以, 开发过程中, 大部分的调试操作发生在开发过程中, 我使用XR Device Simulator来实现.虽然不那么好用, 但是已经能够省很多时间了, 其实我觉得最优的方案是可以直接使用真的控制器.

在编译生成apk的时候, 手动去掉这个类的勾选即可, 或者我使用了另一种方案git pull --autostash能够直接将这个类关闭.

双项目编译

Unity中编译项目会block掉整个项目的开发, 我原本打算用命令行来做, 后来想了想没心情再去研究.所以我就开了另一个项目, 这个项目只进行代码pull.

在pull之后, 我手动触发编译按钮, 最后我得到了这么多的apk包, 其中能稳定运行的我打了stable.

C# 学习

我之前从没写过C#代码, 不过有ChatGPT的加持, 我能像编写Python代码一样让它帮我生成一部分内容.自己组织的部分其实只有场景概念这些内容.

总结

不管是Thunderdome还是黑客马拉松, 我觉得都非常好玩.但是参加的时候要考虑下, 规定时间之内能做哪些内容, 需要做什么样的提前准备.我觉得前提是保证自己在有限时间内可以做点东西出来, 如果我一开始没做那个简单的3D项目甚至没有对Unity有了个初步的认识, 可能TD的这两天完全都在入门, 根本不可能做的出来.

InfluxDB的使用与一些A股持仓分享

2024-07-17T22:08:24.000Z

近期我收集了许多身边的数据做统计, 将自己一直以来的股票持仓也上报了. 数据是使用InfluxDB存储的,前端就也用Grafana来做权限控制以及页面展示, 所以我想分享一下对于InfluxDB的一些使用以及常用的一些查询语句,此文章分享的内容不构成任何投资建议.

目前国金这个账户我持仓大约17W, 收益率10%左右. 和那些动辄几百万, 收益率翻倍的大佬们肯定没得比.

我在博客中增加了一栏用作展示Grafana图表, 可以直接查看 Stocks

数据源

我在A股玩了几年了, 去年发现有QMT这个工具, 可以使用Python与自己的证券账户交互

http://docs.thinktrader.net/pages/040ff7/#%E8%BF%85%E6%8A%95xtquant-faq

开通的方式比较简单, 国金30W的门槛, 咨询下客户经理就能开.

去年的时候我自己写了工具来做定投, 近期收集身边数据时, 正好将持仓以及收益也收集起来.其实有不少其他数据, 但我感觉自己的持仓是最适合作图分享的. 可能读者也更感兴趣一点.

以下是写入数据的函数, 没想到写博客的时候发现自己的代码写的有点随意, 先能跑吧.

# 上报当前账户的整体数据
p = Point("balance") \
    .tag('account', stock_account) \
    .field("total_asset", b.total_asset) \
    .field("market_value", b.market_value) \
    .time(dt.datetime.utcnow(), WritePrecision.S)
with client.write_api(write_options=SYNCHRONOUS) as write_api:
    write_api.write(bucket=bucket, record=p)

# 上报当前持仓的数据
for s in stocks:
    p = Point("position") \
        .tag('account', stock_account) \
        .tag('stock_code', s.code) \
        .tag('stock_name', s.name) \
        .tag('market', s.market) \
        # 当前持仓数量
        .field('volume', s.volume) \
        # 当前单股价格
        .field('volume_price', s.volume_price) \
        # 当前持仓总价
        .field('market_price', s.market_price) \
        # 单股成本
        .field('open_price', s.open_price) \
        .field('position_ratio', round(s.market_price / b.market_value, 3)) \
        .time(dt.datetime.utcnow(), WritePrecision.S)

    with client.write_api(write_options=SYNCHRONOUS) as write_api:
        write_api.write(bucket=bucket, record=p)

可以点击图片放大来查看这一示例

一些InfluxDB的Query语句分享

我在制作图表时, 有机会能使用InfluxDB来做查询, 因此整理了一些我使用到的语句.它能自建函数, 功能着实强大, 希望分享能给读者带来一些启发.

展示持仓以及总计

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "balance")
  |> filter(fn: (r) => r["_field"] == "market_value")
  |> aggregateWindow(every: v.windowPeriod, fn: last, createEmpty: false)
  |> drop(columns: ["_field", "account", "stock_code", "market"])
  |> set(key: "_measurement", value: "持仓金额")
  |> yield(name: "last")

这是最基础的图表

计算整体的仓位情况

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "balance")
  |> pivot(rowKey:["_time"], columnKey: ["_field"], valueColumn: "_value")
  |> map(fn: (r) => ({ 
      _time: r._time,
      // map函数用来计算 持仓金额/总金额, 比如我有17W, 16W是股票, 那么持仓16/17=0.94
      _value: r.market_value / r.total_asset,
    }))
  // 丢弃一些我们不要的column
  |> drop(columns: ["_field", "account", "stock_code", "market", "total_asset", "market_value"])
  |> set(key: "_measurement", value: "仓位")

InfluxDB源数据:

Grafana中, 可以制作

计算自己的实际收益率

这个图表中, 其实包含了自己投入的金额, 这个数据理论上是随时间变化的, 比如我这个月投入了1.5W,那么实际的收益率应该用更新后的持仓数据来计算.

我能想到的方案是, 添加一个函数用来增加字段, 这个字段的意义时表明当前已经投入的金额,

getBase = (r) => {
  dtime = r._time
  data =
    if dtime > time(v: "2024-07-15T19:00:00Z") then
        160000.0
    else
        145000.0
  return data
}

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "balance")
  |> pivot(rowKey:["_time"], columnKey: ["_field"], valueColumn: "_value")
  |> map(fn: (r) => ({ 
      _time: r._time,
      _measurement: r._measurement,
      base: getBase(r),
      // 计算实际收益率, 比如我原本投入16W, 目前有17W 那么收益率等于 (17-16)/16 = 6%
      _value:  (r.total_asset - getBase(r)) / getBase(r),

    }))
  |> drop(columns: ["_field", "account", "stock_code", "market", "total_asset", "market_value", "base"])
  |> set(key: "_measurement", value: "收益率")

但是我觉得这个getBase函数并不够优雅, 所以这里, 我给一种打表的方案:

import "array"

inputVal = [
  {date: time(v: "2024-07-15T19:00:00Z"), val: 160000.0 },
  {date: time(v: "2024-01-01T19:00:00Z"), val: 145000.0 },
]

// 这里的getBase函数, 就会根据表来查找自己属于的时间段, 返回对应的投入金额,
// 比如我在7月15日投入了1.5W, 那么在7月15日之后的数据就变成了16W
// 当我在8月份的某一天继续投入的时候, 就可以再增加一列来标识
getBase = (query) => {
  tdata = (
    inputVal |> array.filter(fn: (x) => {
      return query._time >= x.date
    })
  )
  return tdata[0].val
}

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "balance")
  |> pivot(rowKey:["_time"], columnKey: ["_field"], valueColumn: "_value")
  |> map(fn: (r) => ({ 
      _time: r._time,
      _measurement: r._measurement,
      base: getBase(query: r),
      _value:  (r.total_asset - getBase(query:r)) / getBase(query:r),
    }))
  |> drop(columns: ["_field", "account", "stock_code", "market", "total_asset", "market_value", "base"])
  |> set(key: "_measurement", value: "收益率")

实际的收益率曲线会比较光滑

另外, 我再提供另一种思路, 可以记录每次转账的金额, 使用reduce来计算总额

import "array"

// 记录每次银行赚证券的金额
inputVal = [
  {date: time(v: "2024-07-15T19:00:00Z"), val: 15000.0 },
  {date: time(v: "2024-01-01T19:00:00Z"), val: 145000.0 },
]

getBase = (query) => {
  tdata = (
   array.from(rows:inputVal) |> reduce(
    identity: {totalInput: 0.0},
    fn: (r, accumulator) => ({
      totalInput: if query._time > r.date then
        accumulator.totalInput + r.val
      else
        accumulator.totalInput
    }))
    |> yield()
    |> findRecord(fn:(key) => true, idx: 0)
  )
  return tdata.totalInput
}

个股持仓分布

这个比较简单, 按照market_price来做饼图就好

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "position")
  |> filter(fn: (r) => r["_field"] == "market_price")
  |> aggregateWindow(every: v.windowPeriod, fn: last, createEmpty: false)
  |> drop(columns: ["_field", "account", "stock_code", "market"])
  |> yield(name: "last")

个股收益率情况

from(bucket: "Stock")
  |> range(start: v.timeRangeStart, stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "position")
  |> pivot(rowKey: ["_time"], columnKey: ["_field"], valueColumn: "_value")
  |> map(fn: (r) => ({ r with
      _time: r._time,
      _measurement: r._measurement,
      // 使用当前 (股价-成本)/成本 就得到了单只股票的收益率
       _value: (r["volume_price"] - r["open_price"]) / r["open_price"],
  }))
  |>group(columns: ["stock_name"])
  |> aggregateWindow(every: v.windowPeriod, fn: mean, createEmpty: false)

总结

有人肯定会问, 为什么你要免费分享持仓数据. 我这里想说, 即使你看了我的仓位分布, 你可能大概率也不会买我的这些股票, 下面是原因:

根本不在乎理论, 就像已经有了凯利公式, 还会永远满仓, 永远热泪盈眶
根本看不上我这10%的收益
已经存在的大量付费咨询的群, 很多股民更加相信群友判断或是小道消息

不过, 我还是再强调一下: 此文章仅分享技术, 不构成任何投资建议.

最近在玩的一些项目

2024-07-01T21:49:32.000Z

这篇文章我想介绍下自己最近在玩的一些项目, 可能很多都是demo性质的, 也并没有用到什么高深的技术, 希望读者能觉得有趣.

kubemux

这个项目是为了简化 Tmux 与 Kubernetes 配合的工作量, 它非常适合你有几十个集群需要管理的场景,并且这个项目未来应该会支持多云环境中 Kubernetes 集群的操纵. 我已经用它处理了上百个集群的管理, 非常好用.

项目地址: https://github.com/corvofeng/kubemux

具体的文档在这里: https://kubemux.corvo.fun/

go-flarum

go-flarum是使用Golang后端+Flarum前端重新整合的一个项目.

项目地址在这里: https://github.com/corvofeng/go-flarum

这个项目在多年之前就夸下了海口, 但当时已经将基本框架写的差不多了. 我最近整理一下, 将其开源出来. 未来我有空应该还会去写, 不过可能很慢把哈哈.

https://discuss.flarum.org.cn/d/1956/11

Heartsteel

这是一个嵌入在网页中类似看板娘的项目, 只不过使用的是3D模型. 这部分是Three.js加载的

为什么叫Heartsteel, 是因为Zoe是英雄联盟中我最喜欢的英雄, 她将我的♥偷走了.起初这个项目就是为了Zoe而写的, 但其实项目应该能支持各种英雄的模型展示.

项目地址在这里: https://github.com/corvofeng/Heartsteel

模型来源是这里: https://modelviewer.lol/model-viewer?id=142001

预览效果的话, 可以直接访问 https://corvo.myseu.cn/, 不过我建议在PC端打开, 手机端还未适配, 并不美观.

我一直也在考虑能不能把她作为桌面小宠物的形式, 或者可能学习下怎么制作Steam上面的相关mod吧

使用Groovy进行编程: 执行流程控制技巧与心得

2024-03-28T16:14:46.000Z

最近的工作中, 我写了许多Groovy代码. 我觉得我积累了一些值得分享的经验和心得.因此我决定写这篇博客, 希望能帮助到正在或即将使用Groovy的开发者们.

我希望我的读者有一些编写 Jenkins 流水线的使用经验, 或是用过 GitLab, GitHub, Azure 它们提供的 CI/CD 功能.

在这篇博客中, 我主要介绍一些控制执行流程的方案，并提供一些我在实践中使用的代码片段.

注意: 本文中使用的是 Scripted Pipeline.

本文所有代码在: GitHub BlogCode 中

代码调试

非常推荐 Groovy Playground来进行调试 Groovy代码, 虽然语法结构不完全一致,但是简单的执行以及查看结果会令开发过程效率倍增

https://onecompiler.com/groovy

控制流

在Groovy中, 控制流的灵活性是其强大功能之一. 顺序逻辑是我们最常见的, 我并不打算花时间在上面, 我将重点介绍并发和重试这两个方面.

针对这两种控制流, 我强类推荐使用 Blue Ocean, 就是为了它美观的展现形式

并发

通过使用 parallel 关键字来实现, 我给出两种实现方式

stage('run-parallel-branches') {
    parallel(
        a: {
            echo "This is branch a"
        },
        b: {
            echo "This is branch b"
        }
    )
}

// 我个人更加喜欢这一种, 可以方便的使用 for 循环以及 if 语句来控制并发逻辑
stage('looper-parallel-branches') {
    def looper = [:]
    for (int i = 0; i < 10; i++) {
        looper["${i}"] = {
            echo "This is branch ${i}"
        }
    }
    parallel looper
}

重试

重试逻辑适用于想要确保某个任务正确执行, 又不希望重新执行整条流水线. Jenkins 中也提供了 retry 功能

以下的代码中, 会因为随机生成了偶数报错, 而我们可以通过 retry 功能直接进行重试

并且每次重试的执行记录也会存储在流水线日志中

stage('retry') {
    testJob = { ->
        // generate number between 40 and 99
        def num = Math.abs( new Random().nextInt() % (99 - 40) ) + 40
        if(num % 2 == 0) {
            throw new Exception("Even number")
        }
    }

    retryFunc = { job ->
        waitUntil {
            try {
                job()
                true
            } catch (error) {
                println error
                input 'Retry the job ?'
                false
            }
        }
    }

    def looper = [:]
        for (int i = 0; i < 5; i++) {
        looper["${i}"] = {
            retryFunc(testJob)
        }
    }
    parallel looper
}

设计方式

以下内容适合于想要优化现有的复杂流水线逻辑, 没写过流水线的读者就可以跳过了

依赖注入

在这里的依赖注入, 我想我更希望的是说控制反转, 将控制逻辑抽离, 还记得我在上面说到的并发执行方式吗?如果我们的业务有很多流程, 比如某一步操作所有环境的命令1, 再下一步操作所有环境的命令2, 就可能产生以下的代码:

stage('action 1') {
    def looper = [:]
    workNodes.each { node ->
        looper["Action1 for ${node}"] = {
            println "action1 on $node"
        }
    }
    parallel looper
}

stage('action 2') {
    def looper = [:]
    workNodes.each { node ->
        looper["Action2 for ${node}"] = {
            println "action2 on $node"
        }
    }
    parallel looper
}

是不是感觉一模一样的逻辑写了两次, 假如这种操作很多呢, 会带来代码中大量的循环, 而且这个循环是业务不相关的.这里我给出一个改进的方案. 其最终效果是一致的:

def actionRunner = { msg, nodes, action ->
    def looper = [:]
    nodes.each { node ->
        looper["${msg} -- ${node}"] = {
            stage("${msg} -- ${node}") {
                action(node)
            }
        }
    }
    parallel looper
}
// 我们真正的业务代码应该只包括下面这些内容, 具有非常好的可读性和灵活性
// 不过, 前提是你理解了上面的控制逻辑
actionRunner("action1", workNodes, { node ->
    println "action1 on $node"
})

actionRunner("action2", workNodes, { node ->
    println "action2 on $node"
})

装饰器

我原本是一个熟练的 Python 程序员, 我发现在 Groovy 流水线中, 也有一部分逻辑也非常适合装饰器,那就是重试逻辑, 我们在上面控制流过程中已经讲过了它的实现, 但我们其实有一种更加优雅的方案,在你想为很多函数都添加类似功能的时候, 装饰器就是一个很好的选择.

以下代码可以在Groovy Playground中很好的使用, 但是无法在Jenkins流水线中使用.我这里给出2种装饰器的编写方案, 你们选择一种就可以:

curry wrapper

// curry wrapper
def testWrapper(Closure job) {
    def varFunc = { func, Object... args ->
        println "args ${args}, ${args.getClass()}, ${args.size()}"
        func.call(*args)
    }
    return varFunc.curry(job)
}

def xx = { a,b,c ->
    println "a ${a}"
    println "b ${b}"
    println "c ${c}"
}
def func = testWrapper(xx)
func("aa", "bb", "cc")

/*
output:
args [aa, bb, cc], class [Ljava.lang.Object;, 3
a aa
b bb
c cc
*/

simple wrapper

这种方案比较好理解, 毕竟函数柯里化大家都不一定会考虑用

def testWrapper(Closure job) {
    def varFunc = { Object... args ->
        println "args ${args}, ${args.getClass()}, ${args.size()}"
        job.call(*args)
    }
    return varFunc
}

很可惜的是, 这两个方案在 Jenkins 中都无法直接使用, 会报下面这个错误,

核心原因是Jenkins中Closure可变参数有问题, Object... args这里我们写了可变参数, 它还是只读了第一个参数

Jenkins wrapper

我这里给出一个替代方案, 使用wrapper包裹的函数, 传递参数时是使用一个数组, 我们在真正调用时将参数分别填好

def retryWrapper(Closure job) {
    def func = { Object[] args ->
        waitUntil {
            try {
                println "args ${args}, ${args.getClass()}, ${args.size()}"
                job.call(*args)
                true
            } catch (error) {
                println error
                input 'Retry the job ?'
                false
            }
        }
    }
    return func
}

testJob = retryWrapper({ arg1, arg2 ->
    println("${arg1}, ${arg2}")
    // generate number between 40 and 99
    def num = Math.abs( new Random().nextInt() % (99 - 40) ) + 40
    if(num % 2 == 0) {
        throw new Exception("Even number")
    }
})

def looper = [:]
for (int i = 0; i < 5; i++) {
    looper["${i}"] = {
        testJob(["arg1", i])
    }
}
parallel looper

总结

这篇博客我主要想总结下最近遇到的问题以及我应对问题时准备的设计模式, 希望针对使用 Jenkins 的朋友有所帮助. 大佬们有更好的方案也请不吝赐教

kubemux的使用与多集群管理

2023-12-27T22:41:57.000Z

最近一年对于Kubernetes的开发学习比较少, 主要集中在使用. 涉及到大量集群从mesos到Kubernetes集群的迁移, 迁移结束之后我应该会写一篇博客来进行简单记录. 这篇博客就先来介绍下我是怎么在工作中进行多集群管理的, 以及我开发的kubemux是做什么的.

这是软件的实现效果以及仓库

https://github.com/corvofeng/kubemux

Installation

# MacOS
brew install corvofeng/tap/kubemux

# Linux -- using bin: https://github.com/marcosnils/bin
bin install https://github.com/corvofeng/kubemux ~/usr/bin
# bin ls
# Path                  Version  URL                                                       Status
# ~/usr/bin/kubemux     v1.1.2   https://github.com/corvofeng/kubemux/releases/tag/v1.1.2  OK

# Linux -- using binary
cd /tmp
rm kubemux_linux_amd64.tar.gz
wget https://github.com/corvofeng/kubemux/releases/latest/download/kubemux_linux_amd64.tar.gz
tar -zxvf kubemux_linux_amd64.tar.gz
sudo install -v kubemux /usr/local/bin

kubeconfig

ls ~/.kube
# pve-kube.config xxx

kubemux kube --kube pve-kube.config

# I suggest you add the completion support
#   source <(kubemux completion bash)
#   source <(kubemux completion zsh)
# or you can add the command into the .bashrc or .zshrc.
kubemux kube --kube

tmuxinator

mkdir ~/.tmuxinator

echo '
name: kubemux
root: "~/"
windows:
  - p1:
    - ls
    - pwd
  - p2:
    - pwd
    - echo "hello world"
  - p3: htop
' > ~/.tmuxinator/kubemux.yml

kubemux -p kubemux

Kuberentes 多集群管理方案

这是官网介绍的一种方案, 它的基本原理是使用KUBECONFIG中的context进行切换

https://kubernetes.io/docs/tasks/access-application-cluster/configure-access-multiple-clusters/

apiVersion: v1
kind: Config
preferences: {}

clusters:
- cluster:
  name: development
- cluster:
  name: test

users:
- name: developer
- name: experimenter

contexts:
- context:
  name: dev-frontend
- context:
  name: dev-storage
- context:
  name: exp-test

并且许多工具类似kubecm也是基于此来实现的, 这样会带来几个问题:

每次增删集群需要维护一个很大的KUBECONFIG文件
由于使用同一个KUBECONFIG文件, 会被所有终端共享意味着同一时刻只能操作一个集群

在真正的线上多集群环境管理时, 非常不方便且容易出错. 我接下来介绍一种使用tmux 配置文件分割的方案.

tmux 多会话

tmux 是一款非常强大的终端复用器，它允许您在同一个终端窗口中创建和管理多个会话。这对于管理多个服务器或集群非常有用，因为您可以轻松地在不同的会话之间切换，而无需打开多个终端窗口。

要使用 tmux，您需要先安装它。在大多数 Linux 发行版中，您可以使用以下命令安装 tmux：

1	sudo apt install tmux

安装完成后，您可以使用以下命令启动 tmux：

tmux

这将在您的终端窗口中创建一个新的 tmux 会话。您可以使用以下命令在不同的会话之间切换：

1	tmux attach-session -t

您还可以使用以下命令创建新的会话：

1	tmux new-session -s

tmux -L

简单来说, -L socket-name 参数允许指定 tmux 的 socket 位置, 不同 socket 对应的会话完全隔离.

我们可以在不同的会话中使用不同的环境变量, 以此来达到分离环境的效果

例如, 通过以下两条命令, 你可以创建出完全独立的两个终端, 并且它们的环境变量

1 2	KUBECONFIG=~/.kube/config-aa tmux -L aa KUBECONFIG=~/.kube/config-bb tmux -L bb

这里的脚本其实已经可以实现多集群管理了, 为什么我们要引入tmuxinator以及我新写的kubemux呢?

线上环境对应的配置需要经过跳板机器, 如何在本地使用 KUBECONFIG(我附在结尾)
我希望启动的tmux能够直接拥有多个window, 并分别有自己的功能

tmuxinator 使用与局限

https://github.com/tmuxinator/tmuxinator

它是使用ruby写的一款工具, 可以用yaml形式定义tmux终端, 同时也支持模板化, 例如下面的一个模板化的yaml文件

name: project
root: ~/<%= @settings["workspace"] %>
# tmuxinator start project workspace=~/workspace/todo

windows:
  - small_project:
      root: ~/projects/company/small_project
      panes:
        - start this
        - start that

在负责集群环境迁移的几个月中, 我用到最多的一些命令就是:

1
2
3

tmuxinator tpl project=ingame-pre-na
tmuxinator tpl project=ingame-pre-sg
tmuxinator tpl project=ingame-pre-fra

它能帮助我完美的区分不同环境, 并且由于我使用了fzf, 我甚至可以模糊搜索到自己想要打开的环境

局限: 由于使用ruby编写, 它需要机器上安装比较新版本的ruby. AWS需要登陆到一个跳板机中进行操作, 但是我们用到机器很旧, 我也不想编译重装一个ruby.简单读过代码之后, 发现它本身没有用到什么更高级的特性, 使用golang完全重写也非常容易.

kubemux实现

这个项目我大量借助了ChatGPT, 主要是一些逻辑编写以及单元测试的编写. 本来我感觉要2-3天的工时, 开发周期缩短到了1天. 最后实现的效果也非常好. 重写之后机会没有任何依赖, 安装很轻量.

项目开源在了这里, 与tmuxinator的配置应该是兼容的, 发现有缺失的功能也欢迎开issue.

https://github.com/corvofeng/kubemux

总结

命令行管理几十的集群也是完全行得通的, 而且效果也还不错. 希望也能够提升大家的效率吧.

附: 我的模板配置

name: <%= @settings["project"] %>
root: ~/GitRepo

socket_name: <%= @settings["project"] %>
on_project_start:
  # 由于需要跳板机才能连接API, 我这里使用ssh 在本机开了一个socks5的代理, 以下方式为获取一个本地可用的端口, 以及对应的跳板机
  - export KUBECONFIG=~/.kube/config-<%= @settings["project"] %>
  - export TMUX_SSH_PORT="$(python3 -c 'import socket; s=socket.socket(); s.bind(("", 0)); print(s.getsockname()[1])')"
  - export TMUX_SSH_HOST="<%= @settings["host"] %>"
startup_window: kubectl

windows:
  - proxy:
      layout: main-vertical
      panes:
        - startup:
          - ls -alh
          # 修改KUBECONFIG中的context名称, 并增加socks5代理
          - yq -i e '.current-context |= "tpl-<%= @settings["project"] %>"' $KUBECONFIG
          - yq -i e '.contexts[0].name |= "tpl-<%= @settings["project"] %>"' $KUBECONFIG
          - yq -i e ".clusters[0].cluster.proxy-url |=\"socks5://127.0.0.1:$TMUX_SSH_PORT\"" $KUBECONFIG
          - ssh -D $TMUX_SSH_PORT $TMUX_SSH_HOST
  - kubectl: ls # kubectl get pods

配合修改context的功能, 还能在终端PS1中增加提示, 类似这样

https://github.com/jonmosco/kube-ps1

凤凰项目

2023-12-23T23:41:19.000Z

凤凰项目

The Phoenix Project(凤凰项目) 是一个大公司内部指望拯救公司的一个软件项目,项目仓促上线之后其实并没有实现对应的效果, 主人公临危受命, 接手整个IT的烂摊子.主人公从观察一个完整的流水线工厂, 发现了其与现代运维的一些共性, 并依次对系统进行改造,最终构建出一个强大的IT团队以及完善的工作流程.

我就简单说说自己记忆深刻的点, 就当做个小总结. 感觉当个小说读读看也是可以的.这篇文章可能会持续更新:

凤凰项目遇到的一些问题

项目变动杂乱
核心人员过于繁忙
项目进度

我们应该关注的点

IT 运维的4种工作类型:

业务项目：由业务部门发起，为了实现某个业务目标而进行的项目，比如开发新功能，上线新产品等。
内部IT项目：由IT部门发起，为了提升IT部门的能力或效率而进行的项目，比如建设自动化平台，优化监控系统等。
变更：对现有的系统或应用进行的物理、逻辑或虚拟的操作，比如升级版本，修复缺陷，调整配置等。
计划外工作：由于突发的故障或问题而进行的恢复性工作，比如处理线上故障，应对安全事件等。

在业务上, 分析业务迭代进程中的各个流程以及规范:

前期主要投入应该在指定初始的规范与流程
中期践行规范, 并且持续性的追踪每个流程的投入产出时间, 努力使得交付时间可以预测
后期找到流程中值得改进的点, 投入精力到这部分即可

在系统设计目标上:

负责人越聪明, 整个系统就越笨. 一定要有规范化的流程以及文档
减少对于技术核心的依赖, 控制问题到达技术核心的路径
要考虑收益率以及投入产出

Google Colab的一些使用

2023-07-08T18:31:42.000Z

原来作为Python开发者, 我基本是不使用jupyter的, 因为IPython足够好用了,我写过相关文档有关Python调试(IPython).

前几个月看了吴恩达教授的这篇ChatGPT教程, 其中对于 colab 的使用给了我很多启发, 建议没看过的读者也去看看

【【中文完整版全9集】第1集引入-ChatGPT提示词工程师教程吴恩达xOpenAI官方】 https://www.bilibili.com/video/BV1AT41187qt

colab 有几个优势:

保存在 Google drive 中, 不用担心数据丢失
界面美观, 支持 Vim 键位
保留调试记录, 可以像写文档一样写代码
既可以使用 Google 的服务, 也能使用本地的 jupyter 服务

VSCode 也有 jupyter notebook 的支持, 同样也是调用过了 jupyter server,但是你需要把文件保存在本地, 需要依赖一个 VSCode, 而且页面我感觉也没有 Colab 美观.所以大部分情况我都是在用 Colab.

Colab基础使用

打开 https://colab.research.google.com/ 直接创建新的 notebook 即可:

一些功能

开启 ssh 服务

我先前写过一个提供ssh服务的功能, 也可以用在 colab 中, 可以再推销一波哈哈:

upterm改造(一)-支持VSCode远程连接任意容器

1	!bash <(curl -sL http://corvo.fun/scripts/upterm.sh)

最终的效果如下:

连接本地 jupyter 服务

在本地机器上, 需要首先安装 jupyter, 然后启动 server 即可:

jupyter notebook \
  --NotebookApp.allow_origin='https://colab.research.google.com' \
  --port=8888 \
  --NotebookApp.port_retries=0

Google 这里也给出了使用 docker 的方案:

https://research.google.com/colaboratory/local-runtimes.html

转发远程端口到本地

之前调试 easytrader 时, 由于仅支持 Windows, 我就在 Win10 虚拟机中运行了 jupyter server,然后使用 ssh 将端口转发到了本地, 就能直接用网页的 colab 进行调试了.

1	ssh -L 8888:XXX.XXX.XXX:8888 dev

几个案例分享

数据库导出与查询

这个方案我同我们的 DBA 同学商量过, 他也比较喜欢. 因此我分享在这里, 希望也能帮助有类似需求的伙伴.

!ls
!pip install ipython-sql
!pip install pymysql
!pip install panda

# load sql module
%load_ext sql

# https://stackoverflow.com/questions/53818698/how-to-remove-connection-string-info-from-ipython-sql-output
%config SqlMagic.displaycon = False


db_url = ''
# mysql+pymysql://user:pass@127.0.0.1/db_MetaDataMap
with open('db.txt') as f:
  db_url = f.read()
%sql {db_url}

%config SqlMagic.autopandas=True
%sql show tables;

# 将查询结果导出成变量
service_list = %sql select index,app_id,name,target from service_list order by app_id;

# 对返回数据进行预操作
import yaml
for name, groups in service_list.groupby('app_id'):
  print(name, groups.to_dict('records'))

这个方案的好处在于你能够边想逻辑边写 Python 语句, 而且 notebook 能将你的思路记录下来后期, 当你需要分享给别人操作过程的话, 只要简单修改就可以做到.

特殊字符处理

https://stackoverflow.com/a/69482789

我遇到了一个比较特别的密码aa@bbb&%2021 里面的特殊字符需要转义好填写到db.txt中

import urllib.parse
urllib.parse.quote('aa@bbb&%2021')

# 'aa%40bbb%26%252021'
# db.txt mysql+pymysql://root:aa%40bbb%26%252021@127.0.0.1

收益率分析

之前尝试计算做量化, 准备自动买卖股票, 可是需要演算收益率什么的. 我知道量化大佬们都在用 Excel, 我自己没那水平, 就用 Python 简单模拟下收益率计算, 感觉这个代码未来还能复用, 也简单分享给大家:

result = 0

## 当它上涨时, 根据不同的上涨幅度, 卖出对应数量的股票
steps = [
    # 此种方案对应的收益率大概为30%, 而且上升10%时, 基本可以达到收益率要求
    [5, 10], # 上涨5%, 卖出现有数量的10%
    [10, 20],
    [20, 40],
    [50, 100],
]

X = 10000
orig_price = 1.00
total_count = X/orig_price


def print_yield(cur, orig):
    yield_rate = round((cur-orig)/orig * 100, 3)
    print(f"当前收益率 {yield_rate}%")

for (_incr, _sell) in steps:
    cur_price = orig_price * (1+_incr/100)
    result += (cur_price) * (total_count * _sell/100)
    total_count = total_count * (1-_sell/100)
    print(f"取回: {result}, 当前价格: {cur_price} 剩余数量: {total_count}")
    print_yield(result+total_count*cur_price, X)

总结

现在, 我发现自己已经离不开 Colab 了, 它把我需要进行简单演算的工作都承担了.而且还能为演算做笔记, 做笔记过程中又能编写代码模拟逻辑. 相比较复杂的 Excel,程序员可能对 Colab 更加有掌控性吧.

一种针对Dockerfile的另类优化以及几种未来可能的镜像构建方式

2022-06-20T21:28:15.000Z

引言: 一种加速镜像构建的方式

Dockerfile的构建优化我平时见过不少, 我之前也介绍过一篇Docker系列(七)-Dockerfile进阶-多阶段构建与构建优化,但是除了这些方法外, 还有一种另类的方案. 能更加极致的优化镜像构建时间并将层的概念进行扩展.

代码仓库过大带来的问题

我们的代码使用的是Python. 对于这类解释型语言, 使用容器运行意味着需要将代码拷贝进去到镜像中, 这是一种常见的情景:

# 这是我们准备好的代码结构
.
├── Dockerfile
├── etc
│   ├── docker-entrypoint.sh
│   └── app_uwsgi.yaml
├── src
│   └── sample  # 用户的代码目录
└── var
    ├── log
    ├── run
    └── scripts

# 安装依赖
COPY src/sample/requirements.txt requirements.txt
RUN pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/

# ===== 以上内容可以缓存 

# 拷贝代码
COPY --chown=xxx:xxx src/$PROJ_GIT_REPO $PROJ_SRC/$PROJ_GIT_REPO

这是一种比较常见的方案, 应该也是读者预期的, 我们将代码的依赖做了缓存, 但是没有缓存代码本身.这就会引出一个问题, 假如src/sample这个仓库本身很大, 那么我们一次次构建, 上传镜像, 甚至到运行时pull镜像,这一层都会很大, 构建中变慢的时间在这个过程中, 其实被放大了3倍.

两阶段clone代码

基于此种问题, 我们引入了一种新的方案. 直接在Dockerfile构建时clone代码, 但是分为两个阶段, 第一阶段仅有基础的clone语句, 该层会被直接缓存. 而后的fetch语句中增加了对于git checkout的使用, 强制改变当前HEAD为需要的commit hash, 改造后的代码如下:

COPY src/sample/requirements.txt requirements.txt
RUN pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
RUN su - xxx -c "git clone $REPO_URL $PROJ_SRC/$PROJ_GIT_REPO && cd $PROJ_SRC/$PROJ_GIT_REPO && git submodule update --init --recursive"

# ===== 以上内容可以缓存 

RUN su - xxx -c "cd $PROJ_SRC/$PROJ_GIT_REPO &&\
 git reset --hard && git clean -ffdx &&\
 git fetch --tags --progress -- $REPO_URL +refs/heads/*:refs/remotes/origin/*  &&\
 git checkout -f 03ca73c32eb8a7485548f7cc75cc9ba6f708cd33 && git submodule update --init --recursive"

上面给出的代码我们已经在正式环境中运行超过一年以上, 未收到任何异常.

具体效果

第一clone的层约有180M, 第二次再fetch已经只有90M了. 这个改造下来, 镜像的push和pull也省了至少90M,即使时10M/s的网速, 我们把整体的时间大概压缩了20s.

方案总结

针对某一类拥有历史记录比较多, 而每次改动却又不是特别大的项目, 节省的时间和空间会更加明显,但是也有一个问题就是Dockerfile中, 需要我们放入可以直接clone的地址, 所以仅推荐私有仓库或是开源代码使用,否则还是会有代码泄漏的风险.

使用ssh协议clone代码

上面的两阶段clone代码主要有两个问题:

我们的用户都是使用GitLab的, 可以clone代码的地址必须用户手动拼接好, 使用体验不佳
该地址直接放入了Dockerfile中, 并不是特别安全

基于此问题, 我们打算引入一种新的方案, 将git clone的地址改为ssh协议, Dockerfile中仅有ssh地址, 最后的成品中也没有私钥, 就不用担心代码泄漏的风险.

stackoverflow上面有很多关于这个问题的讨论, 例如:

两阶段法构建, 虽然最终的容器中没有ssh文件, 但是我们依然全量的拷贝了用户代码

# https://stackoverflow.com/a/66648529/5563477
FROM alpine as MY_TMP_GIT_IMAGE

RUN apk add --no-cache git
RUN mkdir -p /root/.ssh &&  chmod 700 /root/.ssh
COPY /.ssh/id_ed25519 /root/.ssh/id_ed25519
RUN chmod 600 /root/.ssh/id_ed25519

RUN apk -yqq add --no-cache openssh-client && ssh-keyscan -t ed25519 -H gitlab.com >> /root/.ssh/known_hosts
RUN git clone git@gitlab.com:GITLAB_USERNAME/test.git
RUN rm -r /root/.ssh

# Start of the second image
FROM MY_BASE_IMAGE
COPY --from=MY_TMP_GIT_IMAGE /MY_GIT_REPO ./MY_GIT_REPO

构建时使用--squash, 这样删除私钥了之后, squash能将层压缩为一层, 从而抹去key在先前层存在的问题, 虽然也能实现功能, 但是仅压缩为一层意味着完全没有缓存

# docker build -t example --build-arg ssh_prv_key="$(cat ~/.ssh/id_rsa)" --build-arg ssh_pub_key="$(cat ~/.ssh/id_rsa.pub)" --squash .

# Authorize SSH Host
RUN mkdir -p /root/.ssh && \
    chmod 0700 /root/.ssh && \
    ssh-keyscan github.com > /root/.ssh/known_hosts

# Add the keys and set permissions
RUN echo "$ssh_prv_key" > /root/.ssh/id_rsa && \
    echo "$ssh_pub_key" > /root/.ssh/id_rsa.pub && \
    chmod 600 /root/.ssh/id_rsa && \
    chmod 600 /root/.ssh/id_rsa.pub

# Avoid cache purge by adding requirements first
ADD ./requirements.txt /app/requirements.txt

WORKDIR /app/

RUN pip install -r requirements.txt

# Remove SSH keys
RUN rm -rf /root/.ssh/

使用Docker buildkit, 这是Docker支持的一个新特性, 是目前为止比较优雅的一种方案了

来自: https://stackoverflow.com/a/58883743/5563477

1 2	export DOCKER_BUILDKIT=1 docker build --ssh default=~/.ssh/id_rsa .

# syntax=docker/dockerfile:experimental
FROM alpine

# Install ssh client and git
RUN apk add --no-cache openssh-client git

# Download public key for github.com
RUN mkdir -p -m 0600 ~/.ssh && ssh-keyscan github.com >> ~/.ssh/known_hosts

# Clone private repository
RUN --mount=type=ssh git clone git@github.com:myorg/myproject.git myproject

未来的镜像构建方式

目前市面上已经有不止一款docker镜像打包工具了. 我这里只是简单介绍一下它们, 并且看看对于ssh协议clone代码的支持,我们的生产环境还未使用, 当然读者也不应该仅仅为了这个特性就更换目前稳定的构建打包工具.

kaniko

docker run \
    -v `pwd`:/workspace \
    -v /home/corvo/.docker:/kaniko/.docker \
    gcr.io/kaniko-project/executor:latest \
    --context=dir:///workspace \
    --cache=true \
    --cache-copy-layers \
    --cache-repo="registry.cn-hangzhou.aliyuncs.com/corvofeng/develop-cache" \
    --dockerfile=/workspace/Dockerfile \
    --destination="registry.cn-hangzhou.aliyuncs.com/corvofeng/develop:v1"

cache-dir的形式我没跑通, 本地的/cache目录总是不写入数据, 所以只测试了cache-repo的形式, 可以让kaniko把cache放到了仓库中, 每次构建镜像时检查仓库的缓存

简单测试了一下kaniko的缓存方案, 对于corvofeng:develop这个仓库, 会默认使用/corvofeng/develop/cache地址来缓存, 你也可以自己指定一个缓存仓库.

在GitLab runner中, 使用这种方式构建镜像再合适不过了, https://docs.gitlab.cn/jh/ci/docker/using_kaniko.html

kaniko也支持ssh协议clone代码, 挂载ssh-agent对应的unix socket到容器中即可

docker run \
    -v `pwd`:/workspace \
    -v "$SSH_AUTH_SOCK":"$SSH_AUTH_SOCK"\
    -v /home/corvo/.docker:/kaniko/.docker \
    -e SSH_AUTH_SOCK=$SSH_AUTH_SOCK \
    gcr.io/kaniko-project/executor:latest \
    --context=dir:///workspace \
    --cache=true \
    --cache-copy-layers \
    --build-arg="SSH_AUTH_SOCK=$SSH_AUTH_SOCK" \
    --cache-repo="registry.cn-hangzhou.aliyuncs.com/corvofeng/develop-cache" \
    --dockerfile=/workspace/Dockerfile \
    --destination="registry.cn-hangzhou.aliyuncs.com/corvofeng/develop:v1"

FROM python:3.8-alpine
ARG SSH_AUTH_SOCK
RUN apk add --no-cache openssh-client git
RUN ssh-add -l

对应的效果如下

buildah

buildah的使用比较接近docker buildkit, 可以在镜像构建时挂载unixsocket, 下面是一个简单的例子

1	sudo buildah build --build-arg=SSH_AUTH_SOCK=$SSH_AUTH_SOCK --volume $SSH_AUTH_SOCK:$SSH_AUTH_SOCK .

FROM alpine

RUN apk add --no-cache openssh-client git
ARG SSH_AUTH_SOCK
RUN ssh-add -l

效果如下:

总结

首先, 这篇博客介绍的优化措施并不适合所有的项目, 主要针对大型项目镜像的构建, 如果你的项目比较小, 就没必要考虑这种手段.

另外, 我借用SSH_AUTH_SOCk是想说明, 现有的工具已经支持我们在构建时挂载文件或是unix socket,对于仅在构建时需要的密码或是私钥, 完全可以使用文件挂载的方式来实现.

虽然我这篇博客都是在围绕私有项目的构建和部署来讲解优化措施的, 但是对于kankio以及buildah, 它们完全可以应用到开源项目之中.我在创建一些命令行工具的容器时, 也会首选这两种工具.

我没有针对arm64之类的镜像构建做过深入测试, 如果有这类需求, 建议还是自己确认下是否可行.

upterm改造(二)-支持VSCodeWeb

2022-06-18T20:11:29.000Z

接上文中, 我们已经支持本地的VSCode客户端连接, 但是我感觉这还不完整, 毕竟VSCode已经推出了web版, 比如vscode.dev以及github.dev. 未原生运行VSCode设备, 只要有浏览器支持就可以使用, 并且也支持iPad或是安卓平板这类设备,

因此我就继续深入改造了一下, 目前已经能提供网页版的VSCode功能:

在桌面端, 你完全不需要下载任何软件, 打开浏览器即可拥有全功能的VSCode, 适合手头没有电脑需要紧急借用别人电脑时的情况.
在iPad端, 虽然是个网页程序, 但是它在添加到桌面后已经能较为完美的融入生态, 并且提供的终端足够碾压iOS上的其他SSH工具.

服务器在香港, 配置也略低, 可能偏慢, 欢迎体验. 有关技术细节我也会再写一篇博客说明, 主要复用了upterm与uptermd通信使用的SSH隧道.

开启服务

1	bash <(curl -sL http://corvo.myseu.cn/scripts/upterm-web.sh)

PC端使用以及效果

使用浏览器打开后会预加载一些资源, 加载完成后, 可以点击按钮进入, 我建议你安装为软件后使用, 因为网页中的快捷键比如ctrl-w可能会触发页面关闭而不是编辑框关闭

在Edge中安装

只需要点击作为应用安装即可:

在Chrome中安装

Chrome中需要创建快捷方式, 并勾选在窗口中打开:

体验到VSCodeWeb

你可以使用VSCode的全部功能,

也可以打开一个终端来用:

iPad端使用以及效果

将地址拷贝之后在safari中打开

iPad也可以扫描电脑地址栏中的二维码打开响应链接

iPad桌面支持

只能在safari中使用, 但是我十分推荐. 毕竟为了Add to Home Screen的优雅效果, 我改了很多…

iPad桌面体验

就算是但从终端效果来看, 我觉得都能甩termius几条街, 更不用说完整的VSCode支持了.我没有秒控键盘, 只是拿普通的蓝牙键盘试了一次, 换成Win的蓝牙模式, 就可以方便使用Esc键了, 尤其适合Vim用户,基础的开发以及运维需求看起来完全没有问题, tmux这类工具也毫无压力.

应该算是扩展了iPad的代码生产力吧.

功能优化

静态文件的加载很慢, 可能要有几十秒, 所以我不得不单独写了一个加载页面. 这个地方很需要CDN支持
我在本地开发时无延迟, 但是实际交互上还是存在一点延迟问题, 还是服务器位置问题导致的
允许映射端口, 目前端口映射已经可以使用了, 但是还没能自动化. 我希望有插件能弹出提醒用户可以打开对应的端口
提供管理页面, 允许用户查看自己当前可以使用的VSCodeWeb服务
利用类似okteto等的公共Kubernetes, 允许用户在上面直接搭建和使用VSCodeWeb服务
结对编程? 分享链接时, 其实是使用了同一个 VSCodeWeb 服务端, 那么从理论上讲, 同个服务端上的结对编程完全有可能实现
考虑允许vscode.dev或是github.dev等网站直连一个VSCodeWeb服务, 最大程度的复用CDN资源

其中, 1,2涉及到用户体验的部分, 是可以氪金解决的, 不知道有没有大佬愿意赞助一波

其中, 6,7的功能会涉及到对VSCode代码的大量改动.

我没有详细了解Gitpod未来的发展方向, 我猜想结对编程可能是个点, 并且使用VSCodeWeb实现是较为合适的一个技术选型. Gitpod也很可能会这么做.

虽然微软提供用户使用Remote-SSH功能, 但是这个插件并未开源, 这就导致了我们基于Remote-SSH开发功能受到一定限制,最直接的就是端口转发功能, 还有多个ssh_config文件的支持. 我相信Gitpod也一定遇到过类似这样的问题.VSCodeWeb代码包括在VSCode源码中, 无论是改造, 还是加个插件都是切实可行的.

与Gitpod的关系和区别

虽然我一直有提到Gitpod, 但我希望读者能够认识到, upterm与Gitpod是有区别.

upterm拥有更加开放和底层的功能, 它是一个完善的基础工具, 也可以作为Gitpod的底层实现, 它不会主动提供机器供用户使用, 也不需要你登录Github账户

Gitpod从开发逻辑上来说, 是更加希望用户使用Gitpod的方式来每次启动新的Pod, 并且在它维护的Pod中启动VSCodeWeb服务. 它提供了完整的服务, 类似一个SaaS平台.

upterm改造(一)-支持VSCode远程连接任意容器

2022-04-23T18:35:58.000Z

我们的平台自从增加了dashboard功能, 从使用者们那边得到的反馈很多, 基本都是不稳定经常断线, 没法传文件这种问题.说明大家用的很多, 并且希望它能成为稳定的服务. 所以不管从功能性, 还是稳定性的角度, 我都应该考虑下对它进行扩展和改进.

博客分为两部分, 前半部分介绍如何使用, 后半部分针对工作原理进行简单说明. 公网自建的uptermd是个自用的小水管,经不起大风大浪, 请大家合理使用. 我不是很想用爱发电, 有心用的同学可以捐点服务器费用.

现在的代码放在这里了:

https://github.com/corvofeng/upterm

upterm安装与使用

安装

1	bash <(curl -sL http://corvo.myseu.cn/scripts/upterm.sh)

使用

你可以直接将上面的uri贴到浏览器中启动:

或者新开一个命令行:

当VSCode左下角有了这个图标, 就表示远程连接已经成功了

打开项目

Open Folder可以打开仓库

全功能Terminal

它是一个全功能的SSH服务器, 放大之后当个Terminal来用也可以, 也支持分屏

自动的本地端口转发

当你在远程的Linux中启动了端口之后, VSCode能帮你自动转发到本地, 可以获得接近原生的开发体验

还有很多功能, 用户可以自己探索下. 例如, 拷贝文件, 安装插件, 只要是VSCode remote支持的功能, 它都可以用

原理及扩展

你可以粗浅的认为这个工具拥有openssh-server+frp的功能

upterm做了什么

左右是两台机器, 其中一台机器使用upterm开启了服务, 另一台可以直接连接其session.

upterm是与tmate类似的工具(tmate可能相对多知名一点), upterm做了几个工作:

在本地建立ssh server
连接uptermd, 获取一个session id, 并打印
当用户连接了对应的session, 就有了与本地ssh server交互的权力

有兴趣的读者可以参考upterm项目主页上面的流程图

Remote SSH功能

这是VSCode官方的图, 可以认为是前端的代码编辑器与后端的Sever分离

结合一下

upterm已经提供给我们ssh连接的功能, 为什么不能直接使用VSCode的remote ssh功能呢. 这个要从remote ssh的实现说起,

当我们使用VSCode远程开发时, 它是这样连接的远程服务器:

1	ssh -T -D 1234 192.168.101.135 -p 2224 bash

这个命令需要拆开来看:

ssh -T 192.168.101.135 -p 2224 bash 这个命令的含义是远程连接服务器后, 不启动tty, 直接启动bash.
ssh -D 1234 xxxxx 表示本地建立一个socks5的转发服务, 具体使用可见OpenSSH系列(六)-正向代理与端口映射

所以只要我们的ssh服务器能够提供给VSCode这样的连接方式, 就可以了. 感谢Golang的库开发者, 让我有机会比较容易的建立一个ssh服务,具体的代码我放在gist中了, 有兴趣的读者可以去看:

https://gist.github.com/corvofeng/45c01edd33fa750e31653a90b1c4cdec

建立ssh连接之后的通信的过程: remote机器会下载一个code-server执行文件, 然后启动, VSCode之后仅与服务器中的code-server通信.

瓶颈以及扩展

从目前使用的情况来看, 现有的工具确实有一些瓶颈, 比如:

每次到一个新的容器中, 都需要重新下载一个code-server并启动, 会占用带宽
每次到一个新的容器中, 用户的插件配置也需要重新下载, 使用体验上没那么好
session id每次都会变, 可能会导致vscode保存的历史纪录太多了
目前vscode还不支持Alpine Linux, 手机端也要安装好完整的容器才可以使用
每个容器中的用户可能之后root, 所以多人合作使用一个容器的场景其实是有问题的

与Gitpod相比, 这个项目仅仅是能用, 还称不上好用:

用户的配置文件和插件的保存与下载, 至少要获得每个容器相对来讲一致的体验
企业级的功能和鉴权, 在企业内部使用的话, 还是希望能有一套基于OpenID或是Oauth的鉴权系统, 有了这个系统之后, session id就可以用它来进行替换
如果想要支持手机设备, 可能需要类似Gitpod一样有个网页版, 用户用起来会更加方便的

看到Gitpod两轮融了1600万美元, 真的还是有点心动. 现代安卓机器性能过剩很多,如果我们能支持Android, 就是相当不错的一个产品.

其他相关内容

从我一开始将Dashboard引入到系统中, 我就有个目标是允许我们的用户通过本地的ssh或是VSCode连接远程.因为我们的开发语言都是Python. 线上环境的Pod其实有一整套Python代码, 所以能够支持用户开发或者调试是很有必要的.下面是我做过的一些尝试和调研.

如何定制与裁剪Dashboard

Gitpod使用与简单原理分析

tmate的服务的使用

VSCode remote在Android上运行记录

总结

有人可能会说有的用就不错了, 用户可能完全可以用ssh+frp实现VSCode remote ssh功能, 但是这样的学习成本有点太高了,需要每次安装好多依赖, 很可能有需求也不会去这么用. 我主要想简化这个启动过程, 做到一条命令映射给VSCode可用的ssh server.功能做出来之后其实通用性很强的,

我已经将原理简单介绍过了, 安全性的话就见仁见智了, 建议经常性的重连来强制刷新token.

API网关功能以及未来展望

2022-04-13T22:32:37.000Z

我们平台项目中其实一直在考虑API网关的功能扩展, 目前使用的K8s Ingress以及Istio提供的Istio gateway, 额外功能实在不多, 仅仅能实现暴露接口的需求. 我近期也认真调研了下市场中的API网关产品, 针对这些产品, 简单介绍下功能以及给出一些自己对于未来发展方向的考量. 希望能抛砖引玉. 愿读者分享自己对于API网关的展望. 我提了一些方案, 有兴趣的读者可以业余一起做做看.

极简功能

目前我们所使用的网关有两种, 我在之前的博客中都有介绍: Kubernetes Ingress, Istio Ingress Gateway. 用的功能不多, 基本只有灰度和转发, 鉴权, 限流的功能完全没依靠它们实现.

Kubernetes Ingress

我们使用的是K8s社区基于OpenResty的实现, 与Service来配合使用:

---
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: arya-prod
spec:
  rules:
  - host: arya.example.com
    http:
      paths:
      - path: /
        backend:
          serviceName: arya-svc
          servicePort: 80

Istio Ingress Gateway

由于某些原因, 不得不使用这种Ingress, 需要一起使用Gateway和VirtualService, 也需要Service

# 指定要接收流量的gateway
---
apiVersion: networking.istio.io/v1alpha3
kind: Gateway
metadata:
  name: arya-gateway
  namespace:  xxx-group-2
spec:
  selector:
    istio: ingressgateway # use istio default controller
  servers:
  - port:
      number: 80
      name: http
      protocol: HTTP
    hosts:
    - "arya-python3.istio.xxx.com"

# virtual-service用于说明gateway的流量如何处理
# 可以看到, 这里是允许使用前缀路径来做转发的, 这种方案可以不需要DestinationRule
# 完全用kubernetes的service来做
---
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: arya-virtual-service
  namespace:  xxx-group-2
spec:
  hosts:
  - "arya-python3.istio.xxx.com"
  gateways:
  - arya-gateway
  http:
  - match:
    - uri:
        prefix: /static
    route:
    - destination:
        host: prod-arya-python3-static
  - match:
    - uri:
        prefix: /
    route:
    - destination:
        host: prod-arya-python3

现有的网关与插件功能

我个人认为网关不应该只有普通的转发功能, 还包括鉴权, 限流等功能, 这些功能应该是网关的一部分, 并且应该是可以插件化的. 我不一定要求直接编辑Nginx配置, 但是当我想增加扩展的时候, 希望可以有这么一个选项. 下面就按照我自己的调研内容.

Kong

Kong文档

之前看到Kong这个产品, 它的底层使用了OpenResty, 但是实现了插件系统, 可以说是Kubernetes社区Ingress的增强版. 也支持Python, Golang的一类插件, 我简单介绍下使用方式:

---
apiVersion: configuration.konghq.com/v1
plugin: openid-connect
kind: KongPlugin
metadata:
  name: oidc-auth
config:
  issuer: https://accounts.google.com/.well-known/openid-configuration
  client_id:
  - 
  client_secret:
  - 
  redirect_uri:
  - http://192.0.2.8.xip.io
---
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: productpage
  namespace: bookinfo
  annotations:
    konghq.com/plugins: oidc-auth  # 多个插件可以使用数组
spec:
  ingressClassName: kong
  rules:
  - http:
      paths:
      - path: /
        pathType: ImplementationSpecific
        backend:
          service:
            name: productpage
            port:
              number: 9080

我比较喜欢它的交互逻辑, 当你有多个域名时, 每个域名可以设置自己启用的插件及其配置.它已经是成熟的商业化产品, 所以可用性方面还是很强的, 很可惜目前还不支持Wasm.

Istio

Istio 文档

Istio中使用的Envoy, 已经支持了wasm插件.

apiVersion: extensions.istio.io/v1alpha1
kind: WasmPlugin
metadata:
  name: openid-connect
  namespace: istio-ingress
spec:
  selector:
    labels:
      istio: ingressgateway
  url: oci://private-registry:5000/openid-connect/openid:latest
  imagePullPolicy: IfNotPresent
  imagePullSecret: private-registry-pull-secret
  phase: AUTHN
  pluginConfig:
    openid_server: authn
    openid_realm: ingress

不过即使是最新版本的Istio对插件的支持都不怎么样, 没法单独针对一个virtual service增加插件. 这里的selector是针对ingress gateway的. 也就是说, 所有网关上的virtual service都会被影响. 而且多个插件的行为是使用proiority来控制的, 用户的交互会十分困难, 可用性太差了.

几种可能方向与技术预研

针对几种可能的方案, 我做了一些简单的探索和研究. 这里我贴出的方案, 我都调研了其可能的实现策略, 也都有把握将其落地. 读者有什么想法也可以一起与我交流.

针对Kong可能的优化

单从交互逻辑以及可用性方面, 我觉得没什么可优化的, 唯一让我觉得难受的地方就是无法使用wasm类型的插件.

有几种可能的方案:

类似kong的Golang, Python插件, 远程rpc调用来实现
Lua实现vm, 直接运行Wasm代码
将Wasm嵌入到OpenResty, 这是一种支持Wasm的思路: https://github.com/api7/wasm-nginx-module

我臆测这是Kong团队会考量后两种. 对于第一种, Python, Golang类插件所带来的维护成本, 用户体验也并不友好. 后面两种, 它对于Wasm是原生的支持.不管是后期维护, 还是性能方面, 感觉都会好很多.

针对Istio可能的优化

交互逻辑上

由于Envoy原生支持Wasm, 所以这块我比较看好. 但是如果想要作为网关, 交互逻辑上可能需要改造下, 绑定到VirtualService或是Gateway上是比较合理的.

---
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: arya-virtual-service
  namespace:  xxx-group-2
  annotations:
    istio.io/plugins: oidc-auth  # 多个插件可以使用数组
spec:
  hosts:
  - "arya-python3.istio.xxx.com"
  gateways:
  - arya-gateway
  http:
  - match:
    - uri:
        prefix: /static
    route:
    - destination:
        host: prod-arya-python3-static
  - match:
    - uri:
        prefix: /
    route:
    - destination:
        host: prod-arya-python3

Envoy Lua插件支持

为什么要支持Lua插件我看中的是Kong现有的插件生态. 几乎所有的Lua插件都是经过了企业级的认证, 如果能在Istio+Envoy中直接使用, 相信很多用户会愿意使用Envoy作为网关.

Lua插件的支持其实有两种可行方案的:

Lua直接编译到wasm, 据我搜集到的资料来看, 没有现成的编译器, 需要自己手写
近期看到, 网易数帆针对Envoy添加了Lua支持, 也就可以考虑模拟Kong的PDK来使用其插件

https://xie.infoq.cn/article/1cb74a7512460b7d4dbc9f42c

博客中内容, 我觉得性能检测那边有点问题, 无论何种语言编写的wasm插件, 它已经变成了类似汇编的字节码, 性能差距不应该很大, 博客中以C++来做最有的效果衡量让我感觉不是很有说服力. 但是博客切实的将Lua嵌入到了Envoy, 性能可以慢慢优化, 做出来成品还是很重要的.

扩展型sidecar

我的博客中有许多讨论PaaS平台建设的文章, 我本人也在维护一个PaaS平台, 所以我也从PaaS的角度给出一些方案.

上面两种改造方案是需要我们去改进控制器以及底层代码来实现的. 对于一个PaaS平台来说, 我们不会深入到这样的底层系统, 对它改造太困难了.如果我们想要拥有完善的网关功能, 同时考虑用户的交互逻辑, 比较好的策略是用户在代码中指定一些特殊配置, 无论是使用nginx, lua或是wasm配置,我们都对其支持. 使用类似Istio中sidecar的形式, 该sidecar仅作为API网关, 并不截取所有流量. 这样考虑有两点:

性能问题, sidecar与pod扩缩容绑定, 理论上讲与Istio的性能一致
扩展性很重要, 如果我们只是简单的使用Istio, 用户的需求很可能无法尽快满足, 这一点上的响应速度会很慢

个人看法与PaaS平台方向

技术本身没有什么好坏, 只有适合不适合.

对于PaaS平台, 可扩展性和简易的交互逻辑是很重要的, 我们有成百上千个小项目, 就会有各种各样的需求. 我们不能寄希望于完全使用Istio的描述文件来扩展平台功能, 而是应该总结需求的底层逻辑, 在现有方案无法支持的情况下提出备用方案给用户. 我们应该会采用扩展型sidecar的形式, 允许用户写一部分配置并托管到Git仓库.

我个人喜好, 当我个人用K8s维护几个小的项目时, 我自己倒是很希望一些功能的插件化, 因此我个人比较喜欢类似Kong插件的形式进行交互, 但是我又想要有Wasm的支持. 所以我会偏好Istio+Envoy的形式, 如果能够改进Wasm的插件形式并且使用有Lua功能支持的Envoy, 我可能会把自己的项目全部切到Istio上.业余时间应该我会考虑改进Istio的控制器.

总结

文章篇幅比较多, 你可以把它理解为一份调查报告. 基本都是现有的业务逻辑分析, 还有个人拙见. 大佬们觉得对于哪种方向有看法或是兴趣, 都很欢迎与我讨论和沟通.

Kubernetes中CronJob的改进以及我们的定制化需求

2022-02-27T13:50:16.000Z

先前的博客中介绍了我们对K8s定时的使用以及K8s中定时任务的源码实现, 但是实际使用过后, 发现在使用时会遇到一些问题, 我就这些问题分别探讨下解决方案, 希望能对大家有所帮助, 最后会附上建议.

Kubernetes中Cron任务的一些使用 Kubernetes中CronJob源码阅读

遇到的几个问题

机器上大量定时任务的存在, 导致docker的负担很重, 严重时甚至影响内核速度, 具体现象请看记一次Kubernetes机器内核问题排查

我认为这一点并不是K8s的设计有问题, 设计之初没有考虑到docker在机器上的性能不够, 无法批量快速的创建容器, 并且会拖慢整个系统.此问题的我们是通过物理隔离来解决的, 将定时任务限制在固定的几台机器, 能有效降低集群中其他机器的内核问题的出现概率.

定时任务运行时间非常不准确, 有些任务的执行时间会被拖到延迟几分钟,

延迟问题的出现并不是单一的原因, 有以下几种类型:
K8s本身调度延迟, 本应该按时启动的任务拖了很久
与上面的原因一致, 机器中docker的负担太重, 几秒可以启动的容器慢了半分钟, 我不太清楚这个问题在读者的集群中是否有出现, 但是我们的集群中特别明显, Pod处于ContainerCreating的状态会很久

K8s对于定时任务的改进

在2021年的时候, CronJob API到了GA阶段, 一个重要的变动就是将定时任务控制器换成了v2. 原文在这里.

https://kubernetes.io/blog/2021/04/09/kubernetes-release-1.21-cronjob-ga/

原始的控制器, 每10秒检查所有的定时任务是否需要执行, 这个操作只能由单个worker来实现, 具有O(n)的线性复杂度, 当定时任务过多的时候, 性能会变得糟糕.K8s在1.19引入了新的定时任务控制器, 转变了实现的策略.

我们对于定时任务的改进

背景

上述K8s对于定时任务的优化, 我们集群时用不上的, 因为集群比较旧, 还没有这种支持. 另外一点就是, 上面的方案仅仅降低了任务调度时的时间, docker负担太重的问题仍然没有解决.鉴于机器负担过重, 以及定时任务执行时间不准确的问题, 我们提出了一个解决方案, 将高频运行定时任务的Jod生命周期延长.

方案设计

举例来说, 用户期望/bin/my_script要每分钟运行一次. 针对我们的方案, 启动Pod后, 人为使Pod存在1小时或是更久的时间, 在Pod内部添加cronjob调度, 每分钟执行一次/bin/my_script.当然Pod存在的时间是可以调整的, 我们人为的设定是一小时, 为了使任务能够分散的到各个运行机器中.

原始的CronJob如下

apiVersion: batch/v1beta1
kind: CronJob
metadata:
  name: hello
spec:
  schedule: "* * * * *"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: hello
            image: busybox
            args:
            - /bin/sh
            - -c
            - date; echo Hello from the Kubernetes cluster
          restartPolicy: OnFailure

改造后的CronJob如下

apiVersion: batch/v1beta1
kind: CronJob
metadata:
  name: hello
spec:
  # 降低运行频率
  schedule: "0 * * * *"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: hello
            image: busybox
            args:
            - /bin/do-cron # 通过自己的脚本, 创建cronjob, 开启crond
            - /bin/sh
            - -c
            - date; echo Hello from the Kubernetes cluster
  env:
            - name: CRON_SCHEDULE  # 通过环境变量, 将原始的cron传入容器中
              value: "* * * * *"
          restartPolicy: OnFailure

方案存在的问题以及如何解决

方案的好处:

机器的负担大大降低, 1小时创建60个Pod, 变成了1小时1个Pod
定时任务的运行时机更加准确, 单机的任务每分钟运行基本不存在误差, 对于比较需要精细控制的定时任务十分友好

这样会带来的一些问题:

将Pod生命周期延长, 每次Pod启动, 上一个Pod可能已经关闭, 或是还未关闭, 会造成任务丢失或是任务重复
将Pod生命周期延长, 每个Pod可能会并行执行多个任务, 会使得资源控制不够精确

针对第一个问题, 我们可以通过一定机制避免其发生, 但是针对第二个问题, 由于设计本身的问题, 没有什么比较好的解决方案. 在实际使用上, 我们遇到的高频定时任务对资源不是很敏感.

如何确保定时任务的可用性及稳定性

这个部分涉及到实现的细节部分, 我只是介绍下一些逻辑, 不涉及到具体代码, 需要考虑的方面有以下两个:

如何能够无缝的衔接定时任务的执行, 确保不会丢失或是重复
在用户修改任务或是部署新版本后，如何能够尽快的刷新更新定时任务

容器冗余

不丢失任务:

在启动新的Pod之后, 旧的Pod并不会马上下线, 我们为其提供了一小段缓存区间, 如图所示, 时间轴上的虚线区域, 两个Pod同时在运行. 如此设计, 我们可以保证不会丢失任务

不重复任务:

我们的每个容器有容器令牌的概念. Pod1运行时, 拥有令牌, 当我们启动Pod2后, Pod1会在合适的时机释放令牌, Pod2只有获得到令牌之后才可以执行定时任务. 释放以及获取令牌的时机也很重要, 对于Pod1我们会在某一分钟开始后第10s开始释放, 也就是在一分钟的前半段释放令牌, Pod2就可以拥有50s左右的时间获取该令牌, 这个时间很充足, 足够Pod2获取应用令牌, 开始执行下一次任务.

分离执行

定时任务的执行中, 用户很有可能在非整点的时候切换版本或是修改定时任务.一旦发生, 上述的容器冗余能保证我们在下个调度周期更新, 但是用户修改任务或是上线版本时, 希望它能够马上生效, 而不是等待(有可能一个小时后才生效).基于此设想, 我们考虑了一种分离普通定时任务与手动改变任务的方式, 下面就是具体的逻辑图:

这里的实现主要使用了K8s的定时任务的一个功能:kubectl create job --from=cronjob/ 手动创建的脚本也同样会获取令牌, Pod1会提前结束, 一直到Pod2开始运行前, Manual Pod都承担运行脚本的任务. 这里的思路就是分离日常行为以及突发行为.

使用定时任务的建议

确定定时任务量级, 是每小时一次还是每分钟分钟一次
确定定时任务运行延迟的容忍度, 是否能接受定时任务慢几分钟
物理隔离定时任务机器, 即使使用了我们自己的策略, 每个定时任务的Pod生命周期增加了, 我们也发现定时机器io使用率很高, 建议这类机器直接加SSD.
注意做好日志记录, 以及相关报警

总结

我只是粗浅的介绍下我们对于定时任务的优化, 具体的细节有很多, 特别是对定时任务的监控代码比它的实现代码还要多. 我们的策略已经在线上运行了超过一年, 应该是比较稳定的功能了, 所以把设计策略分享出来给大家参考下.

有些时候我们使用某些框架可能正好是顺手就用, 但是随着业务的发展, 需要逐步对框架进行定制以及优化来适应业务需求. 可持续的解决业务开发需求, 才能有效推进K8s组件的落地.

用了开源的组件就要有觉悟, 你需要自己去定制某些策略来解决问题, 你的任何行为也也不会有人对你负责. 可以看下这篇帖子自己搭的Gitlab开放到公网被黑了.

记我们K8s集群中flannel遇到的两个问题

2022-02-18T21:53:01.000Z

自建的K8s集群的坑不少, 尤其是到了Node数量越来越多之后, 问题也逐渐显露了出来, 博客主要介绍我们使用flannel之后遇到的两个问题以及解决方案, 问题其实不严重, 只是涉及到了底层的结构, 改动时候要小心.

问题1 flannel的OOM问题

官方给出的配置

下面这张图是官方的配置, 可以看到, 默认的资源设置仅给定了50M内存

kubectl -n kube-system describe ds kube-flannel-ds-amd64
    Limits:
      cpu:     100m
      memory:  50Mi
    Requests:
      cpu:     100m
      memory:  50Mi

我们遇到的问题

当我们的机器数量超过100个以后, flannel会以OOM的形式一直挂掉..

1	Feb 9 04:52:44 kernel: [37630249.323630] Memory cgroup out of memory: Kill process 33838 (flanneld) score 1653 or sacrifice child

通过Prometheus采集到的数据也可以看到, 容器的内存使用情况很不乐观:

也没什么好的解决方案, 只能调整资源限制了.

问题2 flannel指定网卡问题

问题背景

因为我们使用的机器比较混杂, 机器的网卡也各不相同, 在开始搭建集群时就遇到了下面的问题.

> 我们虚拟机中的网卡, 仅有`10`开头的内网地址
1: lo:  mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
2: eth0:  mtu 1400 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 52:xx:xx:xx:77:0c brd ff:ff:ff:ff:ff:ff
    inet 10.xxx.xxx.xxx/26 brd 10.xxx.xxx.xxx scope global eth0
       valid_lft forever preferred_lft forever

> 物理机中的网卡, 既有`59`开头的公网地址, 也有`10`开头的内网地址, 并且网卡名为eth1
1: lo:  mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
2: eth0:  mtu 1500 qdisc mq state UP group default qlen 1000
    link/ether 8c:xx:xx:xx:xx:xx brd ff:ff:ff:ff:ff:ff
    inet 59.xxx.xxx.xxx/24 brd 59.xxx.xxx.xx scope global eth0
       valid_lft forever preferred_lft forever
3: eth1:  mtu 1500 qdisc mq state UP group default qlen 1000
    link/ether 8c:xx:xx:xx:xx:38 brd ff:ff:ff:ff:ff:ff
    inet 10.xxx.xxx.xxx/24 brd 10.xxx.xxx.xxx scope global eth1
       valid_lft forever preferred_lft forever

这样带来的问题就是flannel通信问题, 如果多个网卡, 且启动时未指定, flannel会找一个缺省的网卡, 对于虚拟机来讲没有关系,但是对于物理机, flannel会找到eth0这个外网网卡, flannel使用错误的网卡发送数据, 抓包的数据可以看出flannel使用了公网的网卡发送内网数据, 会被交换机丢弃, 具体图片就不贴了, IP属于公司机密.

具体的修改方法是确保flannel使用了正确的网卡, 需要在启动时指定参数--iface与--iface-regex:我们的虚拟机数量少, 物理机数量多. 除了eth1, 还有bond1这种网卡名, 因此针对虚拟机, 统一将其eth0改名变成eth1,而后指定了-iface-regex=eth1|bond1这样的配置, 对于后续增加物理机更友好.

问题到这里似乎就结束了, 但是随着flannel经常发生OOM重启, 暴露了我们的设置问题.

我们发现flannel OOM后无法正常重启

1
2
3

NAME                                                    READY   STATUS             RESTARTS   AGE     IP               NODE                                 NOMINATED NODE   READINESS GATES
kube-flannel-ds-amd64-54c5p                             0/1     CrashLoopBackOff   1604       516d    10.xx.xx.xx xxxxx                    
kube-flannel-ds-amd64-cmczh                             0/1     CrashLoopBackOff   89         388d    10.xx.xx.xx yyyyy

为什么一开始没出现, 但是重启又会发生呢, 问题出在了正则表达式上. K8s在机器上启动容器时, 会创建虚拟的网卡. 这些网卡的名字类似veth17f90f70@if3, 这样网卡名称的也会被正则表达式匹配到, 导致flannel无法启动, 临时的解决方案就是把机器上的容器移走,vethxxx网卡会自动删除, flannel也就自动恢复了.

当然根本的解决方案是修改正则配置: - -iface-regex="^(bond1|eth1)$" 使flannel更加精准的匹配网卡名称.

flannel 配置更新与验证

更新准备

因为不太了解flannel是否处理流量, 更新flannel时有点害怕, 直到看到了这里的架构.

flannel的功能主要是负责机器上路由表的修改, 也就是说, 只要不增删机器, flannel挂掉也没关系, 因为路由表不需要修改.

更新

我们有100多台节点, 整个集群更新过程大概持续了1个多小时, 更新过程中服务完全正常.

验证可用性

内存使用情况:

为了验证flannel是否可用, 我们将一台node删除, 观察到其他机器上的路由表也同步进行了修改.

总结

问题出现不可怕, 重要的是加好监控及时报警, 我们之前一直对kube-system的监控没有做到很好, flannel一直启动不成功的问题是我检查时发现的,
使用别人提供的yaml文件前, 要注意下资源设置的, 类似Prometheus也有这种问题的, 它对内存的要求很高
预算充足就不要自建集群了, 有不少运维问题的, 万一出现一个解决不了的就很麻烦, 类似上次那篇文章: 记一次Kubernetes机器内核问题排查

希望我们的经验能帮助到使用K8s的各位读者.

Gitpod使用与简单原理分析

2021-12-11T21:12:18.000Z

Gitpod是一个可以直接打开Github项目的的网页版VSCode, 我一开始使用的时候, 它仅提供了网页版, 使用起来十分不便. 前些天再去试用时, 发现已经可以直接打开本地的VSCode, 类似remote ssh的功能, 感觉这个工具潜力很大, 有兴趣的读者可以找个Github项目探索下. 这里我就简单分析下使用方式和原理, 后半部分是对于开发模式和开发工具未来方向的探讨.

我是Python后端的程序员, 主要负责PaaS平台的治理, 博客中的描述仅仅是自己的一些见解.

简单使用

安装Gitpod插件, 或是直接用Github帐号登录Gitpod
找个Github项目打开

网页端效果

现在也支持了在本地VSCode中打开, 打开后的效果就和普通的remote ssh一致

跳转过去之后, 会先安装Gitpod插件, 然后再打开

如果你想用本地的ssh登录, 也可以, 看这里就能看到具体的ssh配置

这是登录命令:

1	ssh -F /tmp/gitpod_ssh_config-216243-zxK2tQ5tHG0H moccasin-capybara-78upia72

Pod内部信息以及ssh工作工作原理解析

Pod内部是用supervisor来启动, sshd, vscode web服务是比较正常的,令人比较意外的是它支持了docker内部运行docker.

# 系统是`Ubuntu 20.04`
gitpod ~ $ cat /etc/*-release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=20.04
DISTRIB_CODENAME=focal
DISTRIB_DESCRIPTION="Ubuntu 20.04.2 LTS"

# 可以直接切换到root用户
gitpod ~ $ sudo su
# 用visudo来看的话, 可以看到在sudo组里的用户不需要root权限密码
# gitpod ~ $ visudo
# %sudo ALL=NOPASSWD:ALL


# 这个地址是来自于GCP
gitpod ~ $ curl ip.sb 
34.127.117.8

# 这个workspace目录是挂载进来的, 所以上面的内容应该会保留
# 我有点奇怪, 为什么不把它挂到 /home/gitpod/workspace, 感觉可能更加合理
gitpod ~ $ df -Th
/dev/md42        xfs       30G  114M   30G   1% /workspace


# 本地启动了sshd服务, 不过端口不是默认22, 而是23001, 但是这里权限给的太大了, 这个sshd监听127.0.0.1就可以了
gitpod / $ sudo ss -tunlp
Netid  State   Recv-Q  Send-Q   Local Address:Port    Peer Address:Port  Process                              
tcp    LISTEN  0       128         10.0.2.100:40799        0.0.0.0:*      users:(("supervisor",pid=1,fd=38))  
tcp    LISTEN  0       511          127.0.0.1:40799        0.0.0.0:*      users:(("node",pid=1084,fd=19))     
tcp    LISTEN  0       128                  *:22999              *:*      users:(("supervisor",pid=1,fd=10))  
tcp    LISTEN  0       511                  *:23000              *:*      users:(("node",pid=348,fd=19))      
tcp    LISTEN  0       128                  *:23001              *:*      users:(("supervisor",pid=1,fd=8))

supervisor进程

我一开始以为这个supervisor是Python的那个, 后来我去Github官网找了找代码,发现它是一个自己写的Golang服务:

VSCode远程连接方式

使用本地的VSCode打开时, 可以看到这里有一个ssh target

其中的配置文件类似如下:

Host moccasin-capybara-78upia72
HostName 127.0.0.1
User gitpod
Port 36129
IdentityFile /tmp/gitpod_bb1491a6-d26d-4e40-b0ae-d0b34a2d19f3_id_rsa

看起来它是直接连接了一个本地的端口, 具体这个端口是谁创建的呢, 找了一下是gitpod-local-co,这个操作应该是类似frp的stcp模式, 把远程的ssh端口映射到了本地.

1 2	# ss -tunlp \| grep 36129 tcp LISTEN 0 4096 127.0.0.1:36129 0.0.0.0:* users:(("gitpod-local-co",pid=217415,fd=14))

su root

visudo可以看到%sudo组的用户可以不需要密码直接切换到root,gitpod属于这个组, 所以sudo命令直接可以用.

需要考虑的问题

VSCode当前只允许添加一个ssh配置文件, 因此会令用户自己的配置文件失效, 很坑

pod内部的ssh端口, 应该仅监听127.0.0.1, 因为这个端口是被映射出去使用的, 避免Pod直接被外部访问
pod的ssh key要注意, 每次生成pod时要重新产生
pod的生命周期一点要短, 最好VSCode关闭时就马上退出, 也许有人认为pod应该一直在后台运行, 但是这样其实加大了风险, 如果想要运行后台类型的任务, 应该用在线的容器, 而不是开发工具中的容器, 而且这个容器一旦出现安全问题, 可能会影响这个用户的所有仓库.
每个用户的每个应用都器要有自己单独的pod, 避免互相影响.
鉴权很重要, 需要在穿透建立连接时就把权限控制做好, 只有有权限的用户才会在本地建立连接端口, 内网穿透时, 没有权限的用户就不给做
如何防止被用户滥用, 我们提供了一个完整功能的root shell, 别有用心的用户一定会薅羊毛挖矿.

几个短期优化点

抽离主要代码: Gitpod中当前服务端, 应该做成一个单独的服务. 启动之后, 可以直接在Gitpod网页后台中看到, 并且可以直接调用VSCode打开工作区, 这样, 可以在用户自己的容器中运行服务端, 解决用户自建容器的内网穿透和VSCode web版无法使用的功能, 这个才是个人用户想要的功能
自定义镜像功能: 针对某个仓库, 应该允许用户自定义Dockerfile, 或是自定义镜像, 间接实现开发环境规范化
实现秒开: 因为Pod需要在VSCode关闭后停止服务, 那么用户下次打开时, 如何做到秒开呢? 我认为可以在关闭时, 删除ssh key, 动态的调整cpu到0.01核, 确保无法访问, 无法对外服务. 用户重新打开时, 再生成新的key, 调大cpu限制, 相比于重新启动容器应该会快很多.
服务对外访问: 对于后台代码, 修改之后能够立刻看到效果是最重要的, 可以利用VSCode的端口映射功能转给本地. 需要给别人演示时, 也可以将端口临时映射到公网或是功能开发环境中.

本地开发环境的劣势

每个人的开发环境很容易不一致, 即使有详细的代码规范, 每个人需要针对代码在本地重新配置一份环境
代码提示工具对性能的要求越来越高, 我在本地上用TabNine, 一个项目内存会占到10多个G, 我16G的电脑不够用的. 还有Copilot, 我本地也不敢用
个人的电脑很少会考虑磁盘冗余技术, 备份很可能也不经常进行, 可能存在代码文件丢失问题

开发环境上云应该是一种趋势, 无论是VSCode的remote ssh功能, 还是JetBrains新推出的Fleet, 都传达出了这么一种信号.

Gitpod未来发展

确立主要用途: 从我个人角度来看, Gitpod十分适合于远程调试开发和调试非编译型语言, 尤其适合于Python, Ruby, NodeJS, 甚至对于Python应用, 完全可以把线上环境容器打包重新启动, 在Gitpod中的环境中进行开发调试, 相当于拥有了一个于线上环境完全一致的开发环境.
个人版与企业版分离: 针对个人开发者, 提供公有云服务, 可以考虑计费. 针对企业应该提供企业版, 因为未来即使有远程开发环境的功能一定是企业内部自建的, 因为它们不太可能将内部代码放在公有云环境中, 如果能提供一套适合企业的解决方案, 并且有人用, 应该能长久运营.

总结

我之前就有在使用github1s和github.dev来读代码, 直到发现了Gitpod.相比于前两个仅能读代码的功能, Gitpod提供了更加完善的体验, 你可以利用它push代码,可以完整的接手开发工作, 这一点带给用户的体验会很好. 希望社区版能长久的存活下去吧,我的开源项目不多, 如果真的有需要, 我很愿意进一步使用这个工具并且付费.

我不是产品经理, 后面的内容单单就我自己的看法探讨一下项目未来的发展趋势, 可能就是在瞎扯吧.

Kubernetes Dashboard定制化简介

2021-09-09T20:11:47.000Z

我先前一篇博客其实介绍了另一种Dashboard提供方案, 当时的方案中, 没有涉及到Dashboard的二次开发,先前的方案适合rbac可用的集群, 当前的这个方案适用性更广, 你仅需要有一个kubeconfig文件, 就可以提供一个权限控制完善的Dashboard提供用户使用.

Dashboard本身的权限控制功能太弱了, 而前端的页面多而复杂, 想要结合到我们平台上,需要精简一下前端, 然后改变后端的鉴权方式, 整个过程的修改应该尽量的小,以便我们日后能随着Dashboard的更新来更新, 不然某天出现了安全问题需要更新就很难打patch了.

本次修改不需要你提前会用Dashboard, 但是要对K8s的API有一定的了解,然后再读一下Dashboard的代码. 它的前端是Angular, 后端是Golang.

一般写的不错的代码, 风格都差不多, 大多都践行了表驱动法和中间件的思想.前端页面中的配置文件肯定时放在一起的, 后端肯定是有中间件的, 我们添加鉴权模块就可以了.

先把程序跑起来

首先你要由一个能用的kubeconfig文件, 保证自己的kubectl操作可用.

我的上一篇博客中介绍了kubectl proxy的使用, 如果你有兴趣可以读一下, 相信你对Kubernetes API的概念会有更深的理解.

前端

前端运行起来比较简单

1	> yarn start:frontend

打开websocket支持

有一点你要注意, 默认去读的配置aio/proxy.conf.json中, 没有显式的开启websocket,所以shell页面不是的使用方式不是长连接, 如果你想在本地调试时也使用全功能的webshell,可以改成下面这样.

{
  "/api": {
    "target": "http://localhost:9090",
    "secure": false,
    "ws": true,
    "changeOrigin": true
  },
  "/config": {
    "target": "http://localhost:9090",
    "secure": false,
    "ws": true,
    "changeOrigin": true
  }
}

后端

我个人不太喜欢Golang一定要编译出二进制文件才能运行, 一般都是go run main.go直接来跑的.

> cd src/app/backend/
> go run dashboard.go --kubeconfig /home/corvo/.kube/config \
    --metrics-provider none \
    --disable-settings-authorizer \
    --insecure-port 9090

然后打开前端页面, 应该是有个全功能的Dashboard.

前端页面裁剪

侧边栏裁剪

具体的代码在src/app/frontend/chrome/nav/template.html中,可以调整顺序, 并且把一些不需要的组件去掉

<kd-nav-item class="kd-nav-item"
             state="/cronjob"
             id="nav-cronjob"
             i18n>Cron Jobs
kd-nav-item>

精简serach功能

因为搜索框的触发时, 会搜索所有给定的资源, 因为我们单个NS的pods可能会很多,会导致搜索框的效率缓慢, 因此, 将搜索逻辑的某些组件也隐藏掉,当然也可以在这里调整显示顺序
具体的代码在src/app/frontend/search/template.html

<kd-job-list (onchange)="onListUpdate($event)"
             [hideable]="true">kd-job-list>