安全上下文定义了Pod或容器的特权和访问控制设置。 安全上下文设置包括但不限于:
自由访问控制:访问对象(如文件)的权限是基于user ID(UID)和 group ID(GID)。
Security Enhanced Linux (SELinux): 为对象分配了安全标签。
以特权或非特权身份运行。
Linux Capabilities: 为进程提供一些特权,但不是root用户的所有特权。
AppArmor: 使用程序配置文件来限制单个程序的功能。
Seccomp: 过滤一个进程的系统调用。
AllowPrivilegeEscalation:控制进程是否可以比其父进程获得更多的特权。该布尔值直接控制在容器进程上是否设置了no_new_privs
标志。 在以下情况下,AllowPrivilegeEscalation始终为true:
1)以特权OR运行;
2)具有CAP_SYS_ADMIN
。
readOnlyRootFilesystem: 将容器的root文件系统挂载为只读。
上述项目并不是一套完整的安全上下文设置 - 请参阅安全上下文SecurityContext完整列表。
有关Linux中的安全性机制的更多信息,请参见Overview of Linux Kernel Security Features
要为Pod指定安全设置,需要在Pod sepc
中增加securityContext
字段。securityContext字段是PodSecurityContext对象。为Pod指定的安全设置将应用到Pod中的所有容器。下面是一个有securityContext
和emptyDir
卷的Pod的配置文件:
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo
spec:
securityContext:
runAsUser: 1000
runAsGroup: 3000
fsGroup: 2000
volumes:
- name: sec-ctx-vol
emptyDir: {}
containers:
- name: sec-ctx-demo
image: busybox
command: [ "sh", "-c", "sleep 1h" ]
volumeMounts:
- name: sec-ctx-vol
mountPath: /data/demo
securityContext:
allowPrivilegeEscalation: false
在配置文件中,runAsUser
字段指定对于Pod中的所有容器,所有进程都以用户ID1000
运行。runAsGroup
字段为Pod的任何容器中的所有进程指定主要组ID3000
。如果省略此字段,则容器的主要组ID将为root(0)
。指定runAsGroup
时,用户1000和组3000也将拥有所有创建的文件。由于指定了fsGroup
字段,因此容器的所有进程也会补充组ID 2000的一部分。卷/data/demo
以及在该卷中创建的任何文件的所有者均为组ID2000
。
创建Pod:
kubectl apply -f https://k8s.io/examples/pods/security/security-context.yaml
验证Pod容器是否运行:
kubectl get pod security-context-demo
获取正在运行的容器的shell:
kubectl exec -it security-context-demo -- sh
在shell中,列出正在运行的进程:
ps
输出显示进程正在以用户1000
的身份运行,这是runAsUser
的值:
PID USER TIME COMMAND
1 1000 0:00 sleep 1h
6 1000 0:00 sh
...
进到/data
,并列出目录。
cd /data
ls -l
输出显示,/data/demo
目录包含组ID2000
,也就是fsGroup
的值。
drwxrwsrwx 2 root 2000 4096 Jun 6 20:08 demo
到 /data/demo
目录中, 创建一个文件:
cd demo
echo hello > testfile
列出 /data/demo
目录:
ls -l
输出显示testfile
具有组ID 2000,这是fsGroup
的值。
-rw-r--r-- 1 1000 2000 6 Jun 6 20:08 testfile
运行以下命令
$ id
uid=1000 gid=3000 groups=2000
你会看到gid是3000,与runAsGroup
字段相同。如果省略了 "runAsGroup",那么gid将保持为0(root),并且进程将能够与root(0)组所拥有的文件进行交互,并且具有root(0)组所需的组权限。
最后,退出shell:
exit
默认情况下,Kubernetes递归地更改每个卷内容的所有权和权限,以匹配装入该卷时Pod的securityContext
中指定的fsGroup
。 对于数据量大的卷
,检查和更改所有权和权限可能会花费大量时间,从而减慢了Pod的启动速度。 您可以在securityContext
中使用fsGroupChangePolicy
字段来控制Kubernetes检查和管理卷的所有权和权限的方式。
fsGroupChangePolicy - fsGroupChangePolicy
定义了在暴露于Pod中之前更改卷的所有权和权限的行为。该字段仅适用于支持fsGroup
控制的所有权和权限的卷类型。 该字段具有两个可能的值:
OnRootMismatch:仅当根目录的权限和所有权与卷的预期权限不匹配时,才更改权限和所有权。这可以帮助缩短更改卷的所有权和权限所需的时间。
Always: 挂载卷后,始终会变更卷的权限和所有权。
例如:
securityContext:
runAsUser: 1000
runAsGroup: 3000
fsGroup: 2000
fsGroupChangePolicy: "OnRootMismatch"
这是一个Alpha功能。要使用它,请为kube-api-server
,kube-controller-manager
和kubelet
启用功能门ConfigurableFSGroupPolicy
。
注意:此字段对临时卷类型(例如secret,configMap和emptydir)无效。
要为容器指定安全设置,只要容器中包括securityContext
字段,当它们重叠时,会覆盖在Pod级别的设置。容器级别的设置不会影响Pod的设置。
这是一个容器的Pod的配置文件。 Pod和Container都有一个securityContext
字段:
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo-2
spec:
securityContext:
runAsUser: 1000
containers:
- name: sec-ctx-demo-2
image: gcr.io/google-samples/node-hello:1.0
securityContext:
runAsUser: 2000
allowPrivilegeEscalation: false
创建Pod:
kubectl apply -f https://k8s.io/examples/pods/security/security-context-2.yaml
验证是否运行成功:
kubectl get pod security-context-demo-2
进入容器:
kubectl exec -it security-context-demo-2 -- sh
运行进程命令:
ps aux
输出显示进程正在以用户2000
身份运行。这是为Container指定的runAsUser
的值。 它会覆盖为Pod指定的值1000。
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
2000 1 0.0 0.0 4336 764 ? Ss 20:36 0:00 /bin/sh -c node server.js
2000 8 0.1 0.5 772124 22604 ? Sl 20:36 0:00 node server.js
...
退出shell:
exit
使用Linux功能,您可以授予进程某些特权,而无需授予root用户的所有特权。要为容器添加或删除Linux功能,可在Container清单的securityContext
中包含功能字段。
首先,查看不包含功能字段时会发生什么。这是不添加或删除任何容器功能的配置文件:
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo-3
spec:
containers:
- name: sec-ctx-3
image: gcr.io/google-samples/node-hello:1.0
创建Pod:
kubectl apply -f https://k8s.io/examples/pods/security/security-context-3.yaml
验证容器是否运行成功:
kubectl get pod security-context-demo-3
进入到容器:
kubectl exec -it security-context-demo-3 -- sh
列出正在运行的进程:
ps aux
输出显示容器的进程ID(PID):
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 4336 796 ? Ss 18:17 0:00 /bin/sh -c node server.js
root 5 0.1 0.5 772124 22700 ? Sl 18:17 0:00 node server.js
查看进程1的状态:
cd /proc/1
cat status
The output shows the for the process:
输出显示该进程的功能图(capabilities bitmap):
...
CapPrm: 00000000a80425fb
CapEff: 00000000a80425fb
...
记下功能位图,然后退出:
exit
接下来,运行与前面的容器相同的容器,该配置增加了CAP_NET_ADMIN
和CAP_SYS_TIME
:
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo-4
spec:
containers:
- name: sec-ctx-4
image: gcr.io/google-samples/node-hello:1.0
securityContext:
capabilities:
add: ["NET_ADMIN", "SYS_TIME"]
创建Pod:
kubectl apply -f https://k8s.io/examples/pods/security/security-context-4.yaml
进入容器:
kubectl exec -it security-context-demo-4 -- sh
查看进程1:
cd /proc/1
cat status
输出显示该进程的功能位图:
...
CapPrm: 00000000aa0435fb
CapEff: 00000000aa0435fb
...
比较两个容器的功能:
00000000a80425fb
00000000aa0435fb
在第一个容器的功能位图中,位12和25被清除。在第二个容器中,设置了位12和25。位12是CAP_NET_ADMIN
,位25是CAP_SYS_TIME
。 有关功能常数的定义,请参见capability.h。
注意:Linux功能常数的格式为
CAP_XXX
。 但是,当您在Container清单中列出功能时,必须忽略常量的CAP_
部分。 例如,要添加CAP_SYS_TIME
,需要在功能列表中包括SYS_TIME
。
SELinux
标签分配给容器要将SELinux
标签分配给容器,只在Pod或容器的securityContext
部分中包含seLinuxOptions
字段,示例如下:
...
securityContext:
seLinuxOptions:
level: "s0:c123,c456"
注:要分配SELinux标签,必须在主机操作系统上加载SELinux安全模块。
删除Pod:
kubectl delete pod security-context-demo
kubectl delete pod security-context-demo-2
kubectl delete pod security-context-demo-3
kubectl delete pod security-context-demo-4