Конечная точка метрики узла Kubernetes возвращает 401
У меня есть кластер GKE, который для простоты запускает только Prometheus, отслеживая каждый членский узел. Недавно я обновил сервер API до версии 1.6 (которая представляет RBAC), и у меня не было проблем. Затем я добавил новый узел, работающий под управлением версии 1.6 kubelet. Прометей не смог получить доступ к API метрик этого нового узла.
Итак, я добавил ClusterRole
, ClusterRoleBinding
и ServiceAccount
в мое пространство имен и настроил развертывание для использования новой ServiceAccount. Я тогда удалил стручок для хорошей меры:
apiVersion: v1
kind: ServiceAccount
metadata:
name: prometheus
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
name: prometheus
rules:
- apiGroups: [""]
resources:
- nodes
- services
- endpoints
- pods
verbs: ["get", "list", "watch"]
- apiGroups: [""]
resources:
- configmaps
verbs: ["get"]
- nonResourceURLs: ["/metrics"]
verbs: ["get"]
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
name: prometheus
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: prometheus
subjects:
- kind: ServiceAccount
name: prometheus
namespace: default
---
apiVersion: v1
kind: ServiceAccount
metadata:
name: prometheus
namespace: default
secrets:
- name: prometheus-token-xxxxx
---
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
labels:
app: prometheus-prometheus
component: server
release: prometheus
name: prometheus-server
namespace: default
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-prometheus
component: server
release: prometheus
strategy:
rollingUpdate:
maxSurge: 1
maxUnavailable: 1
type: RollingUpdate
template:
metadata:
labels:
app: prometheus-prometheus
component: server
release: prometheus
spec:
dnsPolicy: ClusterFirst
restartPolicy: Always
schedulerName: default-scheduler
serviceAccount: prometheus
serviceAccountName: prometheus
...
Но ситуация остается неизменной.
Конечная точка метрик возвращается HTTP/1.1 401 Unauthorized
и когда я изменяю Deployment, чтобы включить другой контейнер с установленным bash + curl, и делаю запрос вручную, я получаю:
# curl -vsSk -H "Authorization: Bearer $(</var/run/secrets/kubernetes.io/serviceaccount/token)" https://$NODE_IP:10250/metrics
* Trying $NODE_IP...
* Connected to $NODE_IP ($NODE_IP) port 10250 (#0)
* found XXX certificates in /etc/ssl/certs/ca-certificates.crt
* found XXX certificates in /etc/ssl/certs
* ALPN, offering http/1.1
* SSL connection using TLS1.2 / ECDHE_RSA_AES_128_GCM_SHA256
* server certificate verification SKIPPED
* server certificate status verification SKIPPED
* common name: node-running-kubelet-1-6@000000000 (does not match '$NODE_IP')
* server certificate expiration date OK
* server certificate activation date OK
* certificate public key: RSA
* certificate version: #3
* subject: CN=node-running-kubelet-1-6@000000000
* start date: Fri, 07 Apr 2017 22:00:00 GMT
* expire date: Sat, 07 Apr 2018 22:00:00 GMT
* issuer: CN=node-running-kubelet-1-6@000000000
* compression: NULL
* ALPN, server accepted to use http/1.1
> GET /metrics HTTP/1.1
> Host: $NODE_IP:10250
> User-Agent: curl/7.47.0
> Accept: */*
> Authorization: Bearer **censored**
>
< HTTP/1.1 401 Unauthorized
< Date: Mon, 10 Apr 2017 20:04:20 GMT
< Content-Length: 12
< Content-Type: text/plain; charset=utf-8
<
* Connection #0 to host $NODE_IP left intact
- Почему этот токен не позволяет мне получить доступ к этому ресурсу?
- Как проверить доступ, предоставленный ServiceAccount?
2 ответа
В соответствии с обсуждением билета @JorritSalverda; https://github.com/prometheus/prometheus/issues/2606
Поскольку GKE не позволяет вам получать сертификаты клиентов, которые позволили бы вам аутентифицировать себя с помощью kubelet, лучшее решение для пользователей в GKE, по-видимому, использует сервер API kubernetes в качестве прокси-запросов к узлам.
Для этого (цитируя @JorritSalverda);
"Для моего сервера Prometheus, работающего внутри GKE, теперь он работает со следующей перемаркировкой:
relabel_configs:
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
- target_label: __address__
replacement: kubernetes.default.svc.cluster.local:443
- target_label: __scheme__
replacement: https
- source_labels: [__meta_kubernetes_node_name]
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
И следующее ClusterRole привязано к учетной записи службы, используемой Prometheus:
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
name: prometheus
rules:
- apiGroups: [""]
resources:
- nodes
- nodes/proxy
- services
- endpoints
- pods
verbs: ["get", "list", "watch"]
Поскольку кластер GKE все еще имеет запасной вариант ABAC в случае сбоя RBAC, я не уверен на 100%, но это покрывает все необходимые разрешения.
Я столкнулся с той же проблемой и создал тикет https://github.com/prometheus/prometheus/issues/2606 для этого и вне обсуждения обновил примеры конфигурации через PR https://github.com/prometheus/prometheus/pull/2641.
Вы можете увидеть обновленную перемаркировку для задания узлов kubernetes по адресу https://github.com/prometheus/prometheus/blob/master/documentation/examples/prometheus-kubernetes.yml#L76-L84
Скопировано для справки:
relabel_configs:
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
- target_label: __address__
replacement: kubernetes.default.svc:443
- source_labels: [__meta_kubernetes_node_name]
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
Для самого RBAC вам нужно запустить Prometheus с собственной учетной записью, которую вы создаете с помощью
apiVersion: v1
kind: ServiceAccount
metadata:
name: prometheus
namespace: default
Обязательно передайте эту служебную учетную запись в модуль со следующей спецификацией модуля:
spec:
serviceAccount: prometheus
И тогда Kubernetes манифестирует для установки соответствующей роли RBAC и привязки, чтобы предоставить учетной записи службы Prometheus доступ к требуемым конечным точкам API по адресу https://github.com/prometheus/prometheus/blob/master/documentation/examples/rbac-setup.yml
Скопировано для справки
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
name: prometheus
rules:
- apiGroups: [""]
resources:
- nodes
- nodes/proxy
- services
- endpoints
- pods
verbs: ["get", "list", "watch"]
- nonResourceURLs: ["/metrics"]
verbs: ["get"]
---
apiVersion: v1
kind: ServiceAccount
metadata:
name: prometheus
namespace: default
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
name: prometheus
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: prometheus
subjects:
- kind: ServiceAccount
name: prometheus
namespace: default
Замените пространство имен во всех манифестах так, чтобы оно соответствовало тому, в котором вы запускаете Prometheus, а затем примените манифест с учетной записью с правами администратора кластера.
Я не проверял это в кластере без резервного ABAC, поэтому в роли RBAC все еще может отсутствовать что-то существенное.