[Airflow] Helm을 사용하여 k8s cluster에 Airflow 설치
Reference page
아래 페이지를 참고하여 설치를 진행하였습니다.
helm 설치
먼저 helm을 설치하여 줍니다.
1
2
3
$ curl -fsSL -o get_helm.sh https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3
$ chmod 700 get_helm.sh
$ ./get_helm.sh
Persistent Volume 배포
Airflow Chart 설치 시 배포 되는 PVC에 연결될 PV를 미리 배포 해줍니다. 10GB 2개, 110GB 2개로 설정해주었습니다. 최소 용량이 얼마나 필요한지 모르겠으나 적어도 2개 PVC가 110GB 이상을 요구하는 것 같았습니다. 그렇지 않은 경우 Pending 상태로 무한 대기상태에 빠지더군요.
참고로 아래 yaml을 사용하여 PV를 배포하기 전에 node local에 yaml에 정의한 PV 경로를 꼭 미리 생성해 주세요. 그렇지 않으면 배포된 airflow chart에서 권한 문제로 인해 Pod가 일정시간마다 재시작 되는 문제가 발생합니다.
pvc.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
apiVersion: v1
kind: PersistentVolume
metadata:
name: persistent-volume-1
spec:
capacity:
storage: 10G
accessModes:
- ReadWriteOnce
local:
path: /home/ysbaek/pv1
nodeAffinity:
required:
nodeSelectorTerms:
- matchExpressions:
- {key: kubernetes.io/hostname, operator: In, values: [worker-1]}
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: persistent-volume-2
spec:
capacity:
storage: 10G
accessModes:
- ReadWriteOnce
local:
path: /home/ysbaek/pv2
nodeAffinity:
required:
nodeSelectorTerms:
- matchExpressions:
- {key: kubernetes.io/hostname, operator: In, values: [worker-2]}
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: persistent-volume-3
spec:
capacity:
storage: 110G
accessModes:
- ReadWriteOnce
local:
path: /home/ysbaek/pv3
nodeAffinity:
required:
nodeSelectorTerms:
- matchExpressions:
- {key: kubernetes.io/hostname, operator: In, values: [worker-1]}
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: persistent-volume-4
spec:
capacity:
storage: 110G
accessModes:
- ReadWriteOnce
local:
path: /home/ysbaek/pv4
nodeAffinity:
required:
nodeSelectorTerms:
- matchExpressions:
- {key: kubernetes.io/hostname, operator: In, values: [worker-2]}
1
kubectl apply -f pvc.yaml
이후에 바인딩에 성공할 경우 아래와 같이 표시되어야합니다. 참고로 바인딩은 helm airflow chart 설치후에 진행될 것이고, PV의 최초 Status는 Available이어야 합니다.
airflow helm chart 설치
아래 명령어를 입력하면, “airflow” does not exist. Installing it now. 가 표시되고 설치 및 배포를 시작합니다.
1
2
helm repo add apache-airflow https://airflow.apache.org
helm upgrade --install airflow apache-airflow/airflow --namespace airflow --create-namespace
설치가 완료되면 아래와 같이 airflow namespace에 오브젝트들이 배포되어야 합니다.
airflow webserver 포트포워딩
저는 외부에서 접속할 수 있도록 하기 위해 접속 가능한 ip를 모든 ip로 설정해주었고, iptime 공유기의 포트포워딩 설정도 변경하여주었습니다.
1
kubectl port-forward --address=0.0.0.0 svc/airflow-webserver 8080:8080 -n airflow
설치 완료
외부에서 서버 환경의 webserver로 정상적으로 접속하는 것 확인하였습니다.
Leave a comment