[CKA] kubernetes Controller - JobController
쿠버네티스는 Running 을 유지 하려는 동작 방식을 가지고 있어 Pod 가 정상 종료 되더라도 계속적으로 재 실행 된다.
이를 위해 나온것이 Job Controller 이다!
Job Controller를 이용하면 Batch 처리하는 Pod를 만들어 잡이 정상 종료되면 완료 상태가 되고 비정상 종료시 재 실행 되도록 할 수 있다.
아래는 Job 을 생성하는 yaml 형식이며 template도 기존 controller 와 동일하게 담는다.
여기서 resartPolicy가 Naver인데 이는 비정상 종료일시 계속적으로 파드를 다시 생성한다는 의미이다.
# job.yaml
apiVersion: batch/v1
kind: Job
metadata:
name: centos-job
spec:
# completions: 5
# parallelism: 2
# activeDeadlineSeconds: 15
template:
spec:
containers:
- name: centos-container
image: centos:7
command: ["bash"]
args:
- "-c"
- "echo 'Hello Corin'; sleep 50; echo 'Bye'"
restartPolicy: Never
이제 해당 job을 생성한다.
$ kubectl create -f job.yaml
job.batch/centos-job created
잡을 보면 하나의 잡이 성공했고 파드를 보면 정상적으로 completed 상태임을 알 수 있다.
$ kubectl get job
NAME COMPLETIONS DURATION AGE
centos-job 1/1 60s 84s
$ kubectl get pod
NAME READY STATUS RESTARTS AGE
centos-job-xxx 0/1 Completed 0 2m15s
이제 해당 job을 제거하고
$ kubectl delete -f job.yaml
job.batch "centos-job" deleted
잡을 다시 생성하는데 이번에는 비정상 종료시 어떻게 되는지 볼 것이다.
$ kubectl create -f job.yaml
job.batch/centos-job created
비정상 종료를 발생시키기 위해 complete 되기전 파드를 얼른 제거한다.
$ kubectl delete pod centos-job-bh6d6
pod "centos-job-bh6d6" deleted
비정상 종료이므로 policy 가 Naver 이기에 파드를 다시 생성했을것이고 잡은 성공적으로 완료 되었다.
$ kubectl get pod
NAME READY STATUS RESTARTS AGE
centos-job-g8ngb 0/1 Completed 0 2m15s
$ kubectl get job
NAME COMPLETIONS DURATION AGE
centos-job 1/1 73s 91s
정말 예상대로 동작했는지 보기위해 잡의 상세정보를 보며 pod 가 한번더 생성 되었음을 알 수 있다.
$ kubectl describe job
Name: centos-job
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal SuccessfulCreate 119s job-controller Created pod: centos-job-bh6d6
Normal SuccessfulCreate 99s job-controller Created pod: centos-job-g8ngb
Normal Completed 46s job-controller Job completed
restartPolicy의 값 중 실패시 파드를 재 생성 하는 Naver과는 다르게 OnFailure는 지정한 횟수만큼 컨테이너를 재 시작 하며 재시작 횟수 만큼 시도후에도 실패시 파드를 제거한다.
실패 할 수 있도록 command도 bash 가 아닌 이상한 단어를 적고 restartPolicy 를 OnFailure로 수정하고 재기동 횟수인 backoffLimit 를 3으로 지정한다.
# job.yaml
apiVersion: batch/v1
kind: Job
metadata:
name: centos-job
spec:
# completions: 5
# parallelism: 2
# activeDeadlineSeconds: 15
template:
spec:
containers:
- name: centos-container
image: centos:7
command: ["basch"]
args:
- "-c"
- "echo 'Hello Corin'; sleep 50; echo 'Bye'"
restartPolicy: OnFailure
backoffLimit: 3
이제 해당 잡을 생성하며
$ kubectl create -f job.yaml
job.batch/centos-job created
파드 상태를 보면 오류 발생시 파드가 아닌 컨테이너를 재시작 하며 3번까지 재시작 했음에도 불구하고 실패이므로 파드를 자동으로 제거한다.
[node1 ~]$ kubectl get pod -w
NAME READY STATUS RESTARTS AGE
centos-job-zg48v 0/1 RunContainerError 1 (4s ago) 5s
centos-job-zg48v 0/1 RunContainerError 2 (0s ago) 14s
centos-job-zg48v 0/1 RunContainerError 3 (0s ago) 44s
centos-job-zg48v 0/1 Terminating 3 (1s ago) 45s
파드를 확인해보면 제거 된것을 볼 수 있다.
$ kubectl get pod
No resources found in default namespace.
이제 다음으로 볼 기능은 completions 이다.
이는 잡을 몇개 실행할지 지정하는것으로 replicas 와 비슷하다고 볼 수있다. 이는 기본으로 순차적으로 실행 되며 3개만 지정해서 지켜보도록 하자.
# job.yaml
apiVersion: batch/v1
kind: Job
metadata:
name: centos-job
spec:
completions: 3
# parallelism: 2
# activeDeadlineSeconds: 15
template:
spec:
containers:
- name: centos-container
image: centos:7
command: ["bash"]
args:
- "-c"
- "echo 'Hello Corin'; sleep 10; echo 'Bye'"
restartPolicy: OnFailure
backoffLimit: 3
잡을 생성한다.
$ kubectl create -f job.yaml
job.batch/centos-job created
파드를 실시간으로 보면 첫번째 파드가 Running > completed 가 되고 나서 두번째 파드가 생성되고 두번째 파드가 completed 되면 세번째 파드가 생성되고 완료시 종료 된다.
$ kubectl get pod -w
NAME READY STATUS RESTARTS AGE
centos-job-sn4pz 1/1 Running 0 3s
centos-job-sn4pz 0/1 Completed 0 13s
centos-job-jn2tw 0/1 Pending 0 0s
centos-job-sn4pz 0/1 Completed 0 14s
centos-job-jn2tw 0/1 ContainerCreating 0 0s
centos-job-jn2tw 1/1 Running 0 1s
centos-job-jn2tw 0/1 Completed 0 13s
centos-job-fbrhs 0/1 Pending 0 0s
centos-job-jn2tw 0/1 Completed 0 14s
centos-job-fbrhs 0/1 ContainerCreating 0 0s
centos-job-fbrhs 1/1 Running 0 1s
centos-job-fbrhs 0/1 Completed 0 14s
파드, 잡 정보를 보면 3개의 파드가 정상적으로 완료됨을 볼 수 있다.
$ kubectl get pod
NAME READY STATUS RESTARTS AGE
centos-job-fbrhs 0/1 Completed 0 38s
centos-job-jn2tw 0/1 Completed 0 52s
centos-job-sn4pz 0/1 Completed 0 66s
$ kubectl get job
NAME COMPLETIONS DURATION AGE
centos-job 3/3 42s 85s
만약 동시에 2개의 잡이 실행 되면 좋겠다! 하면 parallelism을 2로 지정하여 2개가 동시에 실행 될 수 있도록 할 수 있다.
#job.yaml
apiVersion: batch/v1
kind: Job
metadata:
name: centos-job
spec:
completions: 3
parallelism: 2
# activeDeadlineSeconds: 15
template:
spec:
containers:
- name: centos-container
image: centos:7
command: ["bash"]
args:
- "-c"
- "echo 'Hello Corin'; sleep 10; echo 'Bye'"
restartPolicy: OnFailure
backoffLimit: 3
잡을 생성한다.
$ kubectl create -f job.yaml
job.batch/centos-job created
처음 시작부터 두개의 파드가 병렬로 실행 되었으며 완료가 되니 다른 파드가 실행되어 완료 됨을 볼 수 있다.
$ kubectl get pod -w
NAME READY STATUS RESTARTS AGE
centos-job-2469j 1/1 Running 0 2s
centos-job-r2ngv 1/1 Running 0 2s
centos-job-r2ngv 0/1 Completed 0 11s
centos-job-2469j 0/1 Completed 0 11s
centos-job-v5m79 0/1 Pending 0 0s
centos-job-v5m79 0/1 ContainerCreating 0 0s
centos-job-v5m79 1/1 Running 0 2s
centos-job-v5m79 0/1 Completed 0 12s
잡과 파드 정보를 보면 정상적으로 3개의 배치가 완료 됨을 볼 수 있다.
$ kubectl get job,pod
NAME COMPLETIONS DURATION AGE
job.batch/centos-job 3/3 27s 55s
NAME READY STATUS RESTARTS AGE
pod/centos-job-2469j 0/1 Completed 0 55s
pod/centos-job-r2ngv 0/1 Completed 0 55s
pod/centos-job-v5m79 0/1 Completed 0 42s
이제 해당 job을 삭제하고
$ kubectl delete -f job.yaml
job.batch "centos-job" deleted
다른 기능인 activeDeadlineSeconds 를 이용하여 만약 해당 값이 5 이면 5초안에 잡이 종료 되지 않으면 오류로 판단하겠다. 라고 설정 할 수 있다.
아래와 같이 10초 sleep 상태를 걸면 5초안에 배치가 끝나지 않을 것이고 해당 잡을 오류로 판단할 것이다.
# cronjob.yaml
apiVersion: batch/v1
kind: Job
metadata:
name: centos-job
spec:
# completions: 3
# parallelism: 2
activeDeadlineSeconds: 5
template:
spec:
containers:
- name: centos-container
image: centos:7
command: ["bash"]
args:
- "-c"
- "echo 'Hello Corin'; sleep 10; echo 'Bye'"
restartPolicy: Never
# backoffLimit: 3
해당 잡을 생성한다.
$ kubectl create -f job.yaml
job.batch/centos-job created
이제 실시간으로 보면 실행하다 5초 후에 실패로 판단하여 파드가 종료 된것을 볼 수 있다.
$ kubectl get pod -w
NAME READY STATUS RESTARTS AGE
centos-job-ffwl5 1/1 Running 0 3s
centos-job-ffwl5 1/1 Terminating 0 5s
이 경우에는 실패로 판단하여 재 시작 하지는 않는다.
[node1 ~]$ kubectl get pod
No resources found in default namespace.
[node1 ~]$ kubectl get job
NAME COMPLETIONS DURATION AGE
centos-job 0/1 76s 76s
이제 CronJob에 대해서 알아보자!
CronJob의 경우 Job을 제어하여 특정 시간에 반복 실행 할 수 있도록 할 수 있다.
CronSchedule의 경우 아래와 같이 표기 하여 특정 일시에 실행 될 수 있도록 한다.
- 분(0-59)
- 시간(0-23)
- 일(1-31)
- 월(1-12)
- 요일(0-6, 0은 일요일)
만약 매월 1일 아침 9시에 Job 실행 하고 싶다면 아래와 같이 표기하면 된다.
- 0 9 1 * *
만약 여기서 매주 주말 10시에 Job 을 실행하고 싶다면 아래와 같이 표기도 가능하다.
- 0 10 * * 0,6
만약 5분마다 job을 계속 실행하고 싶다면 아래와 같이 표기한다.
- */5 * * * *
이제 yaml 작성 법은 job을 동일하게 spec.jobTemplate 부분에 작성하고 spec.schedule 에 cron 형식을 정의 하면 된다.
우선 버전을 확인하고
[node1 ~]$ kubectl api-resources | grep -i cron
cronjobs cj batch/v1 true CronJob
yaml 을 작성한다.
우선 concurrencyPolicy(동시성정책)가 default 로 Allow 이며 해당 값은 1분마다 스케쥴링 하는데 만약 1분안에 잡이 끝나지 않아도 1분 뒤에 해당 잡을 추가로 실행 시킬 것이다. 라는 의미이다.
여기서 Forbid(금지)로 설정시에는 1분 마다 스케쥴링 인데 해당 잡이 끝나지 않았다면 추가로 잡을 실행 시키지 않는다. 라는 의미이다.
startingDeadlineSeconds 는 현재 500인데 500s 안에 시작되지 않으면 오류로 판단하여 잡을 종료 하겠다라는 의미이다.
# cronjob.yaml
apiVersion: batch/v1
kind: CronJob
metadata:
name: cronjob
spec:
schedule: "* * * * *"
# concurrencyPolicy: Allow
concurrencyPolicy: Forbid
startingDeadlineSeconds: 500
jobTemplate:
spec:
template:
spec:
containers:
- name: hello
image: busybox
args:
- /bin/sh
- -c
- echo corin; sleep 10
restartPolicy: Never
이제 해당 cron을 실행 시켜 보자!
$ kubectl create -f cronjob.yaml
우리가 예상한 대로 1분마다 실행 되는것을 볼 수 있다.
$ kubectl get pod -w
NAME READY STATUS RESTARTS AGE
cronjob-28237888-x4dz6 0/1 Pending 0 0s
cronjob-28237888-x4dz6 0/1 ContainerCreating 0 0s
cronjob-28237888-x4dz6 1/1 Running 0 3s
cronjob-28237888-x4dz6 0/1 Completed 0 13s
cronjob-28237889-ncdk7 0/1 ContainerCreating 0 0s
cronjob-28237889-ncdk7 1/1 Running 0 1s
cronjob-28237889-ncdk7 0/1 Completed 0 11s
끝!