Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- Redis
- hive
- Jenkins
- Mac
- 자동
- 레디스
- vue
- Cluster
- 간단
- EMR
- 로그인
- Zeppelin
- 자바
- java
- fastcampus
- SpringBoot
- 젠킨스
- 클러스터
- login
- 예제
- ec2
- Kafka
- gradle
- config
- redash
- 설정
- 머신러닝
- aws
- Docker
- spring
Archives
- Today
- Total
목록병렬처리 (1)
코알못
[AWS] Kafka connector 분산 처리
kafka 토픽의 경우 partition 을 주어 병렬 처리를 할수 있다. connector 의 경우에도 mode 중 distributed 로 실행하면 고가용성, 처리 성능을 높힐 수 있다. 고가용성은 서비스가 계속적으로 중단없이 유지 되는 성질을 의미하는데 conector 한대가 죽어도 과반수 이상 살아 있을시 서비스 정상 운영 가능하다. 해당 글에서 다룰것은 '처리 성능' 부분인데 처리 성능의 경우 분산 처리 기능을 이용하여 높힐 수 있다. connection 에는 'tasks.max' 라는 옵션이 있다. 이는 source connector, sink connector 모두에게 줄 수 있는데 정확한 의미는 '일을 진행할 업무자 최대수' 이다. 분산 처리시 connector 별로 '업무자 최대 수'를 ..
BIG DATA
2022. 3. 9. 20:45