코알못

Redash VS Tableau 본문

BIG DATA

Redash VS Tableau

코린이s 2022. 2. 26. 15:29
728x90

현재 회사 내에서 기획팀과 같이 개발자가 아닌 부서에서 분석 시스템의 데이터를 보고 싶을시

서버에 직접 들어가 쿼리를 날릴 수 없어 쉽게 UI로 조작 가능한 Tableau를 사용하고 있다.

Redash 라는 오픈 소스를 알게 되어 두 도구를

현업 기준 비교하여 대체하면 좋을지 본다.

구분 Redash Tableau
비용 무료 유료
데이터 시각화 가능 가능
추출 방법 쿼리 UI 내에서 조작
자동/수동 수동/자동
(자동 기능 이용시 매번 추출을 자동화 할 수 있어 편리)
수동
데이터 공유 CSV, EXCEL, 이미지, 웹 형식
(정기 보고 데이터의 경우 대시보드 URL에서 갱신된 데이터를 볼 수 있어 매번 보고 할 필요가 없어짐 > 업무 공수를 줄일 수 있다.)
CSV, EXCEL, 이미지
설치 필요 여부 웹에서 동작하여 설치 불필요 타블로 설치
이용 방법 redash 서버에서 계정 생성하여 이용
(관리자가 메일로 초대)
라이센스를 발급받아 개인 PC 에서 이용
원격 pc 에서 하나의 계정으로 같이 이용
DB 접근 권한 redash 서버에서 호출하니 방화벽 신청이 따로 필요 없고 계정별로 DB 접근 권한 부여 가능 DB IP, PORT 를 전달받아 타블로를 사용하는 PC 에서 방화벽 신청 진행 후 이용
경고 알람 기능 가능
(데이터가 특정 조건을 만족할시 경고 알람이 가도록 할 수 있다.)
불가능
유지 보수 개발자 tableau

위 표에 정리한 것 중에

아래 업무에 대한 대체 방법만 나온다면 전환해도 문제 없을 것 같다.

1. 추출 방법

- 현재 : 비 개발자의 경우 타블로 UI로 쉽게 데이터 추출

-> DBA가 쿼리 추출 + redash 에 올려 데이터 검증 까지 진행 후 기획자가 대시보드 및 시각화 업무 진행

-> redash에 올려 데이터 검증 까지 DBA가 담당하지 않는다면 데이터분석시스템 관리자의 공수도 추가로 들어 차라리 DB 쿼리 추출 담당자가 redash에 올리고 검증 업무까지 하는 것이 업무 효율성이 더 좋을 것 같다는 의견

-> tableau(=기획자 업무 공수) > redash (='DBA 업무 공수' or 'DBA 업무+분석시스템관리자 업무 공수')

 

2. 쿼리 수행하는 유저 파악 할 수 있도록 관리 방법

- 현재 : hive DB 접속하는 유저명으로 큐 할당 or 문제 발생이나 작업시 kill 안내

-> 만약 redash 사용시 connection 을 한개 생성한다면 유저 추적이 불가능

-> 유저별로 connection 을 생성할지, 동일 하게 사용하되 slack 사용자별 slack 채널을 만들어 사용자 파악 또는 사용 규칙 생성

 

꼭 tableau로 대체하는 목적이 아니더라도

아래와 같은 용도로 같이 사용해도 좋을 것 같다.

#  redash

- 개발자가 데이터 분석시

- 기획자가 정기적 데이터 추출시 (타블로 파일 전달받아 쿼리 추출하여 개발자가 배치 등록)

# tableau

- 기획자가 일회성 추출시

728x90
Comments