Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 자바
- 자동
- spring
- Redis
- config
- ec2
- login
- 예제
- redash
- fastcampus
- EMR
- 머신러닝
- Kafka
- 로그인
- 클러스터
- Docker
- 젠킨스
- vue
- java
- hive
- 레디스
- Zeppelin
- Cluster
- 간단
- gradle
- 설정
- Jenkins
- SpringBoot
- Mac
- aws
Archives
- Today
- Total
코알못
[HIVE] Caused by: org.apache.hadoop.hive.serde2.SerDeException: Row is not a valid JSON Object - JSONException: Duplicate key "name" 본문
BIG DATA
[HIVE] Caused by: org.apache.hadoop.hive.serde2.SerDeException: Row is not a valid JSON Object - JSONException: Duplicate key "name"
코린이s 2022. 11. 19. 15:51728x90
hive 에서 json 데이터를 읽어 오는 부분에서 아래 에러 발생 하였다.
Caused by: org.apache.hadoop.hive.serde2.SerDeException: Row is not a valid JSON Object - JSONException: Duplicate key "name"
확인 해보니 name 이라는 key 가 중복되는 json 데이터가 있으며 hive에서는 기본적으로 대소문자를 구분하지 않으니 중복 키로 인식하여 오류발생하였다.
{"NAME":"corin","name":"corin"...}
이를 해결하기 위해 읽어 들이는테이블의 설정에 대소문자를 구분하도록 추가 하였다.
ALTER TABLE tb_test SET TBLPROPERTIES("case.insensitive" = "FALSE");
해당 로그를 제거하는 방법이나 로그를 수정하는 방법 등이 있을수 있으나
로그 그대로 저장하기 위해 해당 옵션을 추가하였다.
728x90
'BIG DATA' 카테고리의 다른 글
Comments