코알못

[EMR] FileFormatException: Malformed ORC file 이슈 본문

BIG DATA

[EMR] FileFormatException: Malformed ORC file 이슈

코린이s 2022. 8. 4. 14:06
728x90

hive orc 테이블 조회시 아래 오류가 발생하며 조회되지 않았다.

Caused by: java.lang.RuntimeException: java.io.IOException: org.apache.orc.FileFormatException: Malformed ORC file s3://data-test/transform/database/tb_test/yyyy=2022/mm=7/dd=14/hh=18/000000_0. Invalid postscript length 0
	at

확인해보니 해당 파일을 스노우볼로 이관 작업하면서 파일이 깨진것으로 보인다.

깨진 파일을 삭제한뒤 교체하니 정상적으로 읽어 지며 해당 오류 발생하지 않았다.

728x90
Comments