데이터 유실에 관하여

책을 읽기로는 데이터 유실이 있을 수 있기 때문에
원본데이터를 따로 저장하라고 하는데요,

우선 데이터 유실이 일어나는 이유를 알고 싶습니다.

시스템을 운영하다 보면 네트워크나 기타 시스템 문제 때문에 노드가 통째로 사라질 수도 있고, 복제본 까지 없어질 확률도 있습니다. 또는 ID를 잘못 지정해서 의도치 않게 데이터가 덮어 씌워진다거나 하는 경우도 생각 해 볼 수 있습니다.

하지만 무엇보다도 ES를 사용 하다 보면 색인을 잘못 해서 인덱스를 날리고 매핑을 바꾸고 다시 색인하거나 해야 하는 경우가 은근히 많습니다. 이런 경우를 위해서도 원본 데이터는 파일 등으로 AWS S3 같은 저장소에 잘 보관 해 두시는걸 권해드립니다.

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.