Pandas로 MongoDB 데이터 쉽게 옮기기
MongoDB에 있는 데이터를 추출하여 Redshift에 적재하여야 하는 경우가 있었는 데, 그 때 당시에 고민 했던 부분에 대해서 기록을 남겨둔다. 일단 MongoDB와 RDBMS는 특성이 조금 다른 DB라고 볼 수 있는데 MongoDB는 스키마에 대한 제약 사항이 없어 원하는 컬럼을 자유자재로 추가, 삭제할 수 있다. 굳이 따지자면 컬럼 형태라기 보다는 Key에 가깝다고 해야 하나.. 이러한 특징으로 Document-oriented DB라 불린다. 반면에 Redshift는 스키마의 제약을 받는다. 테이블을 생성할 때 만들어둔 컬럼에 대해서만 데이터를 삽입할 수 있으며, 데이터의 타입 또한 지정되어있어 해당 컬럼에 해당 타입이 아닌 데이터는 삽입이 불가능하다. 이 두 가지 DB에서의 데이터를 연결하여야..
2022.07.21Career/Python&Airflow