목록사담 (2)
얼레벌레
아주 한가한 나날.. 인턴따리가 전문연구원분들도 해결하지 못한 업무를 넘겨 맡게 되었다. 은행 대상 ESG DB 전문 개발 중 적재 오류가 발견되었고, 일부 character들이 인식 오류로 인해 ? 혹은 ?로 적재되는 문제점이 발생하였다. 원본과 적재본을 비교하며 사유를 파악해보니, 옾 등의 받침이 특수한 한글의 경우 ?로 대체되어 적재되었고, · 등의 자음+한자 형식의 unicode character들이 ?로 대체되어 발견되었다. 하지만, 솔직히 어떤 규칙이 있는 채로 DB 적재에 오류가 생긴 게 아니라 원본과 적재본을 비교하는데 '대체 적재를 어떻게 하길래 이런 결과가 나오는거지?' 싶었다. 자동이라는 한글도 ?5개 정도로 대체된 셀도 있었다. 처음에는 인코딩문젠가 싶었는데 내가 있는 부서는 적재팀..
회사에서 원본DB와 적재DB 사이에 오류가 생기는 현상이 어떤 툴이든 괜찮으니 왜 그런지 원인을 찾아보고, 그 원인을 어떻게 고칠 수 있을지 Python으로 적재할 수 있게끔 찾으라는 업무를 받았다. 정말 난감했던 건 엑셀파일부터 pd.read_excel로 안됐다는 점이다.. 그래서 미친듯이 구글링을 했다. 우선 처음에 pd.read_excel했을 때 뜬 오류는 XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b’\x9b DRMONE’ 이었다. Stackoverflow도..그냥 구글링도 미친듯이 찾아봤지만 XLRDError에 관한 내용은 많아도 뒷부분이 에러내용이 달랐다. 그 중 하나 찾은 방법이 openpyxl을 사용..