두번째로 어려웠던 단어는 ‘정합성’이다.
PM, Design 쪽에서 이야기를 많이 듣지 못했지만, 데이터 직군과 DBA , DevOps 팀들과 이야기하면서 종종 듣게 된 단어이다.
네이버 사전을 찾아보니, 무슨 말인지 못 알아들을 정도로 설명되어 있다.
단지 뒤에 ‘체크’라는 말이 붙으면 조금 알아들을 수 있는 용어로 바뀌었다.
30년 전 데이터베이스 과목을 수강 한 후 실무를 영어로 다시 다 배웠었다.
그러면서 여러 가지 용어들을 두리뭉실하게 써오긴 했는데 잘 이해는 되지 않았다.
그래서 ChatGPT 와 Bard 에게 상세하게 물어보았다.
ChatGPT, Bard
둘이 다른 말을 하는 거 같다.
책에서 배웠던 Data consistency 와 Data integrity 가 생각났다.
한글로는… 음 ‘데이터 무결성’이란 용어가 생각났다.
다시 이 용어를 넣어 물어 보았다.
이제 Bard 랑 ChatGPT 가 비슷하게 대답을 한다.
비교설명
즉, 아래와 같은 내용들을 이렇게 이야기하고 있었다.
- (의미) Database Migration 작업을 하는데, 새로 생성된 테이블의 Entry 개수가 이전 Table 의 개수와 다르다.
▶ (표현) “두 테이블의 정합성이 맞지 않아 AWS DMS 를 다시 시도한다든지 해야겠다.” - (의미) Database, Table 안에 끊어진 Reference 들이 있고, Deprecated 된 Table 때문에 의미 없는 필드들이 더 생기게 되었다.
▶ (표현) “Data 무결성이 깨지는 상황으로 Batch 잡을 돌려서 Null 로 채우자.”
조금 난이도가 문장은 이렇다.
- (의미) Source table(Raw)이 여러 곳에서 동시에 사용되는 Derived table 을 만들게 되었는데, 같은 날 생성된 다른 두 테이블의 같아야 할 값이 다르더라.
▶ (표현) “두 테이블 사이에 필드들이 정합성이 다르다. Freezing 되어 있는 테이블을 써라.”
위 Bard 의 번역처럼 다양한 의미를 두리뭉실하게 ‘정합성’ 이라는 말로 쓰는 경우가 많았다.
뭔가 딱히 깊이 설명하고 싶지 않지만, 보이는 데이터를 바로 쓰기 찜찜할 때 ‘정합성’ 이 거론되었는데, 사실 이 단어 뒤에 들어오게 될 동사를 고르는 것도 꽤 어려운 일이었다.
‘맞지 않다’ , ‘깨져 있다’, ‘좋다 or 나쁘다’. ‘완벽하다’, ‘쓸만하다?’
가장 어려웠던 사례는 이거다.
- (의미) Google Analytics 가 주는 MAU, Firebase 가 주는 MAU , Amplitude 가 주는 MAU 가 다른데, 데이터 정합성이 의심되니 쓰던 걸 쓰도록 하겠다. or Vice versa
▶ (표현) 실험을 돌려 지표가 나왔는데, 정합성에 이슈가 있어서 다시 하기로 했다.
‘정합성’이라는 말은 ‘무결성’에 비해 조금 과하게 넓게 쓰이고 있는 게 아닐까 하는 생각이 들었다.
이 일본식 한자들은 딱히 정이 가지 않기도 해서, 어느 새 지나 보니 시간 될 때마다 영어 표기를 권하게 되었다.
(계속)
강사 : 정채상
“구글은 어떻게 일하나요?”
“문제정의를 어떻게 하고, 어떻게 조치를 하나요?”
이 질문에 답하기 위해 “정채상”님의 경험을 바탕으로 정리한 이야기Playstore의 기본기능들을 해석하고, 이를 잘 운영하기 위한 세가지 사례가 담겨 있습니다.
– Playstore 노출랭킹 전략
– 사전등록을 통한 앱바이럴 전략
– 글로벌 앱들의 언어별 랭킹전략