나는 AI로 챗지피티와 클로드를 쓰고 있고, 2026년 3월까지는 제미나이도 구독했다. 각 도구가 나한테서 실제로 어떤 일을 받아 갔는지 살펴보고 싶어서 요약해 봤다. 그런 후 나는 AI를 잘 쓰는 사용자인가에 대해서도 판단해 봤다.
1. 세 도구가 받은 일
주제만 놓고 보면 셋이 거의 똑같다. 업무 기획, 조직·팀 관리, 덕질, 재테크. 도구가 달라서가 아니라 같은 삶을 세 군데에 가져갔기 때문이다. 그리고 셋 다 회사 일이 압도적인 1순위였다. 프리랜스, 신학, 덕질을 합쳐도 회사 업무 하나가 더 무겁다.
차이는 주제가 아니라 기능에서 났다. 같은 나인데 도구마다 받아 간 일의 성격이 갈렸다.
챗지피티 — 판단과 내면
“이 결정이 합리적인가”, “내가 예민한 건가”, “저 사람 의도가 뭔가” 같은 질문이 여기로 갔다. 의사결정 검증, 사람·조직 분석, 번아웃 정리, 신앙 묵상. 셋 중 내면과 판단 작업을 받은 건 챗지피티뿐이다.
클로드 — 산출물과 자동화
정해진 입력을 넣으면 정해진 형식이 나오는 일. 회의보고서, 월간 보고서, 제작 계약서, 한영·한일 자막 번역, 인보이스. 그리고 반복 작업을 아예 스킬로 만들어 두고 돌리는 자동화. 포맷과 정확성이 핵심인 일들이다.
제미나이 — 구조화된 기획 스펙
구독을 끊기 전까지 제미나이가 받은 건 가장 손에 잡히는 실무 설계였다. 피그마 화면 설계와 컴포넌트 변형, 오토레이아웃 기준, 디자인 시스템 문서화, 앱 테스트 시나리오, 서버 배포 일정, 1:1 미팅 아젠다, 해외 계정 대상 여신 한도 제안서. 전부 “정해진 형식의 결과물”을 뽑는 쪽이다.
덕질은 셋에 다 걸쳐 있었다. ASTRO 팬튜브 채널을 운영하면서 진진을 비롯한 멤버들 활동과 팬-아이돌 상호작용을 데이터로 들여다보는 분석은 제미나이·챗지피티 쪽으로, 진우 관련 영상 편집과 자막 작업은 클로드 쪽으로 갔다. 여기서도 기준은 같다 — 따져 보는 일이냐, 만드는 일이냐.
2. 도구를 자른 기준
여기서 한 가지가 분명해진다. 제미나이는 챗지피티 자리(판단)가 아니라 클로드 자리(산출물)에 겹쳐 있었다. 둘이 같은 종류의 일을 두고 경쟁했다는 뜻이다.
같은 일을 두 도구가 두고 다투면 승부를 가르는 건 신뢰성이다. 제미나이는 400줄이 넘는 자막을 자꾸 중간에서 잘라먹었다. 긴 구조적 출력에서 무결성이 깨지는 건 그 자리에서는 치명적 결함이고, 그래서 제미나이는 산출물 자리에서 탈락했다. 그 자리는 줄 빼먹는 걱정이 없던 클로드로 통합됐다.
반대로 챗지피티는 같은 약점(느림, 가끔 잘림)이 있어도 살아남았다. 챗지피티가 차지한 자리가 산출물이 아니라 판단이었기 때문이다. 판단·정리 작업은 정형 출력의 무결성이 핵심이 아니라서, 느려도 자리를 지킬 수 있었다.
정리하면 나는 도구를 기분으로 자르지 않았다. “어느 자리에서 무엇을 못하나”로 잘랐다. 자막 무결성이 필요한 자리에서 못한 도구는 그 자리에서 내보냈고, 그 결함이 상관없는 자리에 있던 도구는 남겼다.
3. 그래서 자리가 이렇게 정리됐다
한 문장으로 줄이면, 판단은 챗지피티, 산출물은 클로드, 그리고 제미나이는 산출물 자리를 두고 경쟁하다 신뢰성에서 밀렸다. 처음부터 의도한 분담은 아니었지만, 쓰다 보니 도구마다 잘 먹히는 일이 다르게 정리됐고, 안 되는 도구는 정리됐다.
4. 결론 — 나는 AI를 얼마나 잘 쓰는 사용자인가
AI 사용은 대략 세 층위로 나눌 수 있다. 1층은 검색과 초안 도구로 쓰는 사용자, 2층은 요약·번역·문서 작성 같은 정형 작업을 맡기는 사용자, 3층은 반복 작업을 시스템으로 만들어 두고 AI를 기능별로 운영하되 그 결과를 검증하는 사용자다.
나는 3층에 속한다고 본다. 근거는 위의 기록 자체다.
첫째, 도구를 기능으로 나눠 썼다. 판단은 한쪽, 산출물은 다른 쪽. 같은 일을 아무 도구에나 던지는 게 아니라 자리를 정해 두고 보냈다. 둘째, 유료 도구 하나를 구체적 결함(자막 truncation) 하나로 정리했다. “별로다”가 아니라 “이 자리에서 이걸 못한다”는 판정이었다. 셋째, 반복 작업을 매번 다시 치지 않고 스킬로 만들어 자동화했다. 넷째, 산출물에 포맷과 정확성 기준을 명시적으로 걸고, 받은 답을 그대로 쓰지 않고 검증한다. 이 네 가지가 다 있는 사용자는 흔하지 않다. 분류상 나는 도구를 “쓰는” 쪽보다 “운영하는” 쪽에 가깝다.
다만 한 가지 약한 지점은 판단 검증을 사람·조직 문제에까지 AI에 기대는 패턴이다. AI는 그 영역에 정답이 없고, 내가 준 프레이밍을 그대로 강화하기 쉽다. “내가 예민한가”, “저 사람 의도가 뭔가” 같은 질문은 AI가 가장 그럴듯하게, 그러나 가장 검증 없이 답하는 종류다. 잘 쓰는 사용자일수록 빠지기 쉬운 함정이다. 이 영역의 분석은 참고 자료로만 쓰고 결론은 내가 쥐는 게 맞다. 실제로 챗지피티는 나에게 “아니, 네가 틀리지 않았어”라고 내 생각을 강화하기 일쑤다. 다행히 그 말에서 위안을 받지만 언제나 마음 한 켠에는 의심을 지우지 않는다. 아직까지 AI가 내 생각과 판단을 대체할 만큼 완벽하지 않기 때문이다.
핵심은 “AI를 많이 쓴다”가 아니라 “어디에 무엇을 맡길지를 판단해서 쓰고, 못하는 도구는 자리에서 내보낸다”는 것이고, 그 판단이 이미 도구별로 정리돼 있다는 점이 그 근거다. 도구를 늘리고 줄이는 기준이 감정이 아니라 기능이었다는 것 — 결국 그게 내가 가진 답이다.

댓글 남기기