
목차
1. 출석체크가 밀리기 시작했다
처음에는 별일 아니라고 생각했습니다. 이름 몇 개 찾아서 체크하면 끝나는 일이었으니까요.
매주 한 번, 출석 담당자분이 이미지 파일을 보내주십니다. 형광펜으로 체크된 이름을 눈으로 확인하고, 시스템에서 그 이름을 다시 찾아 체크박스를 눌러야 합니다. 한 명이면 금방 끝납니다. 그게 수십 명이 되면 이야기가 달라집니다.
1-1. 인원이 많아지면서 생긴 현실적인 문제
이름을 찾는 데 10초, 시스템에서 다시 찾는 데 10초. 그게 한 사람당 걸리는 시간이었습니다.
참석자가 늘어나자 그 10초가 계속 쌓였습니다. 이미지에서 형광펜 친 이름을 훑고, 시스템 목록에서 같은 이름을 찾아 클릭하고, 다시 이미지로 돌아와 다음 이름을 찾고. 중간에 하나라도 놓치면 처음부터 눈으로 다시 확인해야 했습니다.
그게 매주 반복됐습니다.
어떻게든 줄일 방법이 필요했습니다. 매주 같은 작업을 손으로 계속 하고 싶지 않았습니다.

2. 이미지 속 이름을 읽어야 했다 — OCR 도구 비교 실전기
자동으로 체크박스를 처리하려면, 이미지 속 이름을 먼저 텍스트로 꺼내야 했습니다.
이미지를 그대로 두고는 아무것도 할 수 없었습니다. 어떤 AI 도구가 이 이미지를 제대로 읽어줄 수 있는지부터 확인해야 했습니다.
2-1. Gemini·Claude는 왜 실패했나
Gemini와 Claude에 이미지를 올려봤습니다.
일반 텍스트는 잘 읽었습니다. 문제는 형광펜이었습니다. 담당자분이 참석한 이름 위에 형광펜을 그어 표시하는 방식을 쓰고 계셨는데, 형광펜 색이 글자 위에 겹치자 두 도구 모두 이름을 제대로 읽지 못했습니다. 이름이 통째로 빠지거나, 전혀 다른 문자로 읽혔습니다. 같은 이미지를 여러 번 올려봐도 결과는 크게 다르지 않았습니다.
2-2. ChatGPT가 형광펜 이미지를 인식한 방법
같은 이미지를 ChatGPT에 올렸습니다.
형광펜이 덮인 이름도 읽어냈습니다. 왜 ChatGPT만 되는지 정확히는 모릅니다. 다만 결과가 달랐고, 쓸 수 있었습니다.
거기서 한 단계 더 나아갔습니다. ChatGPT 프로젝트 기능으로 세팅을 만들었습니다. 이미지를 올리면 출석한 이름 리스트와 총 인원수를 코드 형태로 바로 출력하도록 했습니다. 매주 이미지만 올리면 정리된 데이터가 나오는 방식이었습니다.
| 도구 | 형광펜 이미지 인식 | 이름 리스트 추출 |
|---|---|---|
| Gemini | 실패 | 불가 |
| Claude | 실패 | 불가 |
| ChatGPT | 성공 | 가능 |
3. AI에게 크롬 스크립트를 부탁했다
이름 리스트는 나왔습니다. 이제 그 데이터를 시스템 체크박스에 자동으로 입력할 방법이 필요했습니다.
Gemini에게 상황을 설명하고 방법을 물었습니다.
3-1. Gemini가 추천한 방법, 그리고 첫 시행착오
Gemini가 처음 추천한 건 Tampermonkey였습니다. 크롬 확장 프로그램을 설치하고 스크립트를 등록해두면, 페이지가 열릴 때 자동으로 실행되는 방식이었습니다.
설치하고, 코드를 붙여넣고, 페이지를 열었습니다. 아무 반응이 없었습니다. 새로고침을 해봤습니다. 마찬가지였습니다. 뭐가 문제인지 알 수 없었습니다.
그 상황을 Gemini에게 그대로 전달했습니다. 그러자 다른 방법을 알려줬습니다. F12를 눌러 개발자도구를 열고, 콘솔창에 직접 스크립트를 붙여넣어 실행하는 방식이었습니다.
F12를 눌렀습니다. 처음 보는 창이 화면 아래쪽을 가득 채웠습니다. 영어와 숫자가 잔뜩 보였고, 어디에 뭘 입력해야 하는지 알 수 없었습니다. 탭을 이것저것 눌러보며 한참을 헤맸습니다. 콘솔창이라는 것도 그때 처음 알았습니다. 어디에 붙여넣는 건지조차 몰라서 탭을 몇 개나 눌러봤는지 기억도 안 납니다.
겨우 입력란을 찾아 코드를 붙여넣고 엔터를 눌렀습니다. 체크박스가 혼자 움직이기 시작했습니다.
3-2. 체크박스가 풀리는 문제까지 해결한 과정
첫 실행 직후 새로운 문제가 생겼습니다.
이미 체크되어 있던 항목을 스크립트가 다시 클릭하면서 체크가 풀렸습니다. 출석 처리가 된 사람이 미출석으로 바뀌는 상황이었습니다. 자동화를 했더니 오히려 더 꼬인 셈이었습니다.
Gemini에게 이 상황을 그대로 설명했습니다. 돌아온 코드에는 조건이 하나 추가되어 있었습니다. 체크박스가 이미 선택된 상태면 건너뛰고, 체크되지 않은 항목만 클릭하도록 처리하는 방식이었습니다. 코드를 바꾸고 다시 실행하자 문제가 사라졌습니다.
4. 완성된 자동화 흐름 전체 공개
시행착오를 거쳐 자리 잡은 작업 방식은 세 단계입니다.
4-1. OCR 이름 추출 → 크롬 콘솔 실행까지 한눈에
전체 흐름을 정리하면 아래와 같습니다.
| 단계 | 도구 | 작업 내용 |
|---|---|---|
| 1단계 | ChatGPT 프로젝트 | 형광펜 출석 이미지 업로드 → 이름 리스트 + 인원수 추출 |
| 2단계 | Gemini | 추출된 이름 리스트 기반 크롬 콘솔 스크립트 생성 |
| 3단계 | 크롬 브라우저 F12 | 콘솔창에 스크립트 붙여넣기 → 자동 체크박스 처리 |
이미지를 올리고, 코드를 받고, 콘솔에 붙여넣는 것. 참석 인원이 두 배가 돼도 이 세 단계는 바뀌지 않습니다. 이름을 하나하나 찾아 클릭하지 않아도 됩니다.
4-2. F12 콘솔, 처음 쓰는 사람을 위한 실행 가이드
콘솔창이라는 것도 처음 알았습니다. 그래도 막상 써보면 건드릴 곳은 딱 하나입니다.
- 출석체크 페이지를 크롬으로 엽니다
- 키보드 F12 를 누르거나 마우스 우클릭 후 '검사' 를 선택합니다
- 상단 탭에서 'Console(콘솔)' 탭을 클릭합니다
- AI에게 받은 스크립트 코드를 콘솔창 하단 입력란에 붙여넣습니다
- Enter 를 누르면 실행됩니다
개발자도구 화면이 처음엔 압도적으로 느껴질 수 있습니다. 실제로 쓰는 영역은 콘솔 탭 하나뿐입니다. 나머지는 그냥 배경입니다.
5. 스크립트 하나로 열린 가능성
출석체크 하나를 자동화하고 나서, 다른 게 보이기 시작했습니다.
체크박스를 자동으로 누르는 코드를 만든 건데, 어떤 웹페이지든 같은 방식으로 건드릴 수 있다는 게 보였습니다. 출석체크에만 쓸 이유가 없었습니다.
5-1. 웹을 내 마음대로 — 수집·가공·변경이 가능해진다
크롬 콘솔 스크립트로 할 수 있는 일은 생각보다 많습니다.
- 웹페이지 안에 있는 특정 텍스트나 데이터를 한꺼번에 꺼내오기
- 매번 반복해서 눌러야 하는 버튼을 한 번에 처리하기
- 폼에 일일이 입력해야 할 내용을 자동으로 채우기
- 조건에 맞는 항목만 골라서 처리하기
코드를 직접 짤 줄 몰라도 됩니다. AI에게 상황을 설명하고, 받은 코드를 콘솔에 붙여넣으면 됩니다. 이 흐름을 한 번 익히고 나면 적용할 수 있는 곳이 달리 보입니다.
5-2. AI 없이는 못 했을 일, AI 덕분에 된 일
혼자였다면 Tampermonkey가 작동하지 않는 시점에서 이미 포기했을 겁니다.
왜 안 되는지 찾으려면 관련 문서를 뒤지거나, 따로 강의를 들어야 했을 겁니다. F12 콘솔이라는 방법이 있다는 것조차 몰랐을 겁니다. 책 몇 권을 읽거나 학원 같은 곳에서 따로 배우지 않고서는 접근조차 못 했을 영역이었습니다.
막힌 상황을 AI에게 그대로 설명했고, 그때마다 다음 방법이 왔습니다.
사무자동화 핵심 요약
코딩을 몰라도 됩니다. AI에게 막힌 상황을 설명하고, 받은 코드를 F12 콘솔에 붙여넣으면 됩니다. 안 되면 다시 AI에게 설명하면 됩니다. 그게 전부입니다.
6. 완전한 자동화는 아니었다 — 그래서 다음 단계가 생겼다
지금 방식이 완벽하지 않다는 건 압니다.
이미지를 ChatGPT에 올리고, 코드를 받아 콘솔에 붙여넣는 과정은 여전히 직접 해야 합니다. 버튼 하나로 끝나는 방식이 아닙니다.
6-1. 반복작업 단축만으로도 충분히 달라진 것들
이전에는 형광펜으로 체크된 이름을 보면서 시스템에서 같은 이름을 하나하나 찾아 눌러야 했습니다. 인원이 많아질수록 그 시간도 같이 늘어났습니다.
지금은 이미지 업로드, 코드 복사, 콘솔 실행 세 단계로 끝납니다. 참석자가 늘어나도 세 단계는 바뀌지 않습니다. 이름을 일일이 찾아 클릭하지 않아도 된다는 것만으로 작업 방식 자체가 달라졌습니다.
6-2. 모바일 체크 → 구글드라이브 연동으로 가는 다음 그림
자동화를 만들고 나서 처음부터 방식 자체가 불편했다는 게 보였습니다.
담당자분이 형광펜으로 이름을 긋고, 그걸 이미지로 전달하고, OCR로 읽어서 시스템에 다시 입력하는 것. 중간 단계가 너무 많았습니다. 해결했다고 생각했는데, 더 앞에서 바꿔야 할 것들이 있었습니다.
다음에 바꾸고 싶은 방향은 이렇습니다.
- 참석자가 모바일로 날짜별 이름을 직접 체크
- 체크된 데이터가 구글드라이브에 자동 저장
- 저장된 데이터를 바탕으로 출석 시스템에 바로 입력
이 구조가 완성되면 이미지를 찍고, OCR로 읽고, 코드를 실행하는 단계 자체가 사라집니다. 자동화를 했는데 오히려 다음에 뭘 고쳐야 할지가 더 선명해졌습니다.
7. 처음 시작하는 분을 위한 사무자동화 첫걸음 3단계
거창하게 시작할 필요 없습니다.
지금 매주 손으로 반복하고 있는 작업 하나를 떠올려 보면 됩니다. 그 작업을 AI에게 설명하고, 추천받은 방법을 한 번 직접 실행해보는 것. 그게 시작입니다.
| 단계 | 핵심 질문 | 행동 |
|---|---|---|
| 1단계 | 매주 반복하는 작업이 있는가? | 반복 작업 하나를 구체적으로 적어본다 |
| 2단계 | AI에게 설명할 수 있는가? | 상황을 그대로 AI에게 전달하고 방법을 묻는다 |
| 3단계 | 직접 실행해봤는가? | 받은 코드나 방법을 실제로 한 번 써본다 |
처음부터 잘 작동하지 않아도 됩니다. 안 되면 AI에게 안 된다고 설명하면 됩니다. 그게 다음 단계가 됩니다.
- 코딩을 몰라도 시작할 수 있습니다
- 완벽한 자동화보다 반복 하나를 줄이는 것이 먼저입니다
- 막히면 AI에게 막힌 상황을 그대로 전달하면 됩니다
- 한 번 돌아가는 걸 보고 나면, 그다음은 달라집니다
처음엔 저도 몰랐습니다. F12가 뭔지, 콘솔이 뭔지, 스크립트가 뭔지. 그냥 AI에게 물어봤고, 시키는 대로 해봤을 뿐입니다.
F12 개발자도구가 없는 브라우저에서도 사용할 수 있나요?
F12 개발자도구는 크롬 브라우저에 기본으로 내장된 기능입니다. 엣지(Edge), 파이어폭스(Firefox) 등 다른 브라우저에도 유사한 개발자도구가 있지만, 이 글에서 소개한 방식은 크롬 기준으로 진행했습니다. 가장 안정적인 결과를 위해 크롬 브라우저 사용을 권장합니다.
코딩을 전혀 모르는데 AI가 준 코드를 그냥 써도 되나요?
됩니다. 코드 내용을 이해하지 못해도 콘솔에 붙여넣고 엔터를 누르면 실행됩니다. 다만 어떤 페이지에서 실행하는지, 어떤 작업을 하는 코드인지는 AI에게 미리 확인해두는 것이 좋습니다. 특히 처음 시도할 때는 중요하지 않은 테스트 환경에서 먼저 실행해보는 것을 추천합니다.
ChatGPT 말고 다른 AI로도 형광펜 이미지 인식이 가능한가요?
직접 테스트한 결과, Gemini와 Claude는 형광펜이 겹친 이미지에서 이름 인식에 실패했습니다. ChatGPT가 같은 이미지를 정확하게 읽어냈습니다. AI 도구는 계속 업데이트되므로 추후에는 다른 도구도 지원될 수 있습니다. 새로운 도구를 시도할 때는 동일한 이미지를 각각 올려보고 결과를 비교해보는 것이 가장 빠릅니다.
Tampermonkey는 왜 작동하지 않았나요?
정확한 원인은 파악하지 못했습니다. 페이지 보안 설정이나 스크립트 실행 권한 문제일 수 있습니다. 새로고침을 해봐도 실행되지 않아 Gemini에게 다시 문의했고, 그때 F12 콘솔 직접 실행 방식을 추천받았습니다. 원인을 모르더라도 AI에게 상황을 설명하면 대안을 찾아줍니다.
사무자동화 스크립트, 처음 시도할 때 가장 주의할 점은 무엇인가요?
이미 처리된 데이터가 있는 경우, 스크립트가 해당 항목을 다시 클릭해 체크가 풀릴 수 있습니다. 이 글에서도 같은 문제가 발생했습니다. 처음 실행할 때는 소수 인원 데이터로 먼저 테스트하고, 이미 체크된 항목은 건너뛰는 조건이 코드에 포함되어 있는지 AI에게 확인해두는 것이 좋습니다.




