
반갑습니다. 15년 차 SCM 및 자동화 전문가 에이드네(Aidne)입니다.
월말 결산 시즌만 되면 영업팀 김 대리의 책상 위에는 구겨진 영수증과 각기 다른 양식의 거래처 송장이 산더미처럼 쌓입니다. 하루 종일 듀얼 모니터를 띄워놓고 한쪽에는 PDF, 한쪽에는 엑셀을 열어 끝없는 ‘복붙 노가다’를 시전하죠. 이것이 과연 2024년의 스마트한 업무 방식일까요?
오늘은 이 지긋지긋한 수기 입력 컨베이어 벨트를 완전히 멈추고, ChatGPT API와 Make를 활용해 송장 및 영수증 OCR 데이터 추출을 100% 자동화하는 실무 워크플로우를 딥다이브 해보겠습니다.
기존 영수증 OCR 솔루션의 한계와 병목 현상
과거에도 영수증을 스캔해서 텍스트로 변환해 주는 툴은 많았습니다. 하지만 SCM 현장에서 기존 OCR 솔루션이 외면받았던 이유는 명확합니다. 거래처마다 송장 양식이 천차만별이기 때문입니다.
좌표 기반의 전통적인 템플릿 매칭 방식은 A사의 송장에는 작동하지만, B사의 송장에는 에러를 뱉어냅니다. 결국 담당자가 일일이 검수하고 수정해야 하는 병목 현상(Bottleneck)이 발생하며, 이는 곧 전사적인 데이터 파이프라인의 지연으로 이어집니다.
GPT-4o Vision API: 문맥을 이해하는 차세대 데이터 파싱

하지만 ChatGPT API(특히 GPT-4o Vision 모델)의 등장으로 판도가 바뀌었습니다. AI는 단순한 글자 인식을 넘어, 문서의 ‘문맥’을 이해합니다. ‘Total’이라는 단어가 없어도 가장 하단의 금액이 총액임을 추론하고, 표 형태가 찌그러져 있어도 품목, 수량, 단가를 정확히 분리해 냅니다. 즉, 비정형 데이터를 완벽한 정형 데이터(JSON)로 변환하는 가장 강력한 파서(Parser)가 탄생한 것입니다.
Make 기반 송장 OCR 데이터 자동 추출 워크플로우 구축 가이드
이제 수박 겉핥기식 이론은 접어두고, 실무에서 당장 써먹을 수 있는 Make(구 Integromat) 기반의 자동화 파이프라인 세팅 방법을 단계별로 공개합니다.
[1단계: Gmail 트리거] 인보이스 수신 및 첨부파일 다운로드
첫 번째 단계는 자동화의 시작점(Trigger)을 만드는 것입니다. Make에서 ‘Gmail – Watch Emails’ 모듈을 추가합니다. 검색 쿼리(Search Query)에 has:attachment subject:'송장' OR subject:'invoice'를 입력하여, 특정 키워드가 포함되고 첨부파일이 있는 이메일만 필터링해 가져오도록 세팅합니다. 이후 이메일에 첨부된 PDF나 이미지 파일을 임시로 다운로드하는 라우팅을 구성합니다.
[2단계: ChatGPT API 파싱] Vision 모델을 통한 핵심 데이터 추출
다운로드한 파일을 ‘OpenAI (ChatGPT) – Make an API Call’ 모듈로 넘깁니다. 이때 프롬프트 엔지니어링이 자동화의 성패를 좌우합니다. 시스템 프롬프트에 다음과 같이 역할을 부여하세요.
‘너는 15년 차 전문 회계/SCM 데이터 추출기야. 첨부된 이미지에서 발행일, 공급자명, 사업자등록번호, 총 청구금액, 부가세를 추출해서 반드시 JSON 포맷으로만 응답해. 양식이 달라도 문맥을 파악해서 정확한 값을 매핑해.’
이 과정을 거치면 제각각이던 송장 이미지가 깔끔한 데이터베이스 입력용 텍스트로 변환됩니다.
[3단계: Google Sheets 및 ERP 연동] 정형 데이터 자동 적재
마지막으로 추출된 JSON 데이터를 ‘JSON – Parse JSON’ 모듈로 파싱한 뒤, ‘Google Sheets – Add a Row’ 또는 회사 내부 ERP의 Webhook/API 모듈로 연결합니다. 이제 거래처에서 송장 메일을 보내는 즉시, 약 10초 만에 엑셀과 ERP 시스템에 데이터가 자동으로 기입됩니다. 김 대리의 엑셀 노가다가 영구적으로 소멸하는 순간입니다.
B2B 전사적 AI 워크플로우: 개인의 생산성을 넘어 시스템으로
이러한 OCR 데이터 자동 추출은 단순한 ‘개인 업무 효율화’에 그치지 않습니다. B2B 관점에서 보면, 이는 수억 원을 들여 구축한 ERP 시스템에 깨끗한 혈액(데이터)을 실시간으로 공급하는 핵심 동맥입니다. 에이전시나 경영진이라면, 이러한 마이크로 자동화를 모듈화하여 재무, 영업, HR 전반에 걸친 ‘전사적 AI 디스패처’를 구축하는 큰 그림을 그려야 합니다.
💡 3줄 요약 & 다음 스텝
- 기존 양식 의존형 OCR의 한계를 GPT-4o Vision의 문맥 이해 능력으로 완벽히 극복할 수 있습니다.
- Make를 활용해 [이메일 수신] ➔ [AI 데이터 파싱] ➔ [ERP 자동 적재]의 무인 파이프라인을 구축하세요.
- 개인의 엑셀 수기 입력을 없애는 것을 넘어, 전사적 데이터 흐름을 통제하는 시스템 도입이 필수입니다.
이 내용이 도움이 되셨다면, 아래 글도 반드시 읽어보세요!
