← 블로그 목록
PDF에서 표만 골라 Excel(엑셀)로 깔끔하게 변환하기
PDF Excel표 추출튜토리얼
회의록·매출표·재무제표를 PDF로 받았는데 엑셀에서 분석해야 한다면, 표를 셀 단위로 다시 그리는 건 시간 낭비입니다. PDF의 표 영역만 인식해 자동으로 .xlsx로 옮기는 방법을 소개합니다.
기본 흐름
- 도구 페이지(/tools)에서 'PDF → Excel'을 선택합니다.
- 표가 포함된 PDF 파일을 업로드합니다.
- 변환 버튼을 누르면 페이지별로 표를 감지해 셀로 분해한 .xlsx 파일을 생성합니다.
- 다운로드 후 엑셀에서 열어 결과를 확인합니다.
잘 인식되는 표의 특징
- 셀 경계선이 명확하게 그려진 표 (일반 워드/엑셀 출력 PDF)
- 셀 내 텍스트가 가로 정렬이 일정한 표
- 병합된 셀이 적고 헤더가 한 줄로 구성된 표
인식이 어려운 경우와 대처법
- 이미지 기반 스캔 PDF — 먼저 OCR로 텍스트 레이어를 추가한 뒤 다시 변환하면 인식률이 크게 올라갑니다.
- 복잡한 셀 병합·중첩 표 — 자동 분해가 어긋날 수 있어 변환 후 수동 보정이 필요합니다.
- 여러 페이지에 걸친 표 — 페이지 단위로 시트가 분리될 수 있습니다. 시트를 이어붙여 사용하세요.
API로 자동화하기
대량의 인보이스나 거래 내역서를 매일 받아 처리해야 한다면 API 호출이 효율적입니다.
curl -X POST "https://your-domain/api/v1/office/pdf-to-xlsx" \
-H "X-API-Key: pk_live_..." \
-F "file=@statement.pdf"응답으로 다운로드 URL이 반환되며, 후속 파이프라인에서 그대로 받아 처리할 수 있습니다.