← 블로그 목록

PDF에서 표만 골라 Excel(엑셀)로 깔끔하게 변환하기

PDF Excel표 추출튜토리얼

회의록·매출표·재무제표를 PDF로 받았는데 엑셀에서 분석해야 한다면, 표를 셀 단위로 다시 그리는 건 시간 낭비입니다. PDF의 표 영역만 인식해 자동으로 .xlsx로 옮기는 방법을 소개합니다.

기본 흐름

  1. 도구 페이지(/tools)에서 'PDF → Excel'을 선택합니다.
  2. 표가 포함된 PDF 파일을 업로드합니다.
  3. 변환 버튼을 누르면 페이지별로 표를 감지해 셀로 분해한 .xlsx 파일을 생성합니다.
  4. 다운로드 후 엑셀에서 열어 결과를 확인합니다.

잘 인식되는 표의 특징

  • 셀 경계선이 명확하게 그려진 표 (일반 워드/엑셀 출력 PDF)
  • 셀 내 텍스트가 가로 정렬이 일정한 표
  • 병합된 셀이 적고 헤더가 한 줄로 구성된 표

인식이 어려운 경우와 대처법

  • 이미지 기반 스캔 PDF — 먼저 OCR로 텍스트 레이어를 추가한 뒤 다시 변환하면 인식률이 크게 올라갑니다.
  • 복잡한 셀 병합·중첩 표 — 자동 분해가 어긋날 수 있어 변환 후 수동 보정이 필요합니다.
  • 여러 페이지에 걸친 표 — 페이지 단위로 시트가 분리될 수 있습니다. 시트를 이어붙여 사용하세요.

API로 자동화하기

대량의 인보이스나 거래 내역서를 매일 받아 처리해야 한다면 API 호출이 효율적입니다.

curl -X POST "https://your-domain/api/v1/office/pdf-to-xlsx" \
  -H "X-API-Key: pk_live_..." \
  -F "file=@statement.pdf"

응답으로 다운로드 URL이 반환되며, 후속 파이프라인에서 그대로 받아 처리할 수 있습니다.