Cách chuyển PDF sang Excel giữ nguyên bảng

Chia sẻ bài viết

Mục lục
Chuyển PDF sang Excel giữ nguyên bảng dữ liệu
Hướng dẫn chuyển PDF sang Excel nhanh chóng giữ nguyên bảng

Cách chuyển PDF sang Excel giữ nguyên bảng dữ liệu là nhu cầu cấp bách khi bạn cần phân tích dữ liệu từ báo cáo PDF. Bài viết này hướng dẫn các công cụ miễn phí và mẹo giữ nguyên định dạng bảng khi chuyển đổi sang Excel.

Chuyển PDF sang Excel trực tuyến

Smallpdf - PDF to Excel

Truy cập smallpdf.com, chọn "PDF to Excel", kéo thả file PDF chứa bảng, chờ xử lý (10-30 giây tùy kích thước), Download file .xlsx. Smallpdf sử dụng OCR thông minh để nhận diện bảng, dòng, cột, và bảo toàn định dạng tốt. Giới hạn miễn phí 20 MB/file.

iLovePDF - PDF to Excel

iLovePDF (ilovepdf.com) cũng hỗ trợ chuyển PDF sang Excel. Upload file, công cụ sẽ phát hiện bảng tự động và xuất .xlsx. Ưu điểm là hỗ trợ batch (upload nhiều file PDF cùng lúc, tải về zip với tất cả file Excel). Miễn phí 25 task/ngày.

CloudConvert - Hỗ trợ đa dạng định dạng

CloudConvert (cloudconvert.com) cho phép chuyển PDF sang Excel, Google Sheets, OpenOffice Calc. Upload file, chọn định dạng đầu ra, CloudConvert sẽ xử lý. Chất lượng chuyển đổi cao, bảng được giữ nguyên tốt. Miễn phí 25 conversion/ngày.

Tabula - Chuyên trích xuất bảng từ PDF

Tabula (tabula.technology) là công cụ chuyên biệt dành riêng cho việc trích xuất bảng từ PDF. Giao diện trực quan: upload PDF, kéo vùng chứa bảng, Tabula sẽ tự động phát hiện và xuất CSV hoặc Excel. Miễn phí 100%, không giới hạn.

Mẹo: Nếu PDF chứa bảng phức tạp (merge cell, nested header), Smallpdf hoặc Tabula cho kết quả tốt nhất vì sử dụng thuật toán nhận diện bảng tiên tiến.

Chuyển PDF sang Excel ngoại tuyến (offline)

LibreOffice Calc - Copy bảng từ PDF

Mở file PDF trong LibreOffice Draw, chọn bảng (Ctrl+A), Copy (Ctrl+C). Mở LibreOffice Calc, Paste (Ctrl+V). Nếu bảng không Paste được trực tiếp, hãy:
1. Copy bảng từ PDF
2. Mở Notepad, Paste để xem định dạng
3. Copy text, Paste vào Calc
4. Dùng "Text to Columns" để tách dữ liệu thành cột

Foxit Reader - Xuất bảng

Foxit Reader (miễn phí) cho phép select bảng và copy. Mở PDF trong Foxit, chọn bảng bằng chuột, Ctrl+C, rồi Paste vào Excel. Phương pháp này đơn giản nhưng phù hợp với bảng đơn giản.

Phương pháp thủ công cho bảng phức tạp

Khi nào dùng thủ công?

Nếu PDF chứa bảng có cấu trúc phức tạp (merge cell, nested header, hình ảnh bên trong), công cụ tự động có thể không nhận diện chính xác. Lúc này bạn cần nhập dữ liệu bằng tay hoặc dùng kết hợp:

Bước 1: Copy text từ PDF

Mở PDF trong Adobe Reader hoặc LibreOffice, select toàn bộ text trong bảng, Ctrl+C.

Bước 2: Paste vào Excel

Mở Excel, Paste vào ô A1. Excel sẽ paste toàn bộ text thành 1 cột duy nhất.

Bước 3: Tách dữ liệu vào cột

Chọn cột chứa dữ liệu, Data > Text to Columns > chọn delimiter (Tab, Space, Comma) > Finish. Excel sẽ tách dữ liệu thành các cột tương ứng.

So sánh công cụ chuyển PDF sang Excel

Công cụLoạiChất lượng bảngGiới hạn miễn phíBatch
SmallpdfTrực tuyếnTốt20 MB/fileKhông
iLovePDFTrực tuyếnTốt25 task/ngày
CloudConvertTrực tuyếnTốt25 task/ngày
TabulaTrực tuyếnXuất sắc (chuyên)Không giới hạnKhông
LibreOffice CalcNgoại tuyếnTrung bìnhKhông giới hạnKhông
Excel (Copy-Paste)Ngoại tuyếnCần chỉnh sửaKhông giới hạnKhông

Mẹo chuyển đổi chính xác

  • Chọn công cụ đúng: Bảng đơn giản (2-3 cột) dùng Smallpdf. Bảng phức tạp dùng Tabula. Batch file dùng iLovePDF.
  • Kiểm tra PDF trước chuyển: Mở PDF, xem bảng có rõ ràng, không bị cắt xén hay bị tham nhũng dữ liệu không.
  • Chuyển đổi PDF scan (hình ảnh): Nếu PDF là scan (ảnh chụp), công cụ sẽ khó nhận diện. Dùng OCR trước rồi chuyển đổi, hoặc nhập thủ công.
  • Kiểm tra kết quả: Sau chuyển đổi, mở file Excel để xác minh dữ liệu, định dạng, số liệu có chính xác không trước khi dùng cho phân tích.
  • Sắp xếp lại dữ liệu: Nếu bảng Excel sau chuyển đổi bị xáo trộn, hãy dùng Excel sort, filter để sắp xếp lại.

Hướng dẫn từng bước với Tabula

  1. Truy cập tabula.technology
  2. Click "Import a PDF file", chọn file PDF
  3. Tabula sẽ hiển thị PDF preview
  4. Kéo hộp chọn xung quanh bảng bạn muốn trích
  5. Click "Preview & Export Extracted Data"
  6. Xem kết quả, điều chỉnh nếu cần
  7. Download CSV hoặc Excel format

Lưu ý: PDF scan (ảnh) sẽ không thể chuyển đổi trực tiếp. Bạn cần chạy OCR trước (dùng Google Docs, Smallpdf OCR) để nhận diện text, sau đó mới chuyển PDF sang Excel.

Cần Microsoft Office bản quyền?

TND là nhà cung cấp phần mềm bản quyền chính hãng tại Việt Nam, xuất hoá đơn VAT đầy đủ, tư vấn chọn đúng license.

Xem Office bản quyền

Câu hỏi thường gặp

Công cụ nào tốt nhất để chuyển PDF có bảng phức tạp sang Excel?

Tabula là chuyên biệt nhất. Smallpdf, iLovePDF cũng tốt. Nếu công cụ không nhận diện đúng, dùng thủ công (copy text, paste vào Excel, dùng Text to Columns).

PDF scan có thể chuyển sang Excel được không?

PDF scan (ảnh) không thể chuyển đổi trực tiếp. Bước 1: chạy OCR (Google Docs, Smallpdf OCR) để tạo text PDF. Bước 2: chuyển PDF text sang Excel.

Làm sao tách dữ liệu từ PDF vào từng cột khác nhau trong Excel?

Copy text từ PDF > Paste vào Excel cột A > Data > Text to Columns > chọn delimiter (Tab/Space/Comma) > Finish. Excel sẽ tách dữ liệu vào các cột tương ứng.

Chuyển đổi nhiều bảng PDF sang Excel cùng lúc có cách nào?

iLovePDF hỗ trợ batch (upload nhiều file, tải về zip). Tabula phải upload từng file. CloudConvert hỗ trợ batch. Hoặc dùng công cụ command-line như Tabula-py (Python).

2009
15+ năm vận hành liên tục
10+
tập đoàn lớn tin dùng
100+
doanh nghiệp SMB Việt
30 ngày
đổi key lỗi miễn phí
Phần mềm bản quyền chính hãng chúng tôi cung cấp
Bản quyền chính hãng Hóa đơn VAT đầy đủ Đổi key lỗi 30 ngày Vận hành từ 2009 MST 0200994870 Hotline 0225.999.6666