Mỗi lần bạn chat với AI (Claude AI), upload file, hay bật một tính năng, bạn đang tiêu một thứ gọi là token. Dùng khéo thì dư dả cả tháng. Không khéo thì phải chờ reset.
Hãy nghĩ gói Claude Pro $20/tháng như một ngân sách. Bạn có thể tiêu hết trong một tuần nếu dùng bừa bãi, hoặc dùng thoải mái cả tháng nếu biết cách phân bổ. Token là đơn vị tiêu thụ — mỗi chữ bạn gửi, mỗi file đính kèm, mỗi tính năng được bật đều tốn token.
Bài này gom lại những thứ bạn chỉ cần setup một lần nhưng tiết kiệm được mãi về sau. Không phức tạp, không cần hiểu kỹ thuật sâu — chỉ cần làm theo từng bước.
Lưu ý nhỏ: Tiếng Việt tốn nhiều token hơn tiếng Anh, trung bình gấp 1.5–2 lần. Cùng một câu hỏi, viết tiếng Anh sẽ tiết kiệm hơn đáng kể. Nếu bạn tốt tiếng Anh, hãy ưu tiên dùng khi chat với Claude.
Nhóm 1 — Setup một lần, tiết kiệm mãi về sau
01. Cài Personal Preferences — bước quan trọng nhất
Vào Settings → General → Personal Preferences và viết một đoạn ngắn giới thiệu bạn là ai, bạn làm gì, và bạn muốn Claude trả lời theo phong cách nào. Làm một lần, tất cả các cuộc chat sau đó Claude đều tự hiểu — không cần nhắc lại từ đầu.
Giữ ngắn gọn, dưới 300 từ là đủ. Càng cụ thể thì Claude càng trả lời đúng ý ngay từ đầu, không tốn thêm vòng chỉnh sửa.
02. Xây thư viện prompt dùng đi dùng lại
Mỗi khi bạn viết một prompt hay, Claude trả lời tốt — hãy lưu lại vào một file riêng (Notion, Google Docs, hay bất cứ đâu bạn hay mở). Lần sau chỉ cần copy, thay phần nội dung, gửi đi.
Prompt ổn định còn có thêm một lợi thế kỹ thuật: Claude có cơ chế cache phần đầu của prompt. Nếu bạn dùng cùng một cấu trúc nhiều lần, hệ thống nhận ra và phản hồi nhanh hơn, tốn ít token hơn.
Lần sau dùng, chỉ thay phần trong ngoặc vuông — không cần nghĩ lại cấu trúc.
03. Dùng Projects cho file tham chiếu thường xuyên
Nếu bạn có file dùng đi dùng lại cho cùng một nhóm việc — CV, brand guideline, tài liệu khóa học, tài liệu sản phẩm — đừng upload lại ở mỗi cuộc chat mới. Mỗi lần upload là mỗi lần tốn token để Claude “đọc” lại.
Thay vào đó: tạo một Project, upload file một lần vào đó. Mọi cuộc chat trong Project đều tự động thấy file mà không cần nạp lại.
* Tính năng Projects chỉ có ở tài khoản trả phí (Claude Pro, Team, Enterprise).
Nhóm 2 — Chuẩn bị trước khi bắt đầu chat
04. Đổi PDF sang text hoặc Markdown trước khi upload
PDF nặng hơn text thuần rất nhiều — vì bên trong có layout, font, metadata ẩn. Một trang PDF có thể tốn gấp 3–5 lần so với cùng nội dung đó ở dạng .txt hay .md.
Cách làm đơn giản nhất: copy toàn bộ nội dung từ PDF, dán vào Google Docs, rồi tải về dạng .txt hoặc .md trước khi upload lên Claude. Với PDF scan (chỉ có hình), dùng tool OCR trực tuyến để tách text ra trước.
Ngoại lệ: nếu PDF có hình ảnh quan trọng mà bạn cần Claude xem, thì cứ upload PDF nguyên bản.
05. Tắt các tính năng không dùng đến
Web Search, Gmail Connector, Calendar, và các tính năng tích hợp bên ngoài đều ngốn token ngay khi được bật — dù bạn có thực sự dùng đến chúng hay không. Để mặc định tắt hết và chỉ bật khi thật sự cần.
Ví dụ thực tế: nếu bạn hỏi Claude viết một bài blog dựa trên kiến thức có sẵn, không cần bật Web Search. Chỉ bật khi hỏi tin tức mới, giá cổ phiếu, hay những thứ cần dữ liệu real-time.
06. Chọn đúng model cho từng loại việc
Claude có ba model chính, nặng nhẹ khác nhau: Haiku nhẹ nhất và nhanh nhất, Sonnet cân bằng giữa chất lượng và tốc độ, Opus mạnh nhất nhưng tốn nhiều nhất. Dùng Opus cho việc Sonnet cũng làm được — giống như kêu senior đi photo tài liệu vậy.
| Model | Dùng khi nào | Ví dụ việc cụ thể |
|---|---|---|
| Haiku ~80% việc hàng ngày | Việc đơn giản, nhanh | Sửa lỗi chính tả, dịch đoạn ngắn, tóm tắt một bài, trả lời câu hỏi factual |
| Sonnet ~15% việc | Viết lách, phân tích, brainstorm | Bài viết 1500–2000 từ, lập luận có chiều sâu, trả lời câu hỏi phức tạp |
| Opus ~5% việc | Nhiệm vụ thực sự phức tạp | Phân tích nhiều tài liệu dài, lên chiến lược lớn, code dự án phức tạp |
Extended Thinking của Opus giúp Claude “nghĩ kỹ” trước khi trả lời, rất hữu ích cho bài toán nhiều bước — nhưng có thể tăng token gấp đôi. Chỉ bật khi thực sự cần, không bật mặc định.
07. Chỉ đính kèm file thật sự cần cho task đó
Mỗi file bạn đính kèm đều được tính vào context và tốn token để Claude “nạp vào bộ nhớ”. Đừng gắn 5–10 file cho an toàn, phòng hờ Claude cần đến.
Trước khi upload, tự hỏi: “Task này thực sự dùng đến file nào?” Gắn đúng file đó thôi. Nếu một đoạn ngắn trong tài liệu là đủ, hãy copy đoạn đó trực tiếp vào chat thay vì upload cả file.
Nhóm 3 — Biết việc nào không nên giao cho Claude
08. Phân loại task — đừng dùng Claude cho mọi thứ
Claude mạnh nhất ở ngôn ngữ, lập luận, và code. Với những việc thuộc thế mạnh của các AI khác, bạn vừa tốn token vừa nhận kết quả kém hơn. Phân loại task ngay từ đầu là một trong những cách tiết kiệm hiệu quả nhất.
Tool phù hợp hơn cho từng loại việc
| Tạo ảnh | Gemini, Midjourney, ChatGPT, Ideogram |
| Tin tức real-time | Perplexity, Grok, Gemini (có web access) |
| Tạo nhạc | Suno, Udio |
| Giá cổ phiếu / thể thao | Tìm kiếm trực tiếp trên Google, Bloomberg |
Nguyên tắc đơn giản: Claude là công cụ chính cho viết lách, tư duy, và code — còn lại hãy dùng đúng tool chuyên biệt.
Hành động ngay hôm nay (chỉ mất 15 phút)
- Vào Settings → cài Personal Preferences Viết 3–5 câu về bạn là ai và bạn muốn Claude phản hồi như thế nào. Mọi chat sau đó đều được hưởng lợi.
- Đổi thói quen upload PDF → dùng .txt hoặc .md Với tài liệu có sẵn, copy nội dung vào Google Docs rồi export về dạng text trước khi upload.
- Đặt Sonnet làm default — chỉ chuyển sang Opus khi thực sự cần 80% việc Haiku làm được, 15% cần Sonnet. Chỉ khoảng 5% thực sự cần đến Opus.
Áp dụng những bước trên, bạn sẽ thấy gói Claude $20 trở nên thoải mái và hiệu quả hơn rất nhiều. Tiết kiệm token hôm nay chính là đầu tư cho thói quen làm việc thông minh với AI trong tương lai.
Bạn đang áp dụng mẹo tiết kiệm token nào? Chia sẻ kinh nghiệm bên dưới để cùng nhau học hỏi nhé!









Để lại một bình luận