Quên cách dùng Claude cũ đi — Đây là 6 cách để dùng cả ngày không hết lượt

Bạn đang làm việc hăng say, sắp xong báo cáo rồi thì bỗng dưng Claude báo: “Bạn đã chạm giới hạn sử dụng, hãy quay lại sau vài tiếng nữa.” Deadline vẫn ở đó. Claude thì không dùng được nữa.

Vấn đề không phải là bạn mua gói quá rẻ. Vấn đề là hầu hết chúng ta đang đốt token sai cách — gấp ba đến năm lần mức cần thiết mà không hay biết. Dưới đây là sáu nhóm phương pháp cụ thể để bạn dùng Claude cả ngày mà không lo bị khóa giữa chừng.

Trước tiên: Claude tính giới hạn theo token, không phải tin nhắn

Một token tương đương khoảng bốn ký tự. Nghĩa là 100 từ sẽ tốn khoảng 130–150 token. Mỗi từ bạn gõ, mỗi file bạn tải lên, mỗi câu Claude trả lời — tất cả đều được quy ra token.

Nhưng đây mới là điều quan trọng nhất: Claude đọc lại toàn bộ lịch sử đoạn chat mỗi lần bạn gõ một tin nhắn mới. Tin nhắn thứ 5 trong một đoạn chat có thể tốn X token, nhưng tin nhắn thứ 30 trong cùng đoạn đó có thể tốn đến 10X — vì Claude phải đọc lại 29 tin trước đó trước khi xử lý câu hỏi mới của bạn.

Thêm vào đó, nghiên cứu năm 2025 trên 18 mô hình ngôn ngữ lớn ghi nhận một hiện tượng gọi là context rot — chất lượng câu trả lời suy giảm dần khi đoạn chat càng dài. Bạn vừa tốn nhiều token hơn, vừa nhận kết quả kém hơn. Tệ hai lần.

Phương pháp 1: Cài đặt một lần, dùng mãi mãi

Nếu bạn đang bắt đầu mỗi đoạn chat bằng cách giới thiệu lại bản thân — “Mình là manager công ty X, lĩnh vực Y, hãy trả lời theo phong cách Z” — thì mỗi đoạn chat như vậy bạn đang tiêu tốn token một cách không cần thiết.

Cách làm: Vào Settings → Profile, điền tên và nghề nghiệp vào đó một lần. Claude sẽ nhớ cho tất cả các đoạn chat sau, không cần nhắc lại nữa.

Quan trọng hơn là ô “Instructions for Claude”. Hãy ghi vào đó một câu như thế này:

Trả lời ngắn gọn, không cần mở đầu lịch sự thừa thãi. Nếu tôi sai thì hãy chỉ ra thẳng.

Chỉ một câu đó thôi, bạn sẽ tiết kiệm hàng trăm token mỗi đoạn chat — vì Claude sẽ không còn viết những câu kiểu “Certainly! That’s a great question” hay “Ý tưởng của bạn thật tuyệt vời” nữa. Những câu đó thừa mà lại tốn token.

Mẹo nhỏ: Bạn không cần phải lịch sự chào hỏi khi làm việc với Claude. Đừng gõ “Chào bạn, hãy bắt đầu làm việc nhé”. Ra lệnh thẳng luôn — không ai đánh giá bạn cộc lốc đâu.

Tiếp theo là Projects — tính năng tiết kiệm token mạnh nhất trên Claude. Khi bạn cho tài liệu vào Project (giới thiệu công ty, quy trình, template hay dùng, tài liệu tham khảo), Claude sẽ lưu cache những nội dung đó. Bạn không cần tải lên lại mỗi lần. Anthropic xác nhận trong tài liệu chính thức: nội dung trong Projects được cache và không tính vào giới hạn sử dụng theo cách thông thường.

Phương pháp 2: Giao tiếp đúng cách với Claude

Đây là cách hầu hết mọi người đang làm:

Gõ một câu → Claude trả lời
Gõ tiếp: “Không, ý tôi là…” → đợi
Gõ tiếp: “Thêm vào đó hãy giúp tôi…” → đợi
Gõ tiếp: “Bây giờ xuất ra file doc”

Năm tin nhắn qua lại cho một kết quả mà đáng lẽ ra chỉ cần một câu lệnh đúng cách là xong. Token nhân lên theo từng bước.

Cách làm: Trước khi gõ, dành 2 phút suy nghĩ rõ: Input là gì? Output trông như thế nào? Gộp tất cả vào một câu lệnh rõ ràng, gõ một lần. Kết quả sẽ đúng hoặc gần đúng, chỉ cần sửa ít thôi.

Và nếu kết quả chưa ưng ý, đừng gõ tin nhắn mới để bảo “Cái này sai rồi, sửa lại”. Khi làm vậy, Claude phải đọc lại toàn bộ hội thoại từ đầu, kể cả câu trả lời sai — lãng phí token vô cùng.

Thay vào đó: bấm vào biểu tượng chỉnh sửa trên câu lệnh cũ, sửa nội dung và gửi lại. Tin nhắn cũ sẽ bị thay thế, câu trả lời sai không bị cộng vào lịch sử. Claude đọc lại ít hơn, token tiết kiệm được nhiều hơn.

Mẹo nhỏ: Nếu nội dung không bắt buộc phải dùng tiếng Việt, hãy gõ bằng tiếng Anh. Xử lý tiếng Anh tốn ít token hơn tiếng Việt.

Phương pháp 3: Kiểm soát độ dài đoạn chat

Đây là con số bạn cần biết:

5 tin nhắn ≈ 10.000 token
20 tin nhắn ≈ 105.000 token
30 tin nhắn ≈ 232.000 token

Token tăng theo cấp số nhân, không phải cộng dồn đều. Và khi đoạn chat quá dài, chất lượng câu trả lời cũng bắt đầu giảm.

Cách làm: Khi đoạn hội thoại đã dài, gõ câu lệnh này:

Summarize the key decisions and outputs from our conversation so far in bullet points.

Claude sẽ tạo bản tóm tắt trong vài giây. Bạn copy nó, mở đoạn chat mới, paste vào và tiếp tục làm việc từ đó. Bạn không mất ngữ cảnh — bạn chỉ bỏ đi những phần lịch sử đang làm chậm và tốn token của mình.

Phương pháp 4: Tải file lên thông minh hơn

Khi bạn tải lên file Word hoặc PDF, Claude phải xử lý qua các lớp định dạng và metadata. Tất cả điều đó đều tốn token. File .md hoặc file văn bản thuần túy thì Claude đọc trực tiếp, ít tốn token hơn với cùng nội dung.

Nhưng quan trọng hơn: đừng tải file chỉ vì bạn có file đó. Nếu file dài 50 trang nhưng Claude chỉ cần ba trang, hãy copy đúng ba trang đó và dán thẳng vào câu lệnh. Đừng tải cả file 50 trang.

Và nếu bạn thường xuyên tải cùng một tài liệu vào nhiều đoạn chat khác nhau, đó là dấu hiệu tài liệu đó nên nằm trong một Project — không phải trong từng đoạn chat riêng lẻ.

Phương pháp 5: Cài đúng, tắt đúng thứ

Chọn đúng model: Claude Opus là model mạnh nhất nhưng tốn token hơn đáng kể so với Sonnet. Những việc như soạn email, tóm tắt văn bản, dịch tài liệu, trả lời câu hỏi thông thường — Sonnet đã quá đủ rồi. Hãy để dành Opus cho những bài toán thực sự cần suy luận nhiều bước. Mỗi lần chọn Opus cho việc Sonnet làm được là bạn đang dùng dao mổ trâu để thịt gà.

Model	Dùng khi nào	Ví dụ việc cụ thể
Haiku~80% việc hàng ngày	Việc đơn giản, nhanh	Sửa lỗi chính tả, dịch đoạn ngắn, tóm tắt một bài, trả lời câu hỏi factual
Sonnet~15% việc	Viết lách, phân tích, brainstorm	Bài viết 1500–2000 từ, lập luận có chiều sâu, trả lời câu hỏi phức tạp
Opus~5% việc	Nhiệm vụ thực sự phức tạp	Phân tích nhiều tài liệu dài, lên chiến lược lớn, code dự án phức tạp

Tắt những tính năng không cần thiết:

Web search: Khi bật, Claude tìm kiếm trên mạng, đọc kết quả, tổng hợp — tất cả tốn token. Chỉ bật khi thực sự cần thông tin mới.
Extended thinking: Khi bật, Claude suy nghĩ thêm trước khi trả lời — cũng tốn token. Tắt đi khi bạn chỉ cần soạn email hay tóm tắt đoạn ngắn.
Artifacts: Tạo Artifact (cửa sổ riêng để hiển thị code, tài liệu, diagram) tốn nhiều token hơn trả lời thẳng vào đoạn chat. Nếu bạn chỉ cần đọc kết quả, không cần xuất hay render gì, hãy vào Settings → Capabilities và tắt Artifacts đi. Câu trả lời vẫn đầy đủ, chỉ hiển thị thẳng trong đoạn chat thay vì mở cửa sổ riêng. Ít token hơn, kết quả như nhau.

Phương pháp 6: Hiểu Rolling Window để làm chủ giới hạn

Claude không reset giới hạn vào nửa đêm như nhiều người nghĩ. Nó dùng hệ thống Rolling Window — cửa sổ 5 tiếng cuộn liên tục.

Ví dụ: bạn bắt đầu dùng Claude lúc 8:00 sáng. Cửa sổ 5 tiếng bắt đầu và kéo dài đến 13:00. Nếu bạn dùng hết lượng token trong khoảng đó, bạn phải chờ đến 13:00 để giới hạn được reset. Nhưng nếu từ 13:00 đến 14:00 bạn không dùng thì không có cửa sổ nào chạy. Đến 14:00 khi bạn quay lại, cửa sổ mới bắt đầu từ 14:00 đến 19:00.

Hiểu điều này, bạn có thể chủ động: Chia công việc thành 2–3 phiên làm việc trong ngày — sáng, trưa, chiều — và dùng Claude suốt cả ngày mà không bị khóa giữa chừng.

Và đây là mẹo bạn nên áp dụng ngay: Với những công việc phức tạp, nhiều bước (nghiên cứu, viết proposal, phân tích dữ liệu), đừng cố nhét tất cả vào một phiên. Trước mỗi phiên, ghi xuống:

Cần làm những bước nào?
Input của mỗi bước là gì?
Output mong muốn của mỗi bước trông như thế nào?

Mỗi bước tương ứng với một câu lệnh bạn sẽ gửi cho Claude. Khi xong bước nào, tích hoàn thành bước đó. Khi quay lại phiên tiếp theo, bạn biết chính xác cần bắt đầu từ đâu — không cần nhớ lại, không bị lạc giữa chừng.

Tóm lại

Sáu nhóm kỹ thuật để dùng Claude cả ngày không hết lượt:

Cài Profile và Projects một lần — không phải lần nào cũng tự giới thiệu lại
Gộp câu lệnh, dùng nút chỉnh sửa thay vì gõ tin nhắn mới — ưu tiên tiếng Anh nếu được
Tóm tắt và chuyển sang đoạn chat mới khi hội thoại đã quá dài
Chỉ tải lên phần Claude thực sự cần đọc — không phải cả file
Chọn đúng model, tắt Web search / Extended thinking / Artifacts khi không cần
Chia công việc theo Rolling Window và lên kế hoạch từng bước trước mỗi phiên

Áp dụng thử từ ngày mai xem — chỉ cần làm đúng hai ba cái đầu là bạn sẽ thấy sự khác biệt ngay. Bạn có thêm mẹo nào hay hơn không? Chia sẻ bên dưới nhé!