Sơ đồ hoạt động
Cách chatbot AI xử lý khi khách hàng gửi tin nhắn — từ lúc nhận câu hỏi đến khi trả lời
📥 Đầu vào — Nhận tin nhắn từ khách
Khách gửi tin nhắn qua cửa sổ chat trên web hoặc app. Hệ thống nhận được cả chữ lẫn ảnh — ví dụ khách chụp ảnh một chiếc áo và hỏi "có sản phẩm nào giống thế này không?", AI sẽ nhận diện được.
Hệ thống nhận diện khách bằng 2 cách song song:
• Khách đã đăng nhập → biết chính xác là ai (theo mã khách hàng)
• Khách vãng lai → nhận diện qua thiết bị đang dùng
🌐 Máy chủ tiếp nhận — Xử lý song song
Tin nhắn của khách được gửi đến máy chủ. Máy chủ chạy theo mô hình không chờ đợi: khi đang chờ AI suy nghĩ cho khách A (mất 2-20 giây), server vẫn tiếp tục nhận tin của khách B, C, D... không bị tắc nghẽn.
Máy chủ chạy 4 tiến trình song song, mỗi tiến trình phục vụ hàng trăm khách cùng lúc.
⚡ Kiểm tra câu hỏi trùng Tiết kiệm 30-40% chi phí
Trước khi gọi AI (tốn tiền + mất 15-20 giây), hệ thống kiểm tra: "Câu hỏi này đã có ai hỏi trước đó chưa?"
• Đã từng hỏi rồi → Trả câu trả lời cũ ngay lập tức, không cần gọi AI lại
• Chưa từng hỏi → Tiếp tục gọi AI xử lý bình thường
Câu trả lời cũ được lưu trong 1 giờ. Những câu hỏi mang tính cá nhân (VD: "đơn hàng của tôi đâu?") sẽ không lưu vì mỗi khách khác nhau.
💾 Nhớ lại khách hàng là ai
Trước khi AI trả lời, hệ thống tìm lại 2 loại thông tin về khách:
1. Trí nhớ ngắn hạn — 10 tin nhắn gần nhất trong cuộc hội thoại hiện tại. Giúp AI nhớ đang nói chuyện về chủ đề gì (VD: khách đang hỏi về áo khoác → AI không nhảy sang đề xuất áo polo).
2. Trí nhớ dài hạn (Hồ sơ khách) — Bản tóm tắt ngắn gọn: giới tính, size hay mặc, phong cách yêu thích, sản phẩm đã xem. Được AI tự động cập nhật sau mỗi cuộc hội thoại.
Cả hai được đưa cho AI trước khi suy nghĩ, giúp AI tư vấn cá nhân hóa — giống nhân viên bán hàng nhớ khách quen.
🤖 AI suy nghĩ — Vòng lặp Agent ⭐ Trái tim hệ thống
Đây là phần quan trọng nhất của toàn bộ hệ thống. AI đóng vai trò một tư vấn viên thông minh — tự đọc câu hỏi, tự phân tích ý định, tự quyết định cần tra gì, và tra bao nhiêu lần cho đến khi đủ thông tin trả lời.
🧠 Tại sao cần AI làm việc này? Tư vấn viên con người đắt, không scale — và catalog Canifa có hàng nghìn sản phẩm, không ai nhớ hết. Bot AI đứng trước, tự phân tích câu hỏi và tra cứu thay.
⚠️ Thực trạng: Data sản phẩm nghèo
Mô tả sản phẩm trong DB Canifa chỉ ghi tên ngắn gọn ("Áo phông nữ", "Quần soóc nam"). Không có phong cách, chất liệu, dáng, dịp mặc. Bot bắt buộc phải dùng các trường có sẵn (tên, màu, giá, giới tính) để sinh query.
🔍 Hybrid Search — 2 cách tìm cùng lúc
Bot dùng 2 kỹ thuật song song, mỗi cách bù yếu điểm của cách kia:
| Kỹ thuật | Cách hoạt động | ✅ Mạnh | ❌ Yếu |
|---|---|---|---|
| Semantic Search | AI viết mô tả → chuyển thành vector → so sánh với tất cả SP → lấy top 200 giống nhất | Hiểu ý nghĩa mơ hồ: "xinh xinh", "đi chơi" | Có thể sai màu, sai giá |
| SQL Filter | AI điền filter → WHERE color='trắng'
AND gender='men' AND price≤500K |
Lọc chính xác 100% màu/giá/giới tính | Không hiểu "thanh lịch", "tối giản" |
→ Kết hợp: Semantic tìm top 200 giống ý → SQL lọc chính xác (đúng màu, giá, giới tính) → Kết quả vừa đúng ý vừa chính xác
📋 Ví dụ: AI điền query như nào?
📌 Khách nói tự nhiên, viết tắt, dùng từ đồng nghĩa ("áo thun"→"áo phông", "quần bò"→"quần jean") — AI vẫn hiểu và tự điền query chính xác.
⚙️ Sau khi phân tích xong, AI làm gì tiếp?
AI liên tục lặp qua 3 bước Suy nghĩ → Quyết định → Hành động cho đến khi đủ thông tin:
Bước 1: Đọc + Phân tích — AI đọc câu hỏi, kết hợp với trí nhớ ngắn hạn + dài hạn, phân tích ra các tiêu chí tìm kiếm (như ví dụ trên).
Bước 2: Quyết định — AI tự hỏi: "Cần tra thêm thông tin gì không?"
• Cần → Gọi công cụ tra cứu phù hợp
• Đủ rồi → Viết câu trả lời cho khách
Bước 3: Tra cứu — AI có 6 "công cụ" để tra:
Lặp lại nếu cần — VD: Khách hỏi "áo polo xanh size L" → AI phân tích (loại=polo, màu=xanh, size=L) → gọi tìm sản phẩm → check tồn kho → hết hàng size L → tự tìm sản phẩm thay thế → check tồn kho lần 2. Trung bình 2-3 lần tra/câu hỏi, tối đa 5 vòng.
📡 Hiển thị câu trả lời dần dần (Streaming)
Thay vì đợi AI viết xong toàn bộ rồi mới hiện, câu trả lời được hiện ra từng chữ — giống cách ChatGPT hoạt động.
Khách thấy chữ bắt đầu xuất hiện sau 2-3 giây. Ngoài text, hệ thống cũng gửi kèm card sản phẩm (hình ảnh, giá, link mua, tồn kho) nếu AI gợi ý sản phẩm.
⚙️ Ghi nhớ và xử lý ngầm Chạy sau khi khách đã nhận câu trả lời
Sau khi khách đã nhận được câu trả lời, hệ thống âm thầm làm thêm 4 việc (song song, không bắt khách đợi):
1. 💾 Lưu lịch sử — Ghi lại cuộc hội thoại để lần sau AI nhớ (trí nhớ ngắn hạn ở Step 4)
2. 🧠 Cập nhật hồ sơ khách — AI dùng riêng 1 lần suy nghĩ để tóm tắt thông tin mới về khách (size, sở thích...) → bổ sung vào trí nhớ dài hạn
3. ⚡ Lưu câu trả lời — Nhớ lại để nếu khách khác hỏi giống thì trả nhanh hơn (chính là bộ nhớ tạm ở Step 3)
4. 📊 Ghi log theo dõi — Ghi lại thời gian trả lời, chi phí, công cụ đã dùng → team dùng để review chất lượng
✅ Khách nhận câu trả lời
Khách nhận câu trả lời dạng text có định dạng đẹp, kèm card sản phẩm nếu AI gợi ý: ảnh, tên, giá, link mua, trạng thái còn hàng (thông tin tồn kho được lấy lúc AI tra cứu ở Step 5).
Mỗi câu trả lời kèm nút 👍 👎 để khách đánh giá → team dùng để review và cải thiện chất lượng.
🛠️ 6 công cụ — Chia 2 nhóm theo cách lưu nhớ
Nhóm tra cứu vs Nhóm ghi nhận
Nhóm tra cứu (5 công cụ) — Tìm sản phẩm, khuyến mãi, tồn kho, cửa hàng, kiến thức. Kết quả được nhớ lại trong 1 giờ: cùng câu "áo polo nam" hỏi lần 2 sẽ trả kết quả cũ thay vì tra lại từ đầu.
Nhóm ghi nhận (1 công cụ) — Ghi lại SĐT/tên khách khi khách muốn được tư vấn viên liên hệ. Mỗi lần ghi là thông tin mới nên không nhớ lại.