Bản vẽ chi tiết luồng hoạt động & Kiến trúc tối ưu Token (Cập nhật T4/2026)
Lead Search Tool là trung tâm truy xuất dữ liệu sản phẩm của Canifa AI Stylist. Sau đợt tái cấu trúc, hệ thống đã loại bỏ hoàn toàn OpenAI Embedding, thay thế bằng cơ chế Cascading Search 7 tầng (NGRAMBF + BITMAP Tags), mang lại tốc độ truy vấn < 300ms. Đồng thời, cấu trúc dữ liệu trả về được tối ưu hóa để giảm thiểu Token tiêu thụ cho LLM.
Thay vì trả về 15-20 sản phẩm chi tiết (gây tràn Context Window), hệ thống hiện tại sử dụng chiến lược: "Lấy ít sản phẩm chính, móc nhiều sản phẩm gợi ý".
Kết quả: LLM vẫn có 3 lựa chọn chính và 15 lựa chọn phụ để tư vấn, nhưng số lượng Token giảm xuống 75%.
ai_description và ai_matches (lý do phối đồ), cung cấp 'bộ não' thời trang cho LLM chốt sale.Dưới đây là cấu trúc minh hoạ cho 1 sản phẩm chính sau khi được format gọn nhẹ:
{
"sku": "8TP24S001-SB060",
"name": "Áo polo nam phom regular",
"price": 349000,
"in_stock": true,
"stock": [{"size": "M", "qty": 10}, {"size": "L", "qty": 14}],
"ai_matches": {
"phoi_voi": ["Quần khaki nam"],
"ly_do": "Màu áo hợp quần khaki tạo vẻ thanh lịch..."
},
"suggest_items": [
{"sku": "8QK24S002", "name": "Quần khaki nam", "price": 450000}
],
"similar_items": [
{"sku": "8TP24S003", "name": "Áo polo sọc", "price": 399000}
]
}