Với những bạn đang tập tành hoặc trong quá trình học hỏi để làm chủ hệ thống n8n, hẳn có những bạn đang loay hoay trong việc tìm kiếm một workflow tạo ảnh miễn phí. Toàn cũng đã từng như vậy khi mới bắt đầu! Hôm nay Toàn muốn chia sẻ với các bạn một workflow tự động hóa trên n8n giúp bạn xây dựng con bot Telegram cá nhân, có khả năng tạo ảnh hoàn toàn miễn phí từ hai mô hình AI là Google Gemini và Pollinations.ai.
Mục lục
Bài viết này không chỉ đơn thuần là chia sẻ một workflow có sẵn. Toàn sẽ hướng dẫn chi tiết từng bước hoạt động của nó, từ cách bot tiếp nhận yêu cầu, cách “bộ não” AI Agent phân tích và xử lý thông tin, cho đến cách nó ra lệnh cho các mô hình tạo ảnh và gửi kết quả về cho bạn. Qua đó, bạn không chỉ có được một công cụ hữu ích mà còn hiểu sâu hơn về tư duy xây dựng hệ thống tự động hóa thông minh. Hãy cùng Toàn bắt đầu khám phá nhé!
I. TỔNG QUAN VỀ WORKFLOW VÀ CÁC CÔNG NGHỆ SỬ DỤNG
Trước khi đi vào chi tiết, chúng ta hãy cùng nhìn qua bức tranh toàn cảnh của hệ thống này. Mục tiêu của workflow là tạo ra một “trợ lý AI” ngay trên ứng dụng Telegram quen thuộc. Bạn chỉ cần gửi một tin nhắn mô tả ý tưởng, bot sẽ tự động tạo ra hai phiên bản hình ảnh từ hai nguồn khác nhau và gửi lại cho bạn. Đơn giản, tiện lợi và hoàn toàn miễn phí.
Để làm được điều này, Toàn đã kết hợp sức mạnh của các công cụ sau:
- Telegram: Đóng vai trò là giao diện giao tiếp (interface). Thay vì phải truy cập một trang web hay ứng dụng phức tạp, bạn có thể “ra lệnh” cho bot ngay trong cuộc trò chuyện hàng ngày.
- n8n: Là trái tim của hệ thống, một nền tảng tự động hóa mã nguồn mở. Toàn bộ logic xử lý, từ việc nhận tin nhắn, gọi AI, đến gửi ảnh đều được xây dựng và kết nối tại đây.
Xem thêm về việc lựa chọn các nền tảng tự động hóa tại: so sánh giữa Make, n8n và Google Apps Script của mình nhé.
- Google Gemini: Toàn sử dụng API (Application Programming Interface – Giao diện lập trình ứng dụng) của Gemini, cụ thể là mô hình có khả năng tạo ảnh, để tạo ra những bức ảnh chất lượng cao và chân thực. Đây là một trong những mô hình tạo ảnh miễn phí mạnh mẽ nhất hiện nay.
- Pollinations.ai: Một dự án AI mã nguồn mở tuyệt vời cung cấp khả năng tạo ảnh thông qua API. Việc kết hợp Pollinations mang lại sự đa dạng trong phong cách hình ảnh, cho bạn thêm nhiều lựa chọn sáng tạo.
II. CÁCH HOẠT ĐỘNG CHI TIẾT CỦA WORKFLOW
Bây giờ, chúng ta sẽ đi sâu vào từng node trong workflow để hiểu rõ cách chúng phối hợp với nhau. Toàn đã thiết kế workflow này theo 4 bước logic chính, đảm bảo sự mạch lạc và dễ hiểu.
![[nguyenthieutoan.com] Sơ đồ toàn cảnh workflow n8n tạo ảnh miễn phí qua Telegram](https://nguyenthieutoan.com/wp-content/uploads/2025/08/nguyenthieutoan.com-Xay-dung-tro-ly-tao-hinh-anh-voi-Telegram-Gemini-va-Pollinations.webp)
Toàn cảnh workflow n8n tự động tạo ảnh miễn phí qua Telegram.
Bước 1: Tiếp nhận yêu cầu từ người dùng qua Telegram
Mọi thứ bắt đầu với node Telegram Trigger. Node này sẽ “lắng nghe” tất cả các tin nhắn được gửi đến con bot của bạn. Khi có một tin nhắn mới, workflow sẽ được kích hoạt và toàn bộ nội dung tin nhắn, thông tin người gửi (như Chat ID) sẽ được chuyển tiếp đến các bước xử lý tiếp theo. Đây là cửa ngõ đầu vào của toàn bộ hệ thống.
Bước 2: AI Agent – “Bộ não” xử lý yêu cầu
Đây chính là phần thông minh và thú vị nhất của workflow. Thay vì chỉ đơn thuần lấy văn bản của người dùng và chuyển thẳng đến API tạo ảnh, Toàn đã sử dụng một AI Agent. Con Agent này có nhiệm vụ đọc và hiểu ý định của người dùng.
- Nếu người dùng chỉ chào hỏi hoặc nhắn một câu xã giao, AI Agent sẽ nhận biết và chỉ soạn một câu trả lời thân thiện.
- Nếu người dùng đưa ra một yêu cầu tạo ảnh, AI Agent sẽ biến đổi yêu cầu đó thành một câu lệnh (prompt) chi tiết, chuẩn hóa theo cấu trúc mà các mô hình tạo ảnh có thể hiểu và cho ra kết quả tốt nhất.
Phân tích prompt hệ thống (System Prompt)
Để AI Agent có thể hoạt động chính xác, Toàn đã cung cấp cho nó một “bản mô tả công việc” rất chi tiết trong phần System Prompt. Bản mô tả này yêu cầu AI đóng vai một chuyên gia tạo prompt tên là Jennix, phục vụ cho “sếp Toàn”. Nó phải tuân thủ một cấu trúc prompt tiêu chuẩn, bao gồm các thành phần như: Bối cảnh chính, Yếu tố chính, Ánh sáng & Không khí, Thông số kỹ thuật… Hơn nữa, đầu ra của AI Agent luôn phải ở định dạng JSON (JavaScript Object Notation – một định dạng trao đổi dữ liệu gọn nhẹ) có cấu trúc rõ ràng, bao gồm 3 trường: `prompt`, `message`, và `is_message`.
- prompt: Chứa câu lệnh tạo ảnh đã được tối ưu.
- message: Chứa tin nhắn phản hồi thân thiện để gửi cho người dùng (ví dụ: “Dạ sếp Toàn ơi em đang tạo ảnh cho sếp rồi ạ…”).
- is_message: Một biến logic (`true` hoặc `false`) để xác định xem tin nhắn của người dùng có phải là yêu cầu tạo ảnh hay không.
Cách làm này giúp hệ thống trở nên thông minh và linh hoạt hơn rất nhiều.
Xem thêm về cách chọn Model, xây dựng prompt hiệu quả cho AI Agent n8n tại: hướng dẫn làm chủ AI Agent trong n8n của mình.
![[nguyenthieutoan.com] Cấu hình System Prompt cho AI Agent trong n8n](https://nguyenthieutoan.com/wp-content/uploads/2025/08/nguyenthieutoan.com-Xay-dung-tro-ly-tao-hinh-anh-voi-Telegram-Gemini-va-Pollinations-2.webp)
Giao diện cấu hình System Prompt chi tiết cho AI Agent Jennix trong n8n.
Bước trung gian: Phản hồi người dùng và kiểm tra điều kiện
Sau khi AI Agent xử lý xong, workflow sẽ đi đến node IF. Node này sẽ kiểm tra giá trị của biến `is_message` từ bước trước.
- Nếu `is_message` là `true` (người dùng chỉ nhắn tin xã giao), workflow sẽ chỉ gửi lại tin nhắn phản hồi do AI Agent tạo ra và kết thúc.
- Nếu `is_message` là `false` (người dùng yêu cầu tạo ảnh), workflow sẽ đi theo nhánh còn lại. Nó sẽ gửi tin nhắn xác nhận (“em đang tạo ảnh…”) cho người dùng để họ biết yêu cầu đã được xử lý, sau đó tiếp tục quá trình tạo ảnh.
Bước 3: Tạo ảnh đồng thời với Gemini và Pollinations.ai
Đây là lúc điều kỳ diệu xảy ra. Prompt chi tiết do AI Agent tạo ra ở Bước 2 sẽ được chuyển đến hai nhánh xử lý song song:
Tạo ảnh với Google Gemini
Một nhánh sẽ sử dụng node Google Gemini. Node này kết nối trực tiếp với API của Google, gửi prompt đi và nhận về file hình ảnh do Gemini tạo ra. Quá trình này thường cho ra những bức ảnh có độ chân thực và chi tiết cao.
Tạo ảnh với Pollinations.ai
Nhánh còn lại sử dụng node HTTP Request để gửi yêu cầu đến API của Pollinations.ai. Toàn cũng đính kèm các tham số như chiều rộng, chiều cao và prompt. Pollinations thường tạo ra những hình ảnh mang phong cách nghệ thuật và độc đáo hơn.
Lưu ý: Do Pollinations.ai là một dự án mã nguồn mở và miễn phí, đôi khi API có thể không ổn định hoặc có sự thay đổi. Nếu gặp lỗi ở nhánh này, bạn hãy kiên nhẫn thử lại hoặc kiểm tra tài liệu trên trang chủ của họ nhé.
Bước 4: Gửi lại thành quả cho người dùng
Cuối cùng, khi cả hai mô hình đã tạo ảnh xong, hai node Telegram cuối cùng sẽ được kích hoạt. Mỗi node chịu trách nhiệm lấy file ảnh (dưới dạng dữ liệu nhị phân – binary data (dạng dữ liệu máy tính có thể đọc trực tiếp)) từ một nhánh và gửi nó trực tiếp vào cuộc trò chuyện với người dùng. Kết quả là bạn sẽ nhận được hai bức ảnh từ bot, tương ứng với hai phong cách khác nhau cho cùng một ý tưởng ban đầu.
III. HƯỚNG DẪN CÀI ĐẶT VÀ SỬ DỤNG WORKFLOW
Bây giờ là phần các bạn mong chờ nhất. Để có thể sử dụng workflow này, bạn chỉ cần làm theo các bước đơn giản sau:
1. Yêu cầu cần chuẩn bị
- Một tài khoản n8n: Bạn có thể dùng bản cloud hoặc tự host.
- Token của Telegram Bot: Nếu chưa có bot, bạn hãy trò chuyện với BotFather trên Telegram để tạo một con bot mới và lấy token.
- API Key của Google Gemini: Bạn có thể lấy API Key miễn phí từ Google AI Studio.
Xem thêm về cách lấy và sử dụng API tại: hướng dẫn về AI API của Toàn.
2. Tải và import workflow
Toàn đã đính kèm file JSON của workflow này. Bạn chỉ cần tải về máy tính.
[LINK TẢI WORKFLOW JSON TẠI ĐÂY]
Sau đó, trong giao diện n8n, bạn chọn Import from File và tải file JSON vừa rồi lên.
3. Cấu hình các thông tin xác thực (Credentials)
Sau khi import, bạn cần kết nối các tài khoản của mình vào workflow:
- Telegram: Mở các node Telegram (Trigger, Send Message, Send Photo), trong phần Credentials (thông tin xác thực), hãy kết nối tài khoản Telegram bằng Token bạn đã lấy từ BotFather.
- Gemini: Mở node Model xử lý chính và node Gemini tạo ảnh. Trong phần Credentials, hãy kết nối tài khoản Google Gemini bằng API Key của bạn.
4. Kích hoạt và sử dụng
Sau khi đã cấu hình xong, hãy lưu lại và nhấn nút Activate để kích hoạt workflow. Bây giờ, bạn có thể mở ứng dụng Telegram, tìm đến con bot của mình và bắt đầu “ra lệnh” để tạo những bức ảnh đầu tiên. Hãy thử với những ý tưởng thật sáng tạo nhé!
IV. KẾT LUẬN
Vậy là Toàn đã chia sẻ xong với các bạn một workflow không chỉ hữu ích mà còn rất thú vị, giúp tự động hóa việc tạo ảnh bằng AI một cách chuyên nghiệp. Bằng cách kết hợp sự tiện lợi của Telegram và sức mạnh của n8n, Gemini, Pollinations, bạn đã có trong tay một công cụ sáng tạo không giới hạn và hoàn toàn miễn phí. Hơn thế nữa, qua việc phân tích cấu trúc của workflow, đặc biệt là vai trò của AI Agent, Toàn hy vọng bạn đã có thêm những kiến thức và ý tưởng để tự mình xây dựng những hệ thống tự động hóa thông minh hơn trong tương lai.
Hãy thử nghiệm, tùy biến workflow này theo ý muốn của bạn, ví dụ như thêm các mô hình AI khác hoặc tích hợp thêm các tính năng mới. Khả năng là vô tận. Nếu bạn thấy bài viết này hữu ích, đừng ngần ngại chia sẻ nó cho bạn bè và đồng nghiệp. Và đừng quên đăng ký nhận bản tin từ website của Toàn để không bỏ lỡ những kiến thức, thủ thuật và workflow độc quyền khác về AI và Tối ưu Vận hành nhé!