Hướng Dẫn Tự Xây Dựng App Tạo Hình Ảnh Bằng Google Studio

Bạn muốn tạo app tạo hình ảnh bằng AI mà không cần biết lập trình? Google đã ra mắt Google AI Studio, cho phép bạn dễ dàng tạo ứng dụng web sinh hình ảnh chỉ với vài bước đơn giản.

Trong bài viết này, chúng ta sẽ cùng tìm hiểu cách xây dựng App tạo hình ảnh bằng Google Studio – công cụ mạnh mẽ dựa trên model Imagen 3 hoặc Gemini 1.5 Pro của Google.

Xây dựng App tạo hình ảnh bằng Google Studio

1. Chuẩn bị trước khi bắt đầu

✅ Tài khoản Google

Bạn cần có tài khoản Gmail để đăng nhập vào Google AI Studio.
Truy cập: https://aistudio.google.com

2. Tạo dự án trong Google AI Studio

✅ Vào mục Buil

Video hướng dẫn chi tiết cách tự xây dựng App tạo hình ảnh
000000000000000000000000

3. Viết prompt sinh hình ảnh

Trong phần Build, nhập lần lượt các prompt lênh bên dưới vào:

Prompt 1: Ứng dụng cơ bản với tính năng Tải lên và Tạo ảnh

Xây dựng một ứng dụng web cơ bản bằng ReactJS kết hợp TypeScript để hiển thị và tạo hình ảnh.
Ứng dụng có bố cục đơn giản, chia thành hai cột:

  • Bên trái: khu vực nhập dữ liệu

  • Bên phải: khu vực xem trước kết quả.

Tính năng chính trong phiên bản đầu tiên:

  • Bên trái:

    • Khu vực tải ảnh (nút bấm hoặc kéo-thả) cho phép người dùng tải lên một hình ảnh (người mẫu, nhân vật hoặc người thật).

    • Hỗ trợ định dạng JPGPNG.

    • Nút “Generate Images” (Tạo ảnh) nằm bên dưới khu vực tải lên.

  • Bên phải:

    • Khu vực xem trước hiển thị hình ảnh sau khi tạo.

  • Tích hợp API Gemini để xử lý ảnh đã tải lên và tạo ra phiên bản mới (ví dụ: ảnh phong cách doanh nhân hoặc phong cách dạ hội trên hình gốc).

  • Giao diện người dùng (UI):

    • Thiết kế tối giản, hiện đại, tương thích với cả máy tính và di động.

    • Hiển thị biểu tượng tải (loading spinner) trong quá trình tạo ảnh.

  • Bảo mật:

    • Thân thiện, dễ dùng, không lưu trữ ảnh vĩnh viễn trên máy chủ.

Prompt 2: Thêm tính năng Xóa phông nền

Cập nhật ứng dụng tạo ảnh hiện có bằng ReactJS + TypeScript.
Giữ nguyên toàn bộ các tính năng trước đó (tải ảnh, nút Tạo ảnh, bố cục hai cột, tích hợp Gemini).

Tính năng mới:

  • Bên trái, bên dưới khu vực tải ảnh: thêm nút “Background Removal” (Xóa phông nền).

  • Khi nhấn, sử dụng công cụ AI (tích hợp Gemini hoặc thư viện xử lý ảnh đơn giản) để tự động loại bỏ phông nền của ảnh tải lên, và hiển thị ảnh đã xử lý trong phần xem trước bên trái hoặc cập nhật lại ảnh tải lên.

  • Sau khi xóa phông, ảnh kết quả sẽ được dùng làm đầu vào để tạo ảnh mới.

Prompt 3: Thêm thanh trượt Reference Influence

Cập nhật ứng dụng ReactJS + TypeScript hiện có, giữ lại toàn bộ tính năng cũ (tải ảnh, xóa phông, nút tạo ảnh, bố cục hai cột).

Tính năng mới:

  • Bên trái, bên dưới nút “Background Removal”: thêm thanh trượt (slider) có nhãn “Reference Influence” (Ảnh hưởng từ ảnh gốc), phạm vi từ 0% đến 100%.

  • Thanh này điều chỉnh mức độ ảnh hưởng của ảnh tham chiếu khi tạo ảnh mới (0% = bỏ qua ảnh gốc, 100% = giữ nguyên khuôn mặt gốc và chỉ làm cho trẻ hơn 3 tuổi so với ảnh gốc).

Gửi giá trị thanh trượt vào API Gemini để kiểm soát mức độ hòa trộn phong cách.

Prompt 4: Thêm ô nhập Mô tả Nhân vật

Cập nhật ứng dụng ReactJS + TypeScript, giữ lại tất cả các tính năng (tải ảnh, xóa phông, thanh trượt Reference Influence, nút Generate, bố cục hai cột).

Tính năng mới:

  • Bên trái, bên dưới thanh trượt: thêm ô nhập văn bản “Description for Character” (Mô tả nhân vật), nơi người dùng có thể nhập mô tả chi tiết (ví dụ: “một chiến binh trẻ tóc đỏ”).

  • Sử dụng phần mô tả này để tinh chỉnh nhân vật trong quá trình tạo ảnh bằng API Gemini. Lưu ý vẫn giữ nguyên khuôn mặt gốc

Triển khai:

  • Đưa ứng dụng lên web (deploy).

Cung cấp toàn bộ mã nguồn hoàn chỉnh.

Prompt 5: Thêm ô nhập Bối cảnh & Hành động

Cập nhật ứng dụng ReactJS + TypeScript, giữ nguyên toàn bộ tính năng (tải ảnh, xóa phông, Reference Influence, Mô tả nhân vật, nút Generate, bố cục hai cột).

Tính năng mới:

  • Bên trái, bên dưới “Description for Character”: thêm ô nhập “Scene & Action” (Bối cảnh & Hành động) để người dùng mô tả cảnh và hành động (ví dụ: “đứng trong rừng, chiến đấu với rồng”).

Kết hợp nội dung này với các phần nhập khác trong prompt gửi tới API Gemini để tạo ảnh. Vẫn đảm bảo 100% giữ nguyên khuôn mặt gốc

Prompt 6: Thêm lựa chọn Chất lượng đầu ra

Cập nhật ứng dụng ReactJS + TypeScript, giữ nguyên toàn bộ các tính năng (tải ảnh, xóa phông, Reference Influence, Mô tả nhân vật, Bối cảnh & Hành động, nút Generate, bố cục hai cột).

Tính năng mới:

  • Bên trái, bên dưới ô “Scene & Action”: thêm menu chọn “Output Quality” (Chất lượng ảnh xuất ra) với các tùy chọn:

    • “Standard (720p)”

    • “High (2K–4K)”

  • Sử dụng lựa chọn này để điều chỉnh tham số API Gemini (độ phân giải hoặc mức chi tiết của ảnh tạo ra).


Prompt 7: Thêm nút tải ảnh đã tạo

Cập nhật ứng dụng ReactJS + TypeScript, giữ nguyên toàn bộ các tính năng và bố cục hiện có (tải ảnh, xóa phông, Reference Influence, Mô tả nhân vật, Bối cảnh & Hành động, Output Quality, nút Generate, bố cục hai cột).

Tính năng mới:
Sau khi ảnh đã được tạo thành công (có kết quả hiển thị ở cột phải), thêm nút “Download Image” (Tải ảnh) để người dùng có thể lưu ảnh đã tạo về máy.

Vị trí và chức năng cụ thể:

  • Nút nằm bên cạnh nút Generate, trong cùng một hàng (ở dưới phần nhập thông tin).

  • Khi ảnh đã được tạo xong, nút “Download Image” sẽ sáng lên (có thể bấm).

  • Khi chưa có ảnh, nút ở trạng thái mờ hoặc không thể bấm.

  • Khi người dùng bấm “Download Image”, ứng dụng tự động tải ảnh đang hiển thị (kết quả đã tạo) về máy với tên file mặc định:
    generated_image.png

  • Không thay đổi bố cục, chỉ bổ sung chức năng tải ảnh.

Kết luận

Với Google AI Studio, bạn hoàn toàn có thể tự tạo App tạo hình ảnh AI chuyên nghiệp mà không cần lập trình.
Chỉ vài phút thiết lập, bạn đã có ngay một công cụ tạo hình ảnh độc đáo để phục vụ học tập, sáng tạo hoặc kinh doanh nội dung.

Nguyễn Xuân Ngọc

Đăng nhận xét

Tin liên quan

    -->