Hướng dẫn tạo Giọng nói từ text trên Google AI Studio

Công nghệ chuyển văn bản thành giọng nói (text-to-speech, TTS) đang ngày càng trở nên phổ biến, đặc biệt trong giáo dục, giải trí và sáng tạo nội dung. Với tạo speech từ text trên Google AI Studio, bạn có thể dễ dàng tạo ra các đoạn hội thoại chân thực mà không tốn phí.

📢 Tham gia kênh Telegram của AnonyViet

👉 Vào Telegram AnonyViet

Cập nhật bài mới, tools hay và thủ thuật IT nhanh nhất

Google AI Studio là gì?

Google AI Studio là một nền tảng do Google phát triển, cho phép người dùng tận dụng các công cụ trí tuệ nhân tạo tiên tiến để tạo nội dung, bao gồm cả việc tạo speech từ text trên Google AI Studio. Điểm đặc biệt? Tính năng này hiện hoàn toàn miễn phí, giúp giáo viên, nhà sáng tạo nội dung, hay bất kỳ ai muốn thử sức với công nghệ TTS đều có thể tiếp cận dễ dàng.

Các bài viết liên quan

Không giống các nền tảng trả phí như ElevenLabs hay OpenAI TTS, Google AI Studio mang đến giải pháp đơn giản, trực quan, và hiệu quả. Bạn chỉ cần một vài thao tác là có thể biến văn bản thành âm thanh sống động, phù hợp cho các bài giảng tiếng Anh, podcast, hoặc video sáng tạo.

Tại sao nên sử dụng Google AI Studio để tạo speech từ text?

Trước khi đi vào hướng dẫn, hãy điểm qua những lý do khiến tạo speech từ text trên Google AI Studio trở thành lựa chọn hàng đầu:

Không cần trả phí hay đăng ký gói cao cấp.
Giao diện thân thiện, phù hợp cho cả người mới bắt đầu.
Hỗ trợ nhiều giọng đọc khác nhau, từ nam đến nữ, với phong cách tự nhiên.
Cho phép tạo hội thoại một hoặc nhiều người nói.
Sử dụng mô hình Gemini 2.5 Flash Preview TTS, đảm bảo chất lượng âm thanh cao.

Tại sao nên sử dụng Google AI Studio để tạo speech từ text?

Hướng dẫn từng bước tạo speech từ text trên Google AI Studio

Dưới đây là các bước chi tiết để bạn có thể tạo speech từ text trên Google AI Studio một cách dễ dàng.

Bước 1: Đầu tiên, hãy truy cập vào Google AI Studio bằng cách tìm kiếm cụm từ “Google AI Studio” trên Google hoặc sử dụng nhấn ngay TẠI ĐÂY. Sau khi đăng nhập bằng tài khoản Google, bạn sẽ thấy giao diện chính với thanh công cụ bên trái.

Bước 2: Tại thanh bên trái, nhấp vào Generate media.

Trong danh sách các tùy chọn, chọn Gemini speech generation.

Bước 3: Trong phần Run settings, chọn mô hình Gemini 2.5 Flash Preview TTS. Tiếp theo, ở mục Mode, bạn có thể chọn:

Single speaker: Phù hợp cho bài giảng hoặc nội dung chỉ cần một giọng nói.
Multiple speakers: Lý tưởng để tạo hội thoại giữa nhiều nhân vật.

Bước 4: Google AI Studio cung cấp nhiều giọng đọc khác nhau. Hãy thử nghiệm để tìm giọng phù hợp với nội dung của bạn nhé.

Bước 5: Có hai cách để nhập nội dung hội thoại:

Cách 1: Sử dụng Raw structure

Nhập văn bản theo định dạng mẫu: Speaker 1: [nội dung], Speaker 2: [nội dung].
Mẹo: Bạn có thể sao chép mẫu có sẵn, sau đó nhờ công cụ AI như ChatGPT chỉnh sửa nội dung theo đúng định dạng để tiết kiệm thời gian.

Cách 2: Sử dụng Script builder

Trong phần Style instructions, nhập mô tả phong cách hội thoại (bằng tiếng Anh, ví dụ: “formal”, “casual”, hoặc “dramatic”). Thêm từng câu thoại cho các nhân vật bằng cách nhấp vào Add dialog. Cách này phù hợp nếu bạn muốn xây dựng hội thoại từng bước.

Bước 6: Sau khi nhập nội dung, nhấn nút Run để Google AI Studio xử lý và tạo file âm thanh.

Khi hoàn tất, bạn có thể nghe thử trực tiếp hoặc nhấn vào biểu tượng ba chấm, chọn Download để tải file về máy.

Kết luận

Tạo speech từ text trên Google AI Studio là một công cụ tuyệt vời, vừa miễn phí, vừa dễ sử dụng. Với vài bước đơn giản, bạn có thể tạo ra những đoạn hội thoại chất lượng cao, phục vụ cho nhiều mục đích từ giáo dục đến giải trí. Hãy thử ngay hôm nay nhé!

Câu hỏi thường gặp

Tôi có cần trả phí để sử dụng Google AI Studio tạo giọng nói từ văn bản không?

Không, Google AI Studio hiện tại cung cấp tính năng tạo giọng nói từ văn bản hoàn toàn miễn phí.

Google AI Studio hỗ trợ bao nhiêu giọng đọc và có thể tùy chỉnh giọng điệu không?

Google AI Studio hỗ trợ nhiều giọng đọc khác nhau, cả nam và nữ, với nhiều phong cách. Bạn có thể tùy chỉnh giọng điệu thông qua các tùy chọn trong phần cài đặt.