Công nghệ chuyển văn bản thành giọng nói (text-to-speech, TTS) đang ngày càng trở nên phổ biến, đặc biệt trong giáo dục, giải trí và sáng tạo nội dung. Với tạo speech từ text trên Google AI Studio, bạn có thể dễ dàng tạo ra các đoạn hội thoại chân thực mà không tốn phí.
Tham gia kênh Telegram của AnonyViet 👉 Link 👈 |
Google AI Studio là gì?
Google AI Studio là một nền tảng do Google phát triển, cho phép người dùng tận dụng các công cụ trí tuệ nhân tạo tiên tiến để tạo nội dung, bao gồm cả việc tạo speech từ text trên Google AI Studio. Điểm đặc biệt? Tính năng này hiện hoàn toàn miễn phí, giúp giáo viên, nhà sáng tạo nội dung, hay bất kỳ ai muốn thử sức với công nghệ TTS đều có thể tiếp cận dễ dàng.
Không giống các nền tảng trả phí như ElevenLabs hay OpenAI TTS, Google AI Studio mang đến giải pháp đơn giản, trực quan, và hiệu quả. Bạn chỉ cần một vài thao tác là có thể biến văn bản thành âm thanh sống động, phù hợp cho các bài giảng tiếng Anh, podcast, hoặc video sáng tạo.

Tại sao nên sử dụng Google AI Studio để tạo speech từ text?
Trước khi đi vào hướng dẫn, hãy điểm qua những lý do khiến tạo speech từ text trên Google AI Studio trở thành lựa chọn hàng đầu:
- Không cần trả phí hay đăng ký gói cao cấp.
- Giao diện thân thiện, phù hợp cho cả người mới bắt đầu.
- Hỗ trợ nhiều giọng đọc khác nhau, từ nam đến nữ, với phong cách tự nhiên.
- Cho phép tạo hội thoại một hoặc nhiều người nói.
- Sử dụng mô hình Gemini 2.5 Flash Preview TTS, đảm bảo chất lượng âm thanh cao.

Hướng dẫn từng bước tạo speech từ text trên Google AI Studio
Dưới đây là các bước chi tiết để bạn có thể tạo speech từ text trên Google AI Studio một cách dễ dàng.
Bước 1: Đầu tiên, hãy truy cập vào Google AI Studio bằng cách tìm kiếm cụm từ “Google AI Studio” trên Google hoặc sử dụng nhấn ngay TẠI ĐÂY. Sau khi đăng nhập bằng tài khoản Google, bạn sẽ thấy giao diện chính với thanh công cụ bên trái.
Bước 2: Tại thanh bên trái, nhấp vào Generate media.

Trong danh sách các tùy chọn, chọn Gemini speech generation.

Bước 3: Trong phần Run settings, chọn mô hình Gemini 2.5 Flash Preview TTS. Tiếp theo, ở mục Mode, bạn có thể chọn:
- Single speaker: Phù hợp cho bài giảng hoặc nội dung chỉ cần một giọng nói.
- Multiple speakers: Lý tưởng để tạo hội thoại giữa nhiều nhân vật.

Bước 4: Google AI Studio cung cấp nhiều giọng đọc khác nhau. Hãy thử nghiệm để tìm giọng phù hợp với nội dung của bạn nhé.
Bước 5: Có hai cách để nhập nội dung hội thoại:
Cách 1: Sử dụng Raw structure
Nhập văn bản theo định dạng mẫu: Speaker 1: [nội dung], Speaker 2: [nội dung].
Mẹo: Bạn có thể sao chép mẫu có sẵn, sau đó nhờ công cụ AI như ChatGPT chỉnh sửa nội dung theo đúng định dạng để tiết kiệm thời gian.
Cách 2: Sử dụng Script builder
Trong phần Style instructions, nhập mô tả phong cách hội thoại (bằng tiếng Anh, ví dụ: “formal”, “casual”, hoặc “dramatic”). Thêm từng câu thoại cho các nhân vật bằng cách nhấp vào Add dialog. Cách này phù hợp nếu bạn muốn xây dựng hội thoại từng bước.
Bước 6: Sau khi nhập nội dung, nhấn nút Run để Google AI Studio xử lý và tạo file âm thanh.

Khi hoàn tất, bạn có thể nghe thử trực tiếp hoặc nhấn vào biểu tượng ba chấm, chọn Download để tải file về máy.

Kết luận
Tạo speech từ text trên Google AI Studio là một công cụ tuyệt vời, vừa miễn phí, vừa dễ sử dụng. Với vài bước đơn giản, bạn có thể tạo ra những đoạn hội thoại chất lượng cao, phục vụ cho nhiều mục đích từ giáo dục đến giải trí. Hãy thử ngay hôm nay nhé!