A criação musical com inteligência artificial permite compor faixas completas a partir de descrições de texto. A ElevenLabs Music integra arranjo, instrumentação e vocais em um fluxo único, interpretando parâmetros como gênero, andamento e humor para entregar resultados consistentes. Este tutorial apresenta um método completo para gerar músicas prontas para redes sociais, com ênfase em controle de estrutura, tempo e clareza de prompt.
O conteúdo a seguir descreve minuciosamente a interface, cada opção de configuração, boas práticas de escrita, exemplos de prompts (incluindo seções entre colchetes para controle por partes) e um guia de uso via API em Python. O material é autossuficiente e inclui recomendações específicas para faixas de até três minutos.
🎵 1. Acesso e contexto da plataforma
A composição acontece na área Music, localizada dentro de Products. Após autenticação, a tela de criação exibe o cabeçalho “Begin your musical journey”, que concentra os controles principais. A ferramenta roda no navegador e não requer instalação. O uso de fones de ouvido facilita a avaliação de timbres, estéreos e reverbs nas prévias. O foco deste passo é reconhecer o ambiente antes de definir parâmetros, garantindo que cada ajuste tenha um objetivo claro no resultado final.
O ecossistema foi pensado para iniciantes e profissionais: quem nunca produziu consegue resultados com poucos parâmetros, enquanto usuários avançados podem detalhar andamento (BPM), tonalidade, instrumentação e seções da música. Esse equilíbrio reduz a barreira técnica tradicional de DAWs e plugins, mantendo previsibilidade no fluxo de criação.
🧭 2. Mapeamento da interface principal
Quatro áreas formam o núcleo do trabalho: o campo de descrição, os seletores de configuração, o botão de processamento e a lista de itens gerados. Entender cada uma evita tentativas aleatórias e acelera a obtenção de sons coerentes com a proposta estética.
- “Describe your song…” — campo onde o prompt descreve gênero, BPM, tom, instrumentos, humor e referências de dinâmica.
- Layers — seletor da quantidade de camadas instrumentais, controlando densidade e complexidade do arranjo.
- Duration — seletor de tempo total do áudio; define se a faixa terá formato curto, médio ou longo.
- Lyrics / Auto / Instrumental — seletor do tipo de faixa:
- Lyrics (via Custom): habilita campo de letra personalizada para vocal cantado.
- Auto: delega à IA decidir presença de voz e estrutura.
- Instrumental: gera apenas base musical, sem voz.
- Generate — botão que inicia a composição com base nas configurações.
- Recent projects — lista de projetos com opções de reprodução, renomeação e exclusão.
Termos da interface aparecem em negrito ao longo do tutorial para distinguir elementos clicáveis e rótulos de configuração do texto explicativo.
✍️ 3. Escrevendo prompts eficazes
O prompt traduz intenção em música. Deve conter gênero, andamento, tom, instrumentação e humor, além de observações sobre dinâmica e textura. Especificidade reduz ambiguidade e melhora consistência entre versões. Evitar termos vagos como “rápido” ou “triste” e adotar números e adjetivos sonoros objetivos, como “125 BPM”, “guitarras brilhantes com leve overdrive” e “bateria enérgica com pratos abertos”.
Exemplo de prompt completo (sem letra):
Upbeat gospel rock at 125 BPM in A major, featuring energetic live drums, punchy bass, bright overdriven guitars, driving piano chords and wide stereo ambience. Mood: joyful, powerful and uplifting worship; tight arrangement, modern mix, clean transitions.
Exemplo de prompt com controles de mix e dinâmica:
Modern gospel rock, 120 BPM in E minor, tight drums with punchy kick, warm bass, crisp guitars, subtle pads, vocal-forward mix, moderate compression, bright high-end, short plate reverb on vocals, natural room on drums; emotional and inspiring mood.
🧩 4. Seções por colchetes para controle fino
Para granularidade de estrutura, o prompt pode usar descrições seccionais entre colchetes. Essa abordagem define [Intro], [Verse], [Chorus], [Breakdown] e [Outro], guiando flow e transições. Esse método torna previsível a forma da canção e permite ajustes pontuais de duração por parte.
Exemplo com seções:
[Intro] 8s, clean guitar arpeggios, soft kick, rising pad
[Verse] 35s, tight drums, bass groove, low-register vocals, intimate tone
[Chorus] 25s, full band, open hats, stacked guitars, wide vocals, uplifting hook
[Breakdown] 12s, half-time drums, filtered guitars, airy pads, tension
[Chorus] 25s, higher energy, extra guitar layer, backing vocals
[Outro] 8s, ring-out chord, short fade
Essa organização facilita encaixar a música em até 3 minutos mantendo impacto narrativo, com início claro, pico emocional no refrão e encerramento limpo.
🎤 5. Tipo de faixa: Lyrics, Auto e Instrumental
O seletor define o papel da voz e a forma do arranjo. Em Lyrics (via Custom), a letra fornecida molda a melodia e a métrica. Em Auto, a IA decide se haverá vocal e como será distribuído. Em Instrumental, toda a intenção é expressa pelos instrumentos, ótimo para trilhas e reels com narração externa. A escolha deve combinar objetivo artístico, clareza de mensagem e contexto de publicação.
Exemplo de letra curta e métrica simples (bom encaixe melódico):
Luz que rasga a escuridão
Chama viva a me guiar
Mesmo quando o vento cai
Teu amor me faz cantar
⏱️ 6. Duração e formatos para redes sociais
O seletor Duration oferece valores como 30s, 1m, 2m, 3m e 4m, além de opção personalizada. Para redes sociais, o intervalo ideal é de 2:30 a 3:00. Essa janela suporta Intro breve, dois Verse, dois Chorus e um Outro curto. O BPM recomendado para rock gospel energético varia de 118–130; para climas contemplativos, 95–110. A combinação de BPM e distribuição por seções garante progressão sem cortes abruptos.
Distribuição sugerida (até 3 minutos):
- Intro 0:00–0:08 — gesto temático e crescimento suave.
- Verse 1 0:08–0:40 — letra em registro baixo, groove firme.
- Chorus 0:40–1:05 — hook vocal amplo, pratos abertos, guitarras extras.
- Verse 2 1:05–1:35 — variação rítmica, backing discreto.
- Chorus 1:35–2:05 — repetição com energia adicional.
- Breakdown/Ponte 2:05–2:20 — meia-tempo, tensão controlada.
- Chorus final 2:20–2:45 — clímax.
- Outro 2:45–3:00 — acorde final sustentado ou fade curto.
🎚️ 7. Camadas (Layers) e densidade sonora
Layers controla quantos blocos instrumentais coexistem. Em termos práticos: 1–2 camadas soam minimalistas; 3–4 camadas entregam arranjos cheios e modernos. Adições comuns incluem guitarras de apoio, teclados em pads, contramelodias e hits de transição. Excesso de camadas pode mascarar a voz; parcimônia preserva inteligibilidade e impacto do refrão.
- 2 camadas — base rítmica e harmonia principal; foco na voz.
- 3 camadas — inclusão de guitarras secundárias e pads etéreos.
- 4 camadas — arranjo completo com contramelodias e efeitos.
Dica prática: em refrões, elevar camadas e abrir o hi-hat; em Verse, reduzir texturas e sustentar a narrativa.
⚙️ 8. Geração, avaliação e iteração
Com os parâmetros definidos, aciona-se Generate. O processamento cria batidas, harmonia e, se aplicável, a melodia cantada a partir da letra. O resultado surge em Recent projects com opções de reprodução e gerenciamento. A avaliação técnica considera clareza vocal, coerência rítmica e equilíbrio entre frequências graves, médias e agudas. Pequenos ajustes no prompt — como trocar tom, refinar BPM ou especificar reverbs — costumam corrigir desvios de caráter.
Exemplo de tweak rápido: adicionar “tight low-end, controlled sub, short plate reverb on vocals, subtle room on drums” para aumentar definição e evitar excesso de ambiência.
📂 9. Organização em Recent projects
Os itens gerados aparecem listados com título, tempo relativo e menu de contexto. Manter nomenclaturas descritivas acelera revisões e comparações. Ao selecionar o menu (símbolo de três pontos), opções usuais incluem reprodução, renomeação e exclusão. O histórico de versões permite entender o impacto de mudanças de prompt e facilita retornar a uma configuração que produziu timbres e arranjos desejáveis.
Estratégia de organização: prefira padrões como “RockGospel_125BPM_Eminor_v2_layers4” para recuperar rapidamente as características-chave da faixa.
💾 10. Download e licenciamento
As prévias podem ser ouvidas diretamente no navegador. Para baixar e publicar em contextos amplos, é necessário um plano compatível, que libera formatos de alta qualidade e direitos de uso público. A mensagem de atualização de plano aparece próxima ao botão Generate. Respeitar licenças assegura conformidade e evita problemas em plataformas com monetização.
🎸 Exemplos práticos de prompts (Rock Gospel)
Os exemplos abaixo demonstram variações de humor e textura para caber no limite de até 3 minutos. Cada variação usa seções entre colchetes para orientar forma e fluxo.
- Rock gospel suave (100 BPM, D major)
[Intro] 8s clean guitar arpeggios, soft kick, warm pad; [Verse] 35s intimate low-register vocals, tight drums, melodic bass; [Chorus] 25s wide vocals, gentle overdrive guitars, subtle open hats; [Verse] small variation; [Chorus] repeat with harmony; [Outro] 8s ring-out chord. Mood: peaceful, heartfelt, intimate worship. - Rock gospel energético (125 BPM, A major)
[Intro] 6s tom build + crash; [Verse] 30s driving bass, crisp rhythm guitars; [Chorus] 25s stacked guitars, open hats, big hook; [Breakdown] 12s half-time, filtered guitars; [Chorus] 25s higher energy + backing vocals; [Outro] 8s final chord. Mood: joyful, uplifting, powerful. - Rock gospel ao vivo (118 BPM, E minor)
[Intro] 8s crowd ambience, roomy drums; [Verse] raw vocal, tight groove; [Chorus] 25s wide stereo guitars, room mics; [Bridge] 12s dynamic lift; [Chorus] repeat with extra layer; [Outro] short fade. Mood: passionate, raw, spiritual concert atmosphere.
📏 Dicas de tempo, estrutura e mix para 3 minutos
Para maximizar retenção em redes, a música deve evoluir a cada 10–20 segundos, alternando densidade e textura. A introdução entrega identidade, o verso conduz narrativa, o refrão concentra a mensagem e a ponte cria contraste emocional. A mixagem equilibra graves controlados, médios presentes e agudos claros, evitando fadiga auditiva em dispositivos móveis.
- BPM recomendado: 118–130 para energia; 95–110 para contemplação.
- Intro curta: 5–10 segundos; revelar assinatura de timbre cedo.
- Hook vocal: aparecer até 45 segundos; repetir no final.
- Dinâmica: usar breakdown de 10–15 segundos para criar contraste.
- Encerramento: acorde sustentado de 4–8 segundos ou fade curto.
🧪 Modelos de prompt reutilizáveis
Os modelos a seguir servem como base para ajustes rápidos. Substituir valores entre colchetes permite adaptar estilo, andamento e humor sem reescrever toda a descrição.
- Template instrumental curto
Modern gospel rock instrumental at [BPM] in [KEY], tight drums, punchy bass, bright rhythm guitars, subtle pads, uplifting mood, clean transitions, short intro 6s, chorus hook at 0:40, final ring-out 8s. - Template com letra e seções
[Intro] [DURAÇÃO], [TIMBRES/TEXTURAS]; [Verse] [DURAÇÃO], [CARACTERÍSTICAS]; [Chorus] [DURAÇÃO], [IMPACTO]; [Breakdown] [DURAÇÃO]; [Chorus] [DURAÇÃO]; [Outro] [DURAÇÃO]. [MOOD]. [BPM] in [KEY]. Instruments: [LISTA]. - Template focado em mix
[GÊNERO], [BPM] in [KEY], vocal-forward mix, punchy kick, controlled bass, bright guitars, short plate reverb on vocals, natural room on drums, clear stereo field, modern compression, smooth transitions.
🐍 API em Python — criação rápida de músicas
A API de música está disponível para planos pagos. O fluxo básico envolve criar uma chave, instalar o SDK e realizar a chamada de composição. Os exemplos abaixo usam comentários e identificadores em português para facilitar entendimento.
# exemplo 1 — composição simples a partir de prompt
# requisitos: variáveis de ambiente configuradas com ELEVENLABS_API_KEY
from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os
api_key = os.getenv("ELEVENLABS_API_KEY") # chave da api
cliente = ElevenLabs(api_key=api_key)
# prompt descritivo com bpm, tom, instrumentos e humor
prompt_musica = (
"Upbeat gospel rock at 125 BPM in A major, energetic drums, punchy bass, "
"bright overdriven guitars, driving piano, uplifting and powerful mood."
)
# duração em milissegundos (ex.: 3 minutos = 180000 ms)
musica = cliente.music.compose(
prompt=prompt_musica,
music_length_ms=180000,
)
play(musica) # reproduz o áudio gerado
# exemplo 2 — composição com seções por colchetes para controle fino
from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os
cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))
prompt_secoes = (
"[Intro] 8s clean guitar arpeggios, soft kick, rising pad; "
"[Verse] 35s tight drums, bass groove, low-register vocals; "
"[Chorus] 25s full band, open hats, stacked guitars, wide vocals; "
"[Breakdown] 12s half-time drums, filtered guitars; "
"[Chorus] repeat with higher energy; [Outro] 8s ring-out chord. "
"Gospel rock at 122 BPM in E minor, uplifting and powerful."
)
musica = cliente.music.compose(
prompt=prompt_secoes,
music_length_ms=175000, # ~2:55 para redes sociais
)
play(musica)
# exemplo 3 — plano de composição (composition plan)
# permite granularidade em cada seção e estilos positivos/negativos
from elevenlabs.client import ElevenLabs
import os
cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))
plano = cliente.music.composition_plan.create(
prompt=(
"Gospel rock, 120 BPM, emotional male vocals, tight drums, warm bass, "
"bright guitars; uplifting mood with modern mix and clean transitions."
),
music_length_ms=170000,
)
print(plano) # exibe json com estilos globais/locais e seções
# exemplo 4 — gerar música a partir do plano de composição
from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os
cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))
composicao = cliente.music.compose(
composition_plan=plano # usa o plano criado anteriormente
)
play(composicao)
# exemplo 5 — resposta detalhada com metadados e plano interno
from elevenlabs.client import ElevenLabs
import os
cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))
detalhes = cliente.music.compose_detailed(
prompt=(
"Gospel rock at 118 BPM in D major, clean intro, big chorus, "
"tight low-end, bright highs, short plate reverb on vocals."
),
music_length_ms=165000,
)
print(detalhes.json) # contém composition_plan e song_metadata
print(detalhes.filename) # nome sugerido do arquivo
# detalhes.audio contém os bytes do áudio (salvar em arquivo se necessário)
# exemplo 6 — tratamento de erro de material protegido por direitos autorais
from elevenlabs.client import ElevenLabs
import os
cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))
try:
musica = cliente.music.compose(
prompt="A song that sounds like 'Bohemian Rhapsody'",
music_length_ms=10000,
)
except Exception as erro:
# api pode retornar 'bad_prompt' com sugestão de reformulação
try:
detalhe = erro.body["detail"]
if detalhe.get("status") == "bad_prompt":
sugestao = detalhe["data"]["prompt_suggestion"]
print(sugestao) # use a sugestão de prompt em seguida
except Exception:
print("erro de prompt sem sugestão automática")
🧠 Boas práticas finais
Prompts objetivos conduzem arranjos previsíveis; seções por colchetes asseguram forma clara; distribuição de energia a cada 10–20 segundos mantém atenção; e a escolha adequada de Layers, Duration e do tipo Lyrics/Auto/Instrumental alinha intenção artística e requisitos de publicação. Iterações curtas e nomeação cuidadosa em Recent projects consolidam um fluxo de trabalho estável e replicável.