Como Criar Músicas Completas com Inteligência Artificial — Do Zero ao Som Pronto em Minutos

Published on: 2025-10-28

pt eleven-labs-music criacao-de-musica-com-ia gerar-musica-com-inteligencia-artificial ai-music-creator producao-musical-automatica musica-gospel-rock-com-ia tutorial-eleven-labs-passo-a-passo composicao-musical-com-inteligencia-artificial musica

A criação musical com inteligência artificial permite compor faixas completas a partir de descrições de texto. A ElevenLabs Music integra arranjo, instrumentação e vocais em um fluxo único, interpretando parâmetros como gênero, andamento e humor para entregar resultados consistentes. Este tutorial apresenta um método completo para gerar músicas prontas para redes sociais, com ênfase em controle de estrutura, tempo e clareza de prompt.

O conteúdo a seguir descreve minuciosamente a interface, cada opção de configuração, boas práticas de escrita, exemplos de prompts (incluindo seções entre colchetes para controle por partes) e um guia de uso via API em Python. O material é autossuficiente e inclui recomendações específicas para faixas de até três minutos.

🎵 1. Acesso e contexto da plataforma

A composição acontece na área Music, localizada dentro de Products. Após autenticação, a tela de criação exibe o cabeçalho “Begin your musical journey”, que concentra os controles principais. A ferramenta roda no navegador e não requer instalação. O uso de fones de ouvido facilita a avaliação de timbres, estéreos e reverbs nas prévias. O foco deste passo é reconhecer o ambiente antes de definir parâmetros, garantindo que cada ajuste tenha um objetivo claro no resultado final.

O ecossistema foi pensado para iniciantes e profissionais: quem nunca produziu consegue resultados com poucos parâmetros, enquanto usuários avançados podem detalhar andamento (BPM), tonalidade, instrumentação e seções da música. Esse equilíbrio reduz a barreira técnica tradicional de DAWs e plugins, mantendo previsibilidade no fluxo de criação.

🧭 2. Mapeamento da interface principal

Quatro áreas formam o núcleo do trabalho: o campo de descrição, os seletores de configuração, o botão de processamento e a lista de itens gerados. Entender cada uma evita tentativas aleatórias e acelera a obtenção de sons coerentes com a proposta estética.

“Describe your song…” — campo onde o prompt descreve gênero, BPM, tom, instrumentos, humor e referências de dinâmica.
Layers — seletor da quantidade de camadas instrumentais, controlando densidade e complexidade do arranjo.
Duration — seletor de tempo total do áudio; define se a faixa terá formato curto, médio ou longo.
Lyrics / Auto / Instrumental — seletor do tipo de faixa:
- Lyrics (via Custom): habilita campo de letra personalizada para vocal cantado.
- Auto: delega à IA decidir presença de voz e estrutura.
- Instrumental: gera apenas base musical, sem voz.
Generate — botão que inicia a composição com base nas configurações.
Recent projects — lista de projetos com opções de reprodução, renomeação e exclusão.

Termos da interface aparecem em negrito ao longo do tutorial para distinguir elementos clicáveis e rótulos de configuração do texto explicativo.

✍️ 3. Escrevendo prompts eficazes

O prompt traduz intenção em música. Deve conter gênero, andamento, tom, instrumentação e humor, além de observações sobre dinâmica e textura. Especificidade reduz ambiguidade e melhora consistência entre versões. Evitar termos vagos como “rápido” ou “triste” e adotar números e adjetivos sonoros objetivos, como “125 BPM”, “guitarras brilhantes com leve overdrive” e “bateria enérgica com pratos abertos”.

Exemplo de prompt completo (sem letra):

Upbeat gospel rock at 125 BPM in A major, featuring energetic live drums, punchy bass, bright overdriven guitars, driving piano chords and wide stereo ambience. Mood: joyful, powerful and uplifting worship; tight arrangement, modern mix, clean transitions.

Exemplo de prompt com controles de mix e dinâmica:

Modern gospel rock, 120 BPM in E minor, tight drums with punchy kick, warm bass, crisp guitars, subtle pads, vocal-forward mix, moderate compression, bright high-end, short plate reverb on vocals, natural room on drums; emotional and inspiring mood.

🧩 4. Seções por colchetes para controle fino

Para granularidade de estrutura, o prompt pode usar descrições seccionais entre colchetes. Essa abordagem define [Intro], [Verse], [Chorus], [Breakdown] e [Outro], guiando flow e transições. Esse método torna previsível a forma da canção e permite ajustes pontuais de duração por parte.

Exemplo com seções:

[Intro] 8s, clean guitar arpeggios, soft kick, rising pad
[Verse] 35s, tight drums, bass groove, low-register vocals, intimate tone
[Chorus] 25s, full band, open hats, stacked guitars, wide vocals, uplifting hook
[Breakdown] 12s, half-time drums, filtered guitars, airy pads, tension
[Chorus] 25s, higher energy, extra guitar layer, backing vocals
[Outro] 8s, ring-out chord, short fade

Essa organização facilita encaixar a música em até 3 minutos mantendo impacto narrativo, com início claro, pico emocional no refrão e encerramento limpo.

🎤 5. Tipo de faixa: Lyrics, Auto e Instrumental

O seletor define o papel da voz e a forma do arranjo. Em Lyrics (via Custom), a letra fornecida molda a melodia e a métrica. Em Auto, a IA decide se haverá vocal e como será distribuído. Em Instrumental, toda a intenção é expressa pelos instrumentos, ótimo para trilhas e reels com narração externa. A escolha deve combinar objetivo artístico, clareza de mensagem e contexto de publicação.

Exemplo de letra curta e métrica simples (bom encaixe melódico):

Luz que rasga a escuridão
Chama viva a me guiar
Mesmo quando o vento cai
Teu amor me faz cantar

⏱️ 6. Duração e formatos para redes sociais

O seletor Duration oferece valores como 30s, 1m, 2m, 3m e 4m, além de opção personalizada. Para redes sociais, o intervalo ideal é de 2:30 a 3:00. Essa janela suporta Intro breve, dois Verse, dois Chorus e um Outro curto. O BPM recomendado para rock gospel energético varia de 118–130; para climas contemplativos, 95–110. A combinação de BPM e distribuição por seções garante progressão sem cortes abruptos.

Distribuição sugerida (até 3 minutos):

Intro 0:00–0:08 — gesto temático e crescimento suave.
Verse 1 0:08–0:40 — letra em registro baixo, groove firme.
Chorus 0:40–1:05 — hook vocal amplo, pratos abertos, guitarras extras.
Verse 2 1:05–1:35 — variação rítmica, backing discreto.
Chorus 1:35–2:05 — repetição com energia adicional.
Breakdown/Ponte 2:05–2:20 — meia-tempo, tensão controlada.
Chorus final 2:20–2:45 — clímax.
Outro 2:45–3:00 — acorde final sustentado ou fade curto.

🎚️ 7. Camadas (Layers) e densidade sonora

Layers controla quantos blocos instrumentais coexistem. Em termos práticos: 1–2 camadas soam minimalistas; 3–4 camadas entregam arranjos cheios e modernos. Adições comuns incluem guitarras de apoio, teclados em pads, contramelodias e hits de transição. Excesso de camadas pode mascarar a voz; parcimônia preserva inteligibilidade e impacto do refrão.

2 camadas — base rítmica e harmonia principal; foco na voz.
3 camadas — inclusão de guitarras secundárias e pads etéreos.
4 camadas — arranjo completo com contramelodias e efeitos.

Dica prática: em refrões, elevar camadas e abrir o hi-hat; em Verse, reduzir texturas e sustentar a narrativa.

⚙️ 8. Geração, avaliação e iteração

Com os parâmetros definidos, aciona-se Generate. O processamento cria batidas, harmonia e, se aplicável, a melodia cantada a partir da letra. O resultado surge em Recent projects com opções de reprodução e gerenciamento. A avaliação técnica considera clareza vocal, coerência rítmica e equilíbrio entre frequências graves, médias e agudas. Pequenos ajustes no prompt — como trocar tom, refinar BPM ou especificar reverbs — costumam corrigir desvios de caráter.

Exemplo de tweak rápido: adicionar “tight low-end, controlled sub, short plate reverb on vocals, subtle room on drums” para aumentar definição e evitar excesso de ambiência.

📂 9. Organização em Recent projects

Os itens gerados aparecem listados com título, tempo relativo e menu de contexto. Manter nomenclaturas descritivas acelera revisões e comparações. Ao selecionar o menu (símbolo de três pontos), opções usuais incluem reprodução, renomeação e exclusão. O histórico de versões permite entender o impacto de mudanças de prompt e facilita retornar a uma configuração que produziu timbres e arranjos desejáveis.

Estratégia de organização: prefira padrões como “RockGospel_125BPM_Eminor_v2_layers4” para recuperar rapidamente as características-chave da faixa.

💾 10. Download e licenciamento

As prévias podem ser ouvidas diretamente no navegador. Para baixar e publicar em contextos amplos, é necessário um plano compatível, que libera formatos de alta qualidade e direitos de uso público. A mensagem de atualização de plano aparece próxima ao botão Generate. Respeitar licenças assegura conformidade e evita problemas em plataformas com monetização.

🎸 Exemplos práticos de prompts (Rock Gospel)

Os exemplos abaixo demonstram variações de humor e textura para caber no limite de até 3 minutos. Cada variação usa seções entre colchetes para orientar forma e fluxo.

Rock gospel suave (100 BPM, D major)
[Intro] 8s clean guitar arpeggios, soft kick, warm pad; [Verse] 35s intimate low-register vocals, tight drums, melodic bass; [Chorus] 25s wide vocals, gentle overdrive guitars, subtle open hats; [Verse] small variation; [Chorus] repeat with harmony; [Outro] 8s ring-out chord. Mood: peaceful, heartfelt, intimate worship.
Rock gospel energético (125 BPM, A major)
[Intro] 6s tom build + crash; [Verse] 30s driving bass, crisp rhythm guitars; [Chorus] 25s stacked guitars, open hats, big hook; [Breakdown] 12s half-time, filtered guitars; [Chorus] 25s higher energy + backing vocals; [Outro] 8s final chord. Mood: joyful, uplifting, powerful.
Rock gospel ao vivo (118 BPM, E minor)
[Intro] 8s crowd ambience, roomy drums; [Verse] raw vocal, tight groove; [Chorus] 25s wide stereo guitars, room mics; [Bridge] 12s dynamic lift; [Chorus] repeat with extra layer; [Outro] short fade. Mood: passionate, raw, spiritual concert atmosphere.

📏 Dicas de tempo, estrutura e mix para 3 minutos

Para maximizar retenção em redes, a música deve evoluir a cada 10–20 segundos, alternando densidade e textura. A introdução entrega identidade, o verso conduz narrativa, o refrão concentra a mensagem e a ponte cria contraste emocional. A mixagem equilibra graves controlados, médios presentes e agudos claros, evitando fadiga auditiva em dispositivos móveis.

BPM recomendado: 118–130 para energia; 95–110 para contemplação.
Intro curta: 5–10 segundos; revelar assinatura de timbre cedo.
Hook vocal: aparecer até 45 segundos; repetir no final.
Dinâmica: usar breakdown de 10–15 segundos para criar contraste.
Encerramento: acorde sustentado de 4–8 segundos ou fade curto.

🧪 Modelos de prompt reutilizáveis

Os modelos a seguir servem como base para ajustes rápidos. Substituir valores entre colchetes permite adaptar estilo, andamento e humor sem reescrever toda a descrição.

Template instrumental curto
Modern gospel rock instrumental at [BPM] in [KEY], tight drums, punchy bass, bright rhythm guitars, subtle pads, uplifting mood, clean transitions, short intro 6s, chorus hook at 0:40, final ring-out 8s.
Template com letra e seções
[Intro] [DURAÇÃO], [TIMBRES/TEXTURAS]; [Verse] [DURAÇÃO], [CARACTERÍSTICAS]; [Chorus] [DURAÇÃO], [IMPACTO]; [Breakdown] [DURAÇÃO]; [Chorus] [DURAÇÃO]; [Outro] [DURAÇÃO]. [MOOD]. [BPM] in [KEY]. Instruments: [LISTA].
Template focado em mix
[GÊNERO], [BPM] in [KEY], vocal-forward mix, punchy kick, controlled bass, bright guitars, short plate reverb on vocals, natural room on drums, clear stereo field, modern compression, smooth transitions.

🐍 API em Python — criação rápida de músicas

A API de música está disponível para planos pagos. O fluxo básico envolve criar uma chave, instalar o SDK e realizar a chamada de composição. Os exemplos abaixo usam comentários e identificadores em português para facilitar entendimento.

# exemplo 1 — composição simples a partir de prompt
# requisitos: variáveis de ambiente configuradas com ELEVENLABS_API_KEY

from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os

api_key = os.getenv("ELEVENLABS_API_KEY")  # chave da api
cliente = ElevenLabs(api_key=api_key)

# prompt descritivo com bpm, tom, instrumentos e humor
prompt_musica = (
    "Upbeat gospel rock at 125 BPM in A major, energetic drums, punchy bass, "
    "bright overdriven guitars, driving piano, uplifting and powerful mood."
)

# duração em milissegundos (ex.: 3 minutos = 180000 ms)
musica = cliente.music.compose(
    prompt=prompt_musica,
    music_length_ms=180000,
)

play(musica)  # reproduz o áudio gerado

# exemplo 2 — composição com seções por colchetes para controle fino
from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os

cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))

prompt_secoes = (
    "[Intro] 8s clean guitar arpeggios, soft kick, rising pad; "
    "[Verse] 35s tight drums, bass groove, low-register vocals; "
    "[Chorus] 25s full band, open hats, stacked guitars, wide vocals; "
    "[Breakdown] 12s half-time drums, filtered guitars; "
    "[Chorus] repeat with higher energy; [Outro] 8s ring-out chord. "
    "Gospel rock at 122 BPM in E minor, uplifting and powerful."
)

musica = cliente.music.compose(
    prompt=prompt_secoes,
    music_length_ms=175000,  # ~2:55 para redes sociais
)
play(musica)

# exemplo 3 — plano de composição (composition plan)
# permite granularidade em cada seção e estilos positivos/negativos

from elevenlabs.client import ElevenLabs
import os

cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))

plano = cliente.music.composition_plan.create(
    prompt=(
        "Gospel rock, 120 BPM, emotional male vocals, tight drums, warm bass, "
        "bright guitars; uplifting mood with modern mix and clean transitions."
    ),
    music_length_ms=170000,
)

print(plano)  # exibe json com estilos globais/locais e seções

# exemplo 4 — gerar música a partir do plano de composição
from elevenlabs.client import ElevenLabs
from elevenlabs.play import play
import os

cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))

composicao = cliente.music.compose(
    composition_plan=plano  # usa o plano criado anteriormente
)

play(composicao)

# exemplo 5 — resposta detalhada com metadados e plano interno
from elevenlabs.client import ElevenLabs
import os

cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))

detalhes = cliente.music.compose_detailed(
    prompt=(
        "Gospel rock at 118 BPM in D major, clean intro, big chorus, "
        "tight low-end, bright highs, short plate reverb on vocals."
    ),
    music_length_ms=165000,
)

print(detalhes.json)      # contém composition_plan e song_metadata
print(detalhes.filename)  # nome sugerido do arquivo
# detalhes.audio contém os bytes do áudio (salvar em arquivo se necessário)

# exemplo 6 — tratamento de erro de material protegido por direitos autorais
from elevenlabs.client import ElevenLabs
import os

cliente = ElevenLabs(api_key=os.getenv("ELEVENLABS_API_KEY"))

try:
    musica = cliente.music.compose(
        prompt="A song that sounds like 'Bohemian Rhapsody'",
        music_length_ms=10000,
    )
except Exception as erro:
    # api pode retornar 'bad_prompt' com sugestão de reformulação
    try:
        detalhe = erro.body["detail"]
        if detalhe.get("status") == "bad_prompt":
            sugestao = detalhe["data"]["prompt_suggestion"]
            print(sugestao)  # use a sugestão de prompt em seguida
    except Exception:
        print("erro de prompt sem sugestão automática")

🧠 Boas práticas finais

Prompts objetivos conduzem arranjos previsíveis; seções por colchetes asseguram forma clara; distribuição de energia a cada 10–20 segundos mantém atenção; e a escolha adequada de Layers, Duration e do tipo Lyrics/Auto/Instrumental alinha intenção artística e requisitos de publicação. Iterações curtas e nomeação cuidadosa em Recent projects consolidam um fluxo de trabalho estável e replicável.

← Back to blog