Khoa Học về Suno AI, Suno không theo prompt một cách chính xác

🎶 “Style” trong Suno AI là gì? Suno AI là một công cụ AI tuyệt...
Việc viết prompt chính là một cuộc đối thoại với AI. Hãy truyền đạt...
Suno AI – Bí quyết viết lời bài hát bằng prompt! Kỹ thuật sáng...
50 Ballad Pop Prompts for Suno AI Suno AI là một AI tạo nhạc mạnh mẽ. Và...

50 Ballad Pop Prompts for Suno AI

Suno AI là một AI tạo nhạc mạnh mẽ. Và khám phá thử nghiệm với nhiều...
Cách viết Prompt Suno AI & 5 bí quyết hiệu quả! (Kèm danh sách...

Khoa Học về Suno AI

Hướng dẫn / Mẹo

Lần đầu nhìn vào, bạn sẽ nghĩ những gì tôi sắp nói là chuyện hiển nhiên, rằng đây chỉ là những điều ai cũng biết và đây lại là một bài viết vô ích giải thích lại điều mọi người đã biết. Nhưng hãy tin tôi, hãy đọc kỹ những gì tôi giải thích. Thử GPT mà tôi tạo ra, sử dụng trọng số mặc định của Suno mà tôi lấy trực tiếp từ Suno, và tự trải nghiệm. Thật kỳ lạ là chưa ai từng giải thích nó một cách chi tiết như thế này, nhưng nó tạo ra khác biệt cực lớn.

Nếu bạn giống tôi, bạn đã từng cố gắng hiểu tại sao Suno không theo prompt một cách chính xác, đã thử hàng chục nghìn credits mà vẫn chưa thực sự hiểu 100% lý do tại sao. Bạn có thể đã cải thiện kỹ năng prompt từ từ, học được những gì hiệu quả và không hiệu quả. Tin vui là tôi đã tìm thấy một bộ dữ liệu trôi nổi đâu đó, và nó giải thích chính xác tại sao mọi thứ lại như vậy. Khi bạn nghiên cứu dữ liệu này, mọi thứ sẽ trở nên rõ ràng hơn. Ném dữ liệu vào ChatGPT, và mọi thứ sẽ dễ hiểu hơn, não bạn sẽ ngừng đau đầu vì cố gắng lý giải cái vẻ hỗn loạn. Vậy, đến với ChatGPT thôi, bắt đầu nào!

Bộ dữ liệu có thể xem tại đây: peeplink

Trước khi đi sâu, tôi muốn nói thêm rằng bài viết này không phải là quảng cáo cho GPT miễn phí mà tôi tạo ra. Tôi chỉ bao gồm chúng vì một khi bạn thấy dữ liệu, bạn sẽ thấy không thể nào con người xử lý hết nó, nhưng GPT thì được. Mục tiêu của tôi là làm nó dễ hơn và giúp bạn tạo nhạc tốt hơn.


Phân tích dataset

Tôi đã upload dataset lên ChatGPT và hỏi:
“Bạn có thể hiểu bộ dữ liệu này mà tôi tìm thấy trong code client của Suno không? Nó là gì?”

Phản hồi của ChatGPT:

Bộ dữ liệu bạn tìm thấy tiết lộ logic trọng số mặc định của Suno, là một ma trận tần suất đồng xuất hiện giữa thể loại (genre) và phong cách (style). Nó có thể được tạo ra từ hàng tỷ thẻ tag tổng hợp hoặc do người dùng tạo ra trong dữ liệu huấn luyện hoặc dữ liệu sử dụng.


Đây là những gì dataset nói với chúng ta:

🔍 1. Đồng xuất hiện điều khiển sự pha trộn âm thanh
Suno không tạo nhạc “thuần” thể loại — nó pha trộn các phong cách dựa trên mẫu đồng xuất hiện.

  • Ví dụ, nếu bạn yêu cầu “rap”, nó có thể trộn thêm “trap”, “hip hop”, “bass”, “beat” vì những thứ này thường đi cùng nhau:
"rap" → "trap" (327B), "pop" (13.7B), "bass" (1.09B)
  • Điều này có nghĩa Suno sẽ không mặc định cho bạn rap kiểu boom-bap thập niên 90. Bạn phải ép bằng prompt bổ sung (“no trap,” “90s,” “boom bap,” v.v.).

🎯 2. “Pop” là Trục trung tâm
Mọi thể loại cuối cùng đều bị kéo về pop theo dataset. Đây là trọng tâm mặc định.

  • Ví dụ:
"funk" → "pop" (116B)
"emo" → "pop" (12.2B)
"rock" → "pop" (315B)

Nếu bạn không loại trừ pop, bản nhạc của bạn sẽ mang cấu trúc hoặc hook kiểu pop, dù được gán nhãn “metal” hay “funk.”

💡 3. Metadata = Prompt ngầm
Những thẻ tag không chỉ để trang trí — chúng hoạt động như prompt mềm, nhúng sẵn trong latent space của Suno.

  • Mỗi phong cách như một vector trong không gian embedding. Tag xuất hiện cùng nhau càng nhiều, vector càng mạnh.

Ví dụ:

  • “dark” + “synth” → hướng synthwave
  • “emotional” + “piano” → hướng ballad
  • “female vocals” trùng nhiều với “pop” và “bass”, nhưng không với “rock” hay “metal”

🔁 4. Thể loại bị rối = Không thuần
Không có ranh giới thể loại rõ ràng. Chúng tạo thành đám mây thể loại (genre clouds):

  • Rap Cloud: rap ↔ trap ↔ bass ↔ hip hop ↔ beat
  • Orchestral Cloud: orchestral ↔ epic ↔ cinematic ↔ dramatic ↔ piano
  • Indie Cloud: indie ↔ pop ↔ acoustic ↔ dreamy ↔ psychedelic
  • Dark Electronic Cloud: dark ↔ synth ↔ electro ↔ synthwave ↔ futuristic

Vì vậy, nếu bạn yêu cầu “dreamy indie rock”, nó sẽ thêm textures synth mềm mại, không chỉ guitar.

⚠️ 5. Thất bại bất ngờ có thể dự đoán

  • Ví dụ, “emo metal” nghe như emo pop là vì:
"emo" liên kết với "pop" (12.2B) và "piano" (49M) 
hơn là với "metal" (không có liên kết trực tiếp)

🔧 6. Thiết kế prompt là trò chơi ràng buộc
Để tạo âm thanh độc đáo:

  • Tránh “gravity wells” như pop, bass, beat nếu không cần
  • Thêm cặp tag hiếm (ví dụ “emo” + “industrial”)
  • Ép loại trừ: “no pop”, “no trap”, “no synth”

📊 7. “Beat”, “Bass”, “Synth” = Keo kết phong cách

  • “beat” xuất hiện mọi nơi từ rap đến country
  • “bass” nối trap, funk, electro, thậm chí piano
  • “synth” len vào folk và jazz ở mức thấp
    → Chúng là mix-style mặc định nếu không bị ghi đè

🔄 8. Vòng lặp phong cách tạo bias phản hồi

  • Người dùng nghe rap kiểu trap → tag rap như vậy → vòng lặp → co-occurrence rap↔trap càng mạnh
  • Để thoát vòng lặp, hãy prompt với cặp tag không tương thích hoặc rất cụ thể

🧠 9. “Experimental” ≠ Ngẫu nhiên

  • Tag experimental liên kết chặt với rock, electro, funk
  • Nên experimental sẽ thiên về art-rock hoặc glitch-funk, không phải noise music thực sự

📉 10. Tag yếu bị bỏ qua

  • Tags như opera, math rock, grunge, swing ít xuất hiện → kết quả không nhất quán
  • “grunge” + “metal” → an toàn
  • “grunge” đơn → có thể bị hiểu sai nếu không làm rõ

🧬 Tóm tắt:
Mô hình phong cách của Suno là:

  • Lưới phong cách xác suất
  • Pop & beat là trọng tâm
  • Xây dựng trên “gravity wells” phong cách
  • Ưu tiên co-occurrence chồng chéo
  • Bạn có thể điều khiển bằng cách loại trừ tag, stack đối lập, và ghép tag hiếm

Nếu bạn giống tôi, đau đầu khi tính toán trọng số các thứ muốn và không muốn, tôi đã tạo GPT giúp biến prompt phong cách thành prompt tối ưu, tận dụng latent space để tối đa hóa output.

Link GPT: https://chatgpt.com/g/g-68941070824c8191a886cb72116f1999-suno-style-auralith


Ví dụ prompt “Suno god” tối ưu

Prompt mẫu:

Genre: "emo rock ballad"
Exclude: "pop, trap, beat, synth"
Instrumentation: "acoustic guitar, live drums, raw male vocals"
Tags: "1990s, lo-fi, dramatic, slow, melancholic"

10 ví dụ prompt tối ưu:

  1. Lo-Fi Gospel Griefwave
  • Genre: “gospel soul lament”
  • Exclude: “pop, upbeat, beat, rap”
  • Instrumentation: “wurlitzer keys, distant choir, vinyl crackle, muted trumpet”
  • Tags: “melancholic, lo-fi, ambient, slow, heartfelt, analog”
  1. Emo Doom Ballad (No Synth Allowed)
  • Genre: “emo acoustic dirge”
  • Exclude: “pop, synth, trap, electronic”
  • Instrumentation: “fingerpicked guitar, tape-warped piano, dry male vocals”
  • Tags: “sad, slow, ballad, emotional, 90s, raw”
  1. Space Western Noirwave
  • Genre: “ambient psychedelic folk”
  • Exclude: “pop, beat, bass, synthwave”
  • Instrumentation: “slide guitar, bowed violin, sparse reverb vocals, modular textures”
  • Tags: “dreamy, cinematic, atmospheric, slow, experimental, desert”
  1. Industrial Rap Funeral March
  • Genre: “industrial rap requiem”
  • Exclude: “pop, trap, melodic, funk”
  • Instrumentation: “distorted 808s, metallic hits, monotone vocals, feedback drone”
  • Tags: “dark, aggressive, intense, experimental, mechanical, glitch”
  1. Baroque Trip-Hop Confessional
  • Genre: “orchestral trip-hop ballad”
  • Exclude: “trap, pop, upbeat, dance”
  • Instrumentation: “harpsichord, cello, breathy female vocals, breakbeat drums”
  • Tags: “emotional, ethereal, slow, cinematic, sad, dramatic”
  1. Alien Swingcore Ritual
  • Genre: “swing-jazz electronic fusion”
  • Exclude: “pop, trap, rap, bass”
  • Instrumentation: “upright bass, brushed drums, glitch trumpet, vocoder vocals”
  • Tags: “swing, jazz, experimental, chill, smooth, futuristic”
  1. Apocalyptic Blues Waltz
  • Genre: “blues rock ballad”
  • Exclude: “pop, upbeat, dance, electronic”
  • Instrumentation: “slide guitar, moaning harmonica, 3/4 time drums, raw male vocals”
  • Tags: “slow, melancholic, emotional, dramatic, cinematic, dusty”
  1. Gothic Math Rock Opera
  • Genre: “math rock theatrical metal”
  • Exclude: “pop, synth, upbeat, lo-fi”
  • Instrumentation: “disjointed guitars, choir swells, polymeter drums, operatic vocals”
  • Tags: “epic, intense, progressive, dark, theatrical, powerful”
  1. Anti-Funk Vapor Trap
  • Genre: “vaporwave trap fusion”
  • Exclude: “pop, upbeat, rap, catchy”
  • Instrumentation: “washed-out synths, chopped samples, deep sub bass, echo vocals”
  • Tags: “psychedelic, dreamy, lo-fi, ambient, experimental, slow”
  1. Ethereal Noise-Pop Dirge
  • Genre: “dream pop meets post-industrial noise”
  • Exclude: “trap, bass, funk, dance”
  • Instrumentation: “shoegaze guitars, droning pads, distorted vocals, reverb drums”
  • Tags: “ethereal, melancholic, ambient, experimental, sad, cinematic”
spot_imgspot_imgspot_img